WINSERV | Por que não usar IA diretamente?

Introdução

Empresas brasileiras que adotam IA sem governança expõem-se a riscos reais e mensuráveis: multas da LGPD, exposição de dados confidenciais em APIs públicas, e impossibilidade de responder a auditorias regulatórias (Bacen, ANPD, CVM). O Winserv AI Portal foi projetado para eliminar esses riscos sem sacrificar a potência dos modelos de IA modernos. Diferente de plataformas que usam RAG (Retrieval-Augmented Generation) — eficiente para reduzir custos de token mas que sacrifica o contexto integral entre seções do documento — o portal envia o documento íntegro diretamente ao Google Gemini via In-Context Learning na janela de 1 milhão de tokens. Isso significa que um PDF de 200 páginas é processado por inteiro, preservando tabelas, hierarquia e relações entre seções. Sem chunking, sem embeddings, sem complexidade. O trade-off de maior consumo de tokens é mitigado por 5 camadas de cache que reduzem o custo real em até 98%. Além disso, o portal conta com Content Safety Gate — uma camada de classificação que analisa cada pergunta e cada resposta antes de entregá-la ao usuário, bloqueando conteúdos inadequados sem depender de filtros externos. E o Fact-Check afirmação por afirmação — sem equivalente integrado nos concorrentes hoje — extrai cada alegação individual da resposta e a verifica contra fontes web, atribuindo veredito (Precisa, Imprecisa, Contestada, etc.). Para um departamento jurídico, isso significa que nenhum parecer gerado por IA vai para um processo sem verificação.

🔐

Dados isolados por cliente

Todo o histórico de conversas, documentos e configurações reside no PostgreSQL isolado da VM do cliente (single-tenant). A Winserv provisiona a infraestrutura, mas cada cliente tem seu banco dedicado — sem compartilhamento.

🔑

Google API Keys do cliente

O cliente cria e é titular das próprias chaves do Google Cloud. A Winserv configura as chaves no deploy (via SSH/env) e não intermedeia nem revende tokens. O faturamento Google é 100% direto com o cliente.

🛡️

Single-tenant por natureza

Cada cliente recebe sua própria VM e seu próprio banco. Não há compartilhamento de infraestrutura. Isso é compliance-ready para setores regulados.

🔒 Privacidade por contrato (Zero Training): A API do Google utilizada pelo portal proíbe contratualmente o uso dos dados do cliente para treinar modelos públicos. Contratos, pareceres e planilhas confidenciais não viram dado de treinamento do Gemini de ninguém. Interfaces consumer (Gemini.com, ChatGPT gratuito) não têm essa garantia — a API tem.

📜 Compliance à frente da lei: O PL 2338/2023 — marco regulatório da IA no Brasil, já aprovado no Senado e em discussão na Câmara dos Deputados — estabelecerá exigências de auditabilidade, transparência e supervisão humana para sistemas de IA de alto risco. O Winserv AI Portal já entrega todos esses requisitos como arquitetura de fábrica — não como adaptação futura. Audit Trail imutável, Fact-Check afirmação por afirmação, Safety Gate e RBAC 4 níveis são a resposta pronta para o que a lei vai exigir.

A pergunta que todo gestor de TI faz

"Se o portal usa Google Gemini por dentro, por que não damos acesso direto ao Gemini (ou ChatGPT, ou Claude) para os funcionários e economizamos o custo do portal?"

A resposta curta: acesso direto à IA resolve produtividade individual. O portal resolve governança corporativa. São problemas diferentes. E quando a empresa tem 50, 100 ou 500 funcionários usando IA, a ausência de governança vira risco jurídico, financeiro e regulatório.

1. O que acontece quando você dá acesso direto à IA

Risco	Acesso Direto	Winserv AI Portal
Shadow AI — ninguém sabe o que está sendo perguntado nem respondido	❌ Invisível para o TI	✅ Toda interação registrada em audit trail JSONB imutável
Vazamento de dados — funcionário cola contrato, planilha, documento confidencial	❌ Dados enviados para nuvem do provedor sem controle	✅ Dados no banco isolado do cliente (single-tenant), API Keys próprias
Custo imprevisível — conta de API no fim do mês	❌ Surpresa no billing do Google/OpenAI	✅ Daily cost limit por usuário + dashboard FinOps com projeções
Alucinações sem verificação — IA inventa dado, funcionário usa	❌ Sem mecanismo de checagem	✅ Fact-Check afirmação por afirmação
Acesso descontrolado — estagiário usa o mesmo tier que o diretor	❌ Mesmo modelo para todos	✅ RBAC 4 níveis + feature flags por grupo/usuário
LGPD / Compliance — auditoria regulatória (Bacen, ANPD) chega	❌ Sem trilha de auditoria	✅ Histórico completo, exportável, agrupado por conversa
Seats de ex-funcionários — desligamento não cancela acesso automaticamente	❌ Acesso persiste até alguém lembrar de cancelar	✅ Desativação imediata pelo admin + auto-cleanup por inatividade + anonimização LGPD
Treinamento com dados da empresa — IA aprende com contratos, planilhas e pareceres enviados	❌ Interfaces consumer não têm garantia contratual — dados podem ser usados para treinar modelos públicos	✅ Gemini API proíbe contratualmente o uso dos dados do cliente para treinar modelos. Zero Training por design.

2. Por que Gemini é o motor certo (e o portal potencializa isso)

2.1 Web Grounding nativo — busca em tempo real

O Gemini tem integração nativa com Google Search. A IA busca informações atualizadas na internet no momento da pergunta, reduzindo alucinações. Busca web integrada deixou de ser diferencial: os principais assistentes corporativos oferecem alguma forma dela. O que varia é a governança em volta.

No portal: o grounding é integrado com cota gratuita de 5.000 consultas/mês via AI Studio; acima disso, $14,00 por 1.000 consultas (fatura Google). O portal protege o cliente contra overage por design: o admin desativa o Web Search por grupo ou usuário via feature_config — equipes que não precisam de busca em tempo real não consomem a cota. A vantagem do portal não é o motor de busca — é a camada de governança sobre ele: RBAC por escopo, Fact-Check, Audit Trail.

2.2 Visão computacional e OCR superiores

Para processamento de PDFs pesados, tabelas complexas e imagens, a capacidade de visão do Gemini é nativa — a mesma API que responde o chat lê o documento, sem etapa de OCR externa.

No portal: usamos In-Context Learning — o documento inteiro cabe na janela de 1M tokens do Gemini 3.5 Flash, sem precisar de RAG, chunking ou vector stores. O conteúdo completo fica auditável.

2.3 Multimodalidade unificada

O portal processa PDF, DOCX, XLSX, PPTX, imagens, áudio e ZIP. O Gemini faz tudo isso em uma única API — menos componentes na arquitetura, menos pontos de falha, uma só fatura para conciliar.

2.4 Stack aberta vs integrada — o debate real

Montar a própria stack — uma API de busca independente combinada com o LLM de sua escolha — dá controle fino sobre busca e geração, e para um desenvolvedor solo ou uma startup costuma ser a melhor escolha. Não competimos com isso.

Para uma empresa com 50+ funcionários usando IA, porém, a pergunta muda. O que uma stack montada em casa não traz pronto é exatamente o que o portal entrega: quem perguntou o quê, quanto custou, se a resposta era verdadeira, e se está tudo documentado para o auditor. Nada disso é difícil de construir isoladamente; o custo está em construir, integrar e manter os quatro ao mesmo tempo, sob LGPD.

3. E as outras plataformas? Por que não Open WebUI, Dify ou Copilot?

O gestor de TI mais informado vai além da pergunta "por que não usar a API direta" e questiona: "já existem plataformas prontas que fazem isso — por que o portal de vocês?"

3.1 O que exigir de qualquer plataforma de IA corporativa

Controle granular de acesso: o portal permite que o gestor atribua modelos, funcionalidades e limites de custo por usuário ou grupo. Ex: o time jurídico usa Gemini Pro com Fact-Check automático e teto de $10/dia, enquanto estagiários usam apenas Flash Standard com 50 consultas/dia. As feature flags são hierárquicas: global → grupo → usuário, com herança em cascata.

Política deste documento: afirmamos apenas o que o portal faz e o que podemos demonstrar numa call de 20 minutos. Não afirmamos o que produto de terceiro deixa de fazer. As plataformas concorrentes mudam de capacidade a cada poucas semanas, e uma comparação errada a nosso favor é exatamente o tipo de alegação não-verificada que este produto existe para combater. Onde a comparação importa, damos ao comprador as perguntas a fazer — não as respostas que gostaríamos que fossem verdade.

Leve estas perguntas para todo fornecedor da sua lista, inclusive nós.

Pergunta ao fornecedor	Resposta do portal	Onde verificar
A IA verifica, afirmação por afirmação, se a própria resposta é verdadeira?	Sim — Fact-Check extrai cada alegação e confronta com fontes web	Demo ao vivo
O log de auditoria guarda o conteúdo das mensagens, ou só metadados?	Conteúdo completo, em JSONB imutável	Export do audit trail
Meus dados ficam num banco isolado, ou compartilhado com outros clientes?	PostgreSQL dedicado por cliente	Credenciais entregues ao cliente
Quem é o titular da conta e das API keys do provedor de IA?	O cliente. A Winserv opera; a conta é dele	Console Google Cloud do cliente
Consigo definir modelo, funcionalidades e teto de custo por grupo e por usuário?	Sim — feature flags com herança global → grupo → usuário	Admin Panel
Quantos níveis de permissão existem?	4 — global_admin, llm_manager, auditor, user	Admin Panel
Toda alteração de configuração fica registrada com autor e data?	Sim — system settings audit	Export CSV
A interface carrega algum recurso de CDN externo?	Não. Zero CDN — air-gap ready	Aba Network do navegador
Existe anonimização LGPD e expurgo automático de usuários inativos?	Sim, automático e manual	Admin Panel
Onde os dados são processados, e o provedor treina modelos com eles?	Conta Google Cloud do cliente; paid tier da Gemini API, que contratualmente não treina sobre o conteúdo	Termos da Gemini API

3.2 Como o portal se posiciona

O mercado tem três famílias de solução, e cada uma resolve um problema diferente do nosso.

Assistentes corporativos de prateleira

ChatGPT Enterprise, Microsoft Copilot, Claude Enterprise, Perplexity Enterprise. Entregam o melhor modelo e a melhor experiência de uso, com esforço de implantação próximo de zero. São excelentes em produtividade individual. Antes de escolher, faça a eles as perguntas da seção 3.1 — especialmente isolamento de dados, titularidade da conta e conteúdo no audit trail.

Plataformas open source auto-hospedadas

Open WebUI, Dify. Dão soberania total e custo de licença zero. Em troca, a camada de governança — RBAC fino, trilha de auditoria com conteúdo, verificação factual, FinOps, ciclo de vida de usuário — fica por conta de quem instala, junto com a operação de embeddings e vector stores quando há RAG. É a escolha certa para quem tem time de plataforma dedicado.

Winserv AI Portal

Ocupa o meio: soberania de dados como a das open source, operação gerenciada como a das de prateleira. O cliente é titular do próprio banco e da própria conta Google Cloud; a Winserv opera modelos, limites e precificação como serviço. Não somos a melhor escolha para quem quer o modelo mais potente do mercado a qualquer custo, nem para quem quer montar tudo em casa.

3.3 Os três pilares do produto

Fact-Check afirmação por afirmação: o portal extrai cada afirmação individual de uma resposta e verifica contra fontes web, devolvendo veredito e justificativa por alegação. Não é citação de fonte — é auditoria da alegação.

Audit Trail JSONB com conteúdo completo: cada interação é registrada com as mensagens íntegras, custo, latência e modelo. Muitas plataformas registram metadados de API; a pergunta a fazer é se o conteúdo da conversa é recuperável numa auditoria.

Single-tenant + cliente soberano: cada empresa tem seu banco PostgreSQL isolado, é titular da própria conta Google Cloud e controla identidade visual, usuários e feature flags. Modelos, limites e precificação são gerenciados pela Winserv como serviço — qualidade e custo garantidos sem configuração manual pelo cliente.

4. Conformidade com o PL 2338/2023 — Marco Legal da IA no Brasil

O PL 2338/2023, já aprovado no Senado e em discussão na Câmara dos Deputados, estabelece exigências de transparência, supervisão humana e auditabilidade para sistemas de IA de alto risco — incluindo saúde, avaliação de crédito, recrutamento, segurança pública e identificação biométrica. O projeto segue a abordagem baseada em risco do AI Act europeu.

Abaixo, como o portal atende cada pilar hoje — não como promessa futura:

4.1 Pilar 1 — Transparência e Explicabilidade

Exigência do PL 2338	Como o Winserv AI Portal atende
Direito à informação clara: pessoas devem saber quando interagem com IA	Sistema prompt: "sou o assistente do portal" — nunca finge ser humano
Explicação dos critérios e lógica: fornecer dados e raciocínio usados na decisão	Fact-Check afirmação por afirmação — extrai cada alegação, verifica contra fontes web, atribui veredito com justificativa
Permitir contestação: usuário pode questionar e corrigir decisões algorítmicas	Botão "Verificar" audita cada resposta. Botão "Regenerar" corrige

4.2 Pilar 2 — Supervisão Humana

Exigência do PL 2338	Como o Winserv AI Portal atende
Supervisão humana efetiva: sistemas de alto risco devem permitir acompanhamento constante	RBAC 4 níveis — global_admin, llm_manager, auditor, user. Gestor define quem supervisiona o quê
Revisão de decisões automatizadas: direito de solicitar intervenção humana em decisões significativas	Fact-Check on-demand — cada resposta pode ser auditada com 1 clique. Modo auto_head para verificação automática de todas as respostas
Prevenir operação 100% autônoma: IA não pode decidir sozinha quando há impacto em direitos fundamentais	Safety Gate classifica cada pergunta e cada resposta ANTES de entregar ao usuário. Bloqueia conteúdos inadequados

4.3 Pilar 3 — Auditabilidade e Governança

Exigência do PL 2338	Como o Winserv AI Portal atende
Avaliação de Impacto Algorítmico (AIA): documentar riscos e mitigação antes de ativar o sistema	System settings audit — toda alteração de modelo, prompt, limite é registrada com quem alterou e quando
Registros (logs) para rastreabilidade: capacidade técnica de registrar eventos para auditoria de falhas	Audit trail JSONB imutável — mensagens completas, tokens, custo, latência, modelo. Exportável, agrupado por conversa
Testes para vieses discriminatórios: identificar e corrigir preconceitos de raça, gênero, etc.	Safety Gate classifica input e output. Fact-Check detecta viés factual por verificação contra fontes
Documentação de mitigação: comprovar medidas adotadas para reduzir riscos	Single-tenant (dados isolados). Zero CDN externo (soberania). Cliente dono das API Keys (sem intermediação)

🏛️ Compliance de fábrica — não adaptação futura: o PL 2338 ainda não foi sancionado, e nenhum fornecedor pode hoje se declarar "certificado" por ele. O que se pode comparar é arquitetura. Uma plataforma que já nasce com trilha de auditoria de conteúdo, supervisão humana por RBAC e isolamento de dados tende a precisar de menos reengenharia quando a lei entrar em vigor. O portal entrega os requisitos acima como arquitetura de fábrica — já está em produção. Avalie os demais fornecedores pelos mesmos critérios.

5. O que o portal entrega

Cada item abaixo é demonstrável numa call e verificável no ambiente do cliente depois da implantação. Onde um fornecedor concorrente entregar o mesmo, ótimo — a lista serve como critério de compra, não como alegação sobre terceiros.

Diferencial	Winserv Portal	Como conferir
Fact-Check afirmação por afirmação	Integrado	Clique em "Verificar" numa resposta qualquer
Audit trail com conteúdo completo	JSONB imutável	Export do audit trail
RBAC 4 níveis com feature flags	Sim	Admin Panel
Single-tenant (banco isolado)	Sim	Credenciais do PostgreSQL dedicado
Cliente soberano (dados, conta Google, branding)	Sim	Console Google Cloud em nome do cliente
Grounding incluso	Sim, via Google Search	Resposta com fontes citadas
Zero CDN externo (air-gap ready)	Sim	Aba Network do navegador
Custo previsível com daily limit	Sim	Admin Panel → limites
Ciclo de vida de usuários (auto-cleanup + anonimização LGPD)	Sim	Admin Panel
Suporte em português	Nativo	Contrato

💡 Nota sobre pricing de API: Os preços na tabela acima referem-se ao modelo em produção: Gemini 3.5 Flash (Standard e Advanced). O FinOps dashboard reflete o custo real automaticamente — o cliente sempre sabe exatamente quanto está gastando.

💰 Token Economy: O portal implementa 5 camadas de cache que reduzem o consumo de tokens na API do Google — economia direta na fatura do cliente, sem intermediação da Winserv. Cada cache opera em um nível diferente da stack:

Cache	Duração	Economia
Context Cache (Gemini API)	4-8h	~75% nos tokens de entrada de documentos repetidos
Response Cache (documento + prompt)	30min	100% — resposta instantânea, zero tokens
Extraction Cache (arquivo + query)	30min	100% — não re-extrai o mesmo arquivo
Safety Gate Cache (SHA-256)	24h	100% — não re-classifica mesmo conteúdo
TTS Cache (áudio)	7 dias	100% — não re-sintetiza mesma frase

Exemplo real: um contrato de 100K tokens consultado 20× ao dia por um advogado custaria US$ 2.50/dia sem cache. Com Context Cache + Response Cache, o mesmo uso custa menos de US$ 0.03/dia — uma redução de 98%.

6. Resumo para o gestor

Usar Gemini/ChatGPT/Claude direto resolve o problema de 1 funcionário. Funciona para experimentação. Mas quando a empresa coloca IA nas mãos de 50+ pessoas, o que importa não é só a qualidade da resposta — é quem perguntou o quê, quanto custou, se a resposta era verdadeira, e se está tudo documentado para o dia em que o auditor ou o DPO bater na porta.

O Winserv AI Portal não compete com o Gemini — ele opera sobre o Gemini como camada de governança. É a diferença entre usar um carro sem freios e ter um painel de controle completo.

✅ Com o portal, o cliente ganha:

Documentos processados íntegros no Gemini — sem RAG, sem chunking
Compliance regulatório (LGPD, normas setoriais)
Previsibilidade de custo (daily limit por usuário)
Rastreabilidade total (quem, o quê, quando, quanto custou)
Dados em PostgreSQL isolado na VM do cliente
API Keys próprias — sem intermediação de tokens
Token Economy — 5 camadas de cache que reduzem até 98% do custo com tokens em uso repetido
Ciclo de vida de usuários — desativação imediata, cleanup automático por inatividade, anonimização LGPD em um clique

❌ Sem o portal, o cliente assume:

Risco de exposição de dados corporativos em APIs públicas
Impossibilidade de auditar uso de IA
Custo imprevisível e crescente
Zero controle sobre quem acessa o quê

7. Arquitetura

🌐 Internet
HTTPS :443

▼

🔒 Caddy
TLS · Let's Encrypt

▼

⚡ FastAPI :4001
winserv-llm-proxy

🗂️ StaticFiles: frontend/ (HTML+JS+CSS) 🔐 Middleware: CSP · HSTS · Rate Limit · BodyGuard 📋 Routers: Chat · Auth · Audio · Extract · Admin · Fact-Check 🛡️ RBAC 4-tier · Safety Gate · Audit Trail · FinOps

▼

🧠 Google Gemini
AI Studio API Key

🎤 Google STT/TTS
Cloud API Key

▼

🗄️ PostgreSQL 16
Schema ai_portal

LOGGED: users · roles · groups · conversations · request_telemetry · system_settings UNLOGGED: rate_limit · tts_cache · extract_cache · context_caches · safety_cache

🧩 Stack completa: O portal é um monorepo com backend FastAPI (winserv-llm-proxy/) e frontend vanilla JS (frontend/). O backend serve a API, o frontend estático e o painel admin. Tudo roda em 3 containers Docker: PostgreSQL (banco isolado), Portal (FastAPI+frontend) e Caddy (TLS automático via Let's Encrypt). Zero Redis, zero fila, zero CDN externo, zero Microsoft Graph. Superfície mínima para segurança máxima.

8. Glossário — Termos de IA e Infraestrutura

Para gestores, auditores e parceiros que precisam dominar o vocabulário da área. Organizado do conceito mais fundamental ao mais específico do portal.

Conceitos fundamentais de IA

Termo	Significado	Por que importa
LLM (Large Language Model)	Modelo de IA treinado em bilhões de textos para entender e gerar linguagem natural. Ex: Gemini, GPT, Claude.	É o "cérebro" por trás de qualquer chat de IA.
Token	Unidade de processamento do modelo. ~1 token = ¾ de uma palavra em português. Modelos cobram por token de entrada (input) e de saída (output).	Determina o custo da API. 1M tokens ≈ 750 mil palavras ≈ um livro de 3.000 páginas.
Context Window (Janela de Contexto)	Quantidade máxima de tokens que o modelo "enxerga" de uma vez. O portal roda em Gemini 3.5 Flash, com janela de 1M tokens.	Define quanto conteúdo cabe numa conversa. 1M tokens = cabem PDFs de 500+ páginas inteiros.
Grounding (Web Search)	Capacidade do modelo de buscar informações atualizadas na internet durante a resposta. O Gemini faz nativamente via Google Search.	Reduz alucinações — o modelo consulta fontes reais em vez de "adivinhar".
Alucinação (Hallucination)	Quando o modelo gera informação convincente mas factualmente incorreta. Ex: inventar um artigo de lei, um valor, uma data.	É o principal risco jurídico do uso de IA. Fact-Check existe para mitigar isso.

Técnicas de processamento de documentos

Termo	Significado	O portal usa?
RAG (Retrieval-Augmented Generation)	Técnica que fatia documentos em pedaços (chunks), armazena em banco vetorial e recupera trechos relevantes durante a pergunta. Usada por Dify, AnythingLLM, Copilot.	❌ Não usa — substituído por ICL. RAG é eficiente em custo de tokens, mas sacrifica contexto integral entre seções do documento e exige manutenção de embeddings. O portal escolheu ICL para preservar contexto profundo — o trade-off de custo é mitigado por 5 camadas de cache.
ICL (In-Context Learning)	Envia o documento íntegro na janela de contexto do modelo, sem fatiar. O modelo lê o documento inteiro a cada conversa.	✅ Sim — viável graças à janela de 1M tokens do Gemini 3.5 Flash.
Chunking	Processo de dividir um documento em pedaços menores (chunks) para indexação. Ex: quebrar um PDF de 100 páginas em 500 pedaços de 200 tokens cada.	❌ Não usa — desnecessário com ICL.
Embedding	Representação numérica (vetor) do significado de um texto. Usado para busca semântica — encontrar trechos "parecidos" com a pergunta.	❌ Não usa — não há busca vetorial no portal.
Vector Store	Banco de dados especializado em armazenar e buscar embeddings. Ex: pgvector, Pinecone, ChromaDB.	❌ Não usa — o portal usa apenas PostgreSQL tradicional.

Arquitetura e Infraestrutura

Termo	Significado	No portal
Single-tenant	Cada cliente tem seu próprio banco de dados e infraestrutura isolada. Oposto de multi-tenant (todos compartilham).	Cada cliente recebe VM + PostgreSQL dedicados.
JSONB	Formato binário de JSON no PostgreSQL. Permite armazenar documentos estruturados com consultas indexadas.	Usado no audit trail — cada mensagem completa é armazenada em JSONB.
RBAC (Role-Based Access Control)	Controle de acesso baseado em papéis. Cada usuário recebe um nível (ex: user, auditor, admin) que define o que pode fazer.	4 níveis: user → auditor → llm_manager → global_admin.
SSE (Server-Sent Events)	Protocolo que permite ao servidor enviar dados ao navegador em tempo real. Usado para streaming de texto (resposta aparece palavra por palavra).	Chat streaming usa SSE — tokens chegam em tempo real.

Componentes específicos do portal

Termo	Significado	Por que importa
JSONB Imutável	JSONB (Binary JSON) é o formato nativo do PostgreSQL para armazenar documentos estruturados com indexação e consultas rápidas — superior ao JSON texto. No portal, a API expõe apenas INSERT — sem UPDATE nem DELETE. Na infra SaaS Winserv, não existe painel, API ou ferramenta que permita apagar registros — a imutabilidade é arquitetural.	É o que torna o portal auditável de verdade. Numa auditoria real (Bacen, ANPD, CRC), logs que permitem UPDATE via aplicação não têm valor probatório. O portal elimina o fator humano da equação ao não expor nenhum mecanismo de adulteração via API. Ninguém pode ser coagido a apagar evidência porque simplesmente não existe o botão.
Fact-Check	Sistema que extrai cada afirmação individual de uma resposta da IA e verifica contra fontes web. Atribui um dos 5 vereditos: Precisa (confirmada por fontes), Imprecisa (parcialmente correta), Contestada (fontes divergem), Não Verificável (sem fontes disponíveis), Enganosa (fontes contradizem).	Sem equivalente integrado nos concorrentes hoje. Elimina o risco de um advogado protocolar uma petição com jurisprudência inventada pela IA, ou um contador enviar um parecer com artigo de lei que não existe. O veredito vem com fontes — o auditor humano decide.
Safety Gate	Camada de classificação que analisa pergunta e resposta em 10 categorias de segurança (discurso de ódio, violência, conteúdo sexual, automutilação, etc.) antes da entrega ao usuário. Usa modelo Gemini Flash-Lite com cache SHA-256 (24h TTL). Política fail-open: se o classificador falhar, o conteúdo passa — segurança não pode bloquear produtividade.	Diferente de filtros de API que simplesmente rejeitam, o Safety Gate classifica e registra. O gestor audita depois quais conteúdos foram bloqueados e por quê. Transparência total sobre o que a IA está entregando.
Audit Trail	Registro completo e imutável de cada interação: quem perguntou (user_id), o quê (messages_json completo), qual modelo respondeu, quantos tokens (input + output), quanto custou (USD com 6 casas decimais), qual latência (ms), e se usou web search. Tudo armazenado em JSONB imutável, exportável em CSV agrupado por conversa.	Quando o auditor do Bacen bater na porta perguntando "onde está o histórico de uso de IA desta equipe?", a resposta é um clique: exportar CSV. Sem audit trail, a resposta é "não temos como saber" — e isso custa a licença de funcionamento.
FinOps	Dashboard de operações financeiras integrado ao portal. Mostra custo por modelo, por usuário, por dia. Projeções mensais com base no uso atual. Comparativo entre tiers (Standard vs Advanced). Permite configurar daily cost limit por usuário ou grupo — a IA bloqueia novas requisições quando o teto diário é atingido.	O gestor financeiro não precisa acessar o billing do Google Cloud para saber quanto a IA está custando. Tudo visível no painel admin. Isso evita a "surpresa da fatura" e permite orçamento previsível.
Token Economy	Conjunto de 5 caches independentes que reduzem o consumo de tokens: Context Cache (Gemini API, 4-8h, ~75% economia), Response Cache (documento+prompt, 30min, 100%), Extraction Cache (arquivo, 30min, 100%), Safety Gate Cache (SHA-256, 24h, 100%), TTS Cache (áudio, 7 dias, 100%).	Exclusivo do portal. Exemplo real: um contrato de 100K tokens consultado 20× ao dia custaria US$ 2.50/dia sem cache. Com Context Cache + Response Cache, o mesmo uso custa menos de US$ 0.03/dia — redução de 98%. Isso impacta direto o orçamento de TI.
OIDC (OpenID Connect)	Protocolo de autenticação baseado em OAuth 2.0. O portal usa OIDC puro multi-provider (Microsoft Entra ID, Google Workspaces). Conta de recuperação administrativa local (`winserv`, PBKDF2-SHA256) para emergências. Escopos mínimos (openid, profile, email), sem tokens Microsoft Graph. Validação com JWKS, nonce anti-replay, cookie assinado HMAC-SHA256.	Princípio do menor privilégio: o portal sabe quem é o usuário, não o que ele tem no Microsoft 365. Se o PostgreSQL for comprometido, o invasor não consegue escalar para o tenant Microsoft do cliente. Defesa em profundidade.
STT (Speech-to-Text)	Transcrição de áudio em texto via Google Cloud Speech-to-Text com modelo latest_short otimizado para comandos de voz curtos em pt-BR. VAD (Voice Activity Detection) nativo no navegador detecta silêncio de 1.5s e encerra a gravação automaticamente.	Motor acústico — zero alucinação na transcrição. Diferente de LLMs que "escutam" e podem interpretar errado, o STT é processamento de sinal determinístico. O áudio original é preservado no banco para auditoria — acessível via painel admin.
TTS (Text-to-Speech)	Síntese de voz via Google Cloud TTS Neural2 com voz pt-BR-Neural2-B. Áudio gerado sob demanda, cache de 7 dias, truncado a 5000 caracteres por payload.	Voz natural em português brasileiro. Com cache de 7 dias, frases repetidas (ex: "Como posso ajudar?") não geram custo adicional de API.
Entra ID	Plataforma de identidade da Microsoft (antigo Azure AD). Usado para login corporativo no portal. Google Workspaces também disponível como IdP alternativo. Conta de recuperação local `winserv` para emergências administrativas (V10).	Single Sign-On corporativo — o usuário não cria mais uma senha. O admin do Entra ID controla quem acessa. Em caso de desligamento, o acesso ao portal cessa automaticamente.
Licenciamento / Ciclo de Vida	Módulo de gestão do ciclo de vida de usuários. Controla limites de uso (hard-limit por plano), desativação manual pelo admin, auto-cleanup por inatividade (N dias configurável) e anonimização LGPD. O admin gerencia tudo na aba Licenciamento do painel.	Resolve o problema de "ghost seats" — ex-funcionários com acesso ativo — e simplifica compliance de offboarding sem chamados de TI. O painel avisa quando o tier está próximo do limite e sugere upgrade automático.
Anonimização LGPD	Processo que substitui nome, e-mail e identificador IdP de um usuário por dados neutros (`anon-<hash>`), mantendo o histórico técnico intacto. Irreversível. Disponível na aba Licenciamento para admins globais.	Permite responder ao direito de esquecimento (Art. 18 LGPD) sem destruir trilhas de auditoria exigidas por normas setoriais. O auditor conserva o histórico completo — sem PII identificável.

Interessado?

Fale com a equipe Winserv para agendar uma demonstração do portal.

Falar com a Winserv