Documento Técnico

Por que não usar IA diretamente?

Governança, compliance regulatório e controle de custo — o caso para o Winserv AI Portal

Documento vivo: Preços, funcionalidades e comparativos refletem as informações disponíveis em Maio 2026. Todos os valores estão sujeitos a alterações pelos respectivos fornecedores a qualquer momento. Consulte a documentação oficial de cada vendor antes de tomar decisões baseadas neste documento.

Introdução

Empresas brasileiras que adotam IA sem governança expõem-se a riscos reais e mensuráveis: multas da LGPD, exposição de dados confidenciais em APIs públicas, e impossibilidade de responder a auditorias regulatórias (Bacen, ANPD, CVM). O Winserv AI Portal foi projetado para eliminar esses riscos sem sacrificar a potência dos modelos de IA modernos. Diferente de plataformas que usam RAG (Retrieval-Augmented Generation) — eficiente para reduzir custos de token mas que sacrifica o contexto integral entre seções do documento — o portal envia o documento íntegro diretamente ao Google Gemini via In-Context Learning na janela de 1 milhão de tokens. Isso significa que um PDF de 200 páginas é processado por inteiro, preservando tabelas, hierarquia e relações entre seções. Sem chunking, sem embeddings, sem complexidade. O trade-off de maior consumo de tokens é mitigado por 5 camadas de cache que reduzem o custo real em até 98%. Além disso, o portal conta com Content Safety Gate — uma camada de classificação que analisa cada pergunta e cada resposta antes de entregá-la ao usuário, bloqueando conteúdos inadequados sem depender de filtros externos. E o Fact-Check afirmação por afirmação — sem equivalente integrado nos concorrentes hoje — extrai cada alegação individual da resposta e a verifica contra fontes web, atribuindo veredito (Precisa, Imprecisa, Contestada, etc.). Para um departamento jurídico, isso significa que nenhum parecer gerado por IA vai para um processo sem verificação.

🔐
Dados isolados por cliente

Todo o histórico de conversas, documentos e configurações reside no PostgreSQL isolado da VM do cliente (single-tenant). A Winserv provisiona a infraestrutura, mas cada cliente tem seu banco dedicado — sem compartilhamento.

🔑
Google API Keys do cliente

O cliente cria e é titular das próprias chaves do Google Cloud. A Winserv configura as chaves no deploy (via SSH/env) e não intermedeia nem revende tokens. O faturamento Google é 100% direto com o cliente.

🛡️
Single-tenant por natureza

Cada cliente recebe sua própria VM e seu próprio banco. Não há compartilhamento de infraestrutura. Isso é compliance-ready para setores regulados.

🔒 Privacidade por contrato (Zero Training): A API do Google utilizada pelo portal proíbe contratualmente o uso dos dados do cliente para treinar modelos públicos. Contratos, pareceres e planilhas confidenciais não viram dado de treinamento do Gemini de ninguém. Interfaces consumer (Gemini.com, ChatGPT gratuito) não têm essa garantia — a API tem.
📜 Compliance à frente da lei: O PL 2338/2023 — marco regulatório da IA no Brasil, já aprovado no Senado e em discussão na Câmara dos Deputados — estabelecerá exigências de auditabilidade, transparência e supervisão humana para sistemas de IA de alto risco. O Winserv AI Portal já entrega todos esses requisitos como arquitetura de fábrica — não como adaptação futura. Audit Trail imutável, Fact-Check afirmação por afirmação, Safety Gate e RBAC 4 níveis são a resposta pronta para o que a lei vai exigir.

A pergunta que todo gestor de TI faz

"Se o portal usa Google Gemini por dentro, por que não damos acesso direto ao Gemini (ou ChatGPT, ou Claude) para os funcionários e economizamos o custo do portal?"

A resposta curta: acesso direto à IA resolve produtividade individual. O portal resolve governança corporativa. São problemas diferentes. E quando a empresa tem 50, 100 ou 500 funcionários usando IA, a ausência de governança vira risco jurídico, financeiro e regulatório.

1. O que acontece quando você dá acesso direto à IA

Risco Acesso Direto Winserv AI Portal
Shadow AI — ninguém sabe o que está sendo perguntado nem respondido Invisível para o TI Toda interação registrada em audit trail JSONB imutável
Vazamento de dados — funcionário cola contrato, planilha, documento confidencial Dados enviados para nuvem do provedor sem controle Dados no banco isolado do cliente (single-tenant), API Keys próprias
Custo imprevisível — conta de API no fim do mês Surpresa no billing do Google/OpenAI Daily cost limit por usuário + dashboard FinOps com projeções
Alucinações sem verificação — IA inventa dado, funcionário usa Sem mecanismo de checagem Fact-Check afirmação por afirmação
Acesso descontrolado — estagiário usa o mesmo tier que o diretor Mesmo modelo para todos RBAC 4 níveis + feature flags por grupo/usuário
LGPD / Compliance — auditoria regulatória (Bacen, ANPD) chega Sem trilha de auditoria Histórico completo, exportável, agrupado por conversa
Seats de ex-funcionários — desligamento não cancela acesso automaticamente Acesso persiste até alguém lembrar de cancelar Desativação imediata pelo admin + auto-cleanup por inatividade + anonimização LGPD
Treinamento com dados da empresa — IA aprende com contratos, planilhas e pareceres enviados Interfaces consumer não têm garantia contratual — dados podem ser usados para treinar modelos públicos Gemini API proíbe contratualmente o uso dos dados do cliente para treinar modelos. Zero Training por design.

2. Por que Gemini é o motor certo (e o portal potencializa isso)

2.1 Web Grounding nativo — busca em tempo real

O Gemini tem integração nativa com Google Search. A IA busca informações atualizadas na internet no momento da pergunta, reduzindo drasticamente alucinações. ChatGPT inclui busca web (Bing) em todos os planos pagos desde 2025. Claude tem web search via Brave Search — uma alternativa poderosa e independente de Big Tech. O Brave também oferece API de Contexto para LLM (lançada em fevereiro de 2026) que entrega "Smart Chunks" pré-processados, reduzindo latência e consumo de tokens.

No portal: o grounding é integrado com cota gratuita de 5.000 consultas/mês via AI Studio; acima disso, $14,00 por 1.000 consultas (fatura Google). O portal protege o cliente contra overage por design: o admin desativa o Web Search por grupo ou usuário via feature_config — equipes que não precisam de busca em tempo real não consomem a cota. A vantagem do portal não é o motor de busca — é a camada de governança sobre ele: RBAC por escopo, Fact-Check, Audit Trail.

2.2 Visão computacional e OCR superiores

Para processamento de PDFs pesados, tabelas complexas e imagens, a capacidade de visão do Gemini é nativa e superior. ChatGPT requer múltiplos modelos separados. Claude tem janela de 1M tokens (Enterprise, 2026).

No portal: usamos In-Context Learning — o documento inteiro cabe na janela de 1M tokens do Gemini 3.5 Flash, sem precisar de RAG, chunking ou vector stores. O conteúdo completo fica auditável.

2.3 Multimodalidade unificada

O portal processa PDF, DOCX, XLSX, PPTX, imagens, áudio e ZIP. O Gemini faz tudo isso em uma única API. Para ChatGPT, o processamento de áudio requer Whisper (separado) e a extração de documentos exige parsing adicional — mais componentes, mais pontos de falha.

2.4 Stack aberta vs integrada — o debate real

Em 2026, a combinação Brave Search API + GPT-5/Claude/Qwen é considerada por muitos desenvolvedores a escolha superior para cenários que exigem controle fino sobre busca e geração. A API de Contexto para LLM do Brave (fevereiro de 2026) entrega "Smart Chunks" — texto principal, tabelas e blocos de código extraídos e comprimidos, prontos para o modelo. Latência abaixo de 600ms. Custo fixo de US$ 5/1.000 buscas — mais barato que grounding do Google em escala.

Para um desenvolvedor solo ou uma startup, Brave + GPT é imbatível. Para uma empresa com 50+ funcionários usando IA, o que falta nessa stack é exatamente o que o portal entrega: quem perguntou o quê, quanto custou, se a resposta era verdadeira, e se está tudo documentado para o auditor.

3. E as outras plataformas? Por que não Open WebUI, Dify ou Copilot?

O gestor de TI mais informado vai além da pergunta "por que não usar a API direta" e questiona: "já existem plataformas prontas que fazem isso — por que o portal de vocês?"

3.1 Matriz completa de funcionalidades

Controle granular de acesso: o portal permite que o gestor atribua modelos, funcionalidades e limites de custo por usuário ou grupo. Ex: o time jurídico usa Gemini Pro com Fact-Check automático e teto de $10/dia, enquanto estagiários usam apenas Flash Standard com 50 consultas/dia. Nenhum concorrente oferece feature flags por escopo (global → grupo → usuário) com herança em cascata.
Portal GPT Ent MS Copilot Claude Perplexity OpenWebUI Dify Manus
Chat IA
Web Search ✅ incluso✅ Bing⚠️ Bing⚠️⚠️
Fact-Check ✅ Integrado
Audit Trail ✅ JSONB⚠️ Compliance API⚠️ PP⚠️⚠️
RBAC ✅ 4 níveis❌ 2⚠️⚠️⚠️
Single-tenant
Cliente soberano
Docs (ICL/RAG) ✅ 1M tok⚠️✅ 1M⚠️✅ RAG✅ RAG
STT/TTS ⚠️ API⚠️⚠️
White Label ⚠️⚠️⚠️
FinOps ⚠️ API⚠️ PBI
Zero CDN ⚠️
Suporte pt-BR ⚠️⚠️⚠️⚠️⚠️⚠️ EN
LGPD ⚠️ EUA✅ EU⚠️⚠️⚠️
Ciclo de vida de usuários ✅ auto+manual⚠️ Entra⚠️

3.2 Análise qualitativa por concorrente

ChatGPT Enterprise

Melhor marca, melhor modelo. Mas: dados nos EUA (LGPD frágil), audit trail existe via Compliance API com logs imutáveis append-only — porém em infra multi-tenant (dados não isolados por cliente), sem Fact-Check. Bom para produtividade individual, não resolve governança.

Microsoft Copilot Studio

Integração nativa com M365 e Entra ID. Mas: licenciamento notoriamente complexo, sem Fact-Check, sem audit trail completo. Só faz sentido para empresas 100% Microsoft.

Claude Enterprise

Melhor segurança de modelo (Constitutional AI). Web search via Brave Search. 1M tokens de contexto (2026, Sonnet 4.6+). Mas: sem Fact-Check, sem STT/TTS nativo, sem audit trail de conteúdo completo. Foco em segurança do modelo, não em governança corporativa.

Perplexity Enterprise

Excelente pesquisa web com citações. Tem RBAC, SSO e audit logs no tier Enterprise Pro. Mas: não verifica claims individuais (cita fontes, não audita afirmações), sem single-tenant. É motor de busca com IA, não plataforma de governança.

Open WebUI

Open source, gratuito, multi-modelo, self-hosted. Tem RAG, voice, plugins. Mas: RBAC limitado a admin/user, sem audit trail de conteúdo, sem Fact-Check, suporte depende de comunidade. Cliente teria que construir toda a camada de governança do zero.

Dify

Open source, RAG visual, multi-modelo. Enterprise tem RBAC avançado e audit logging. Mas: sem Fact-Check, complexidade operacional alta (gerenciar embeddings, vector stores).

Manus AI

Agentes autônomos para pesquisa web, análise de documentos e execução de tarefas. Fora do território da China disponível apenas em nuvem.

3.3 O que nenhum deles tem e o portal tem

Fact-Check afirmação por afirmação: o portal extrai cada afirmação individual de uma resposta e verifica contra fontes web. Nenhum concorrente oferece isso — nem ChatGPT, nem Perplexity, nem Open WebUI.
Audit Trail JSONB com conteúdo completo: o portal registra cada interação com mensagens completas, custo, latência e modelo. O ChatGPT Enterprise agora oferece Compliance API com logs imutáveis, mas em infra multi-tenant — os dados do seu cliente não são isolados. Perplexity e Dify têm logs parciais. Claude, Open WebUI e Manus simplesmente não têm.
Single-tenant + cliente soberano: cada empresa tem seu banco PostgreSQL isolado, é titular da própria conta Google Cloud e controla identidade visual, usuários e feature flags. Modelos, limites e precificação são gerenciados pela Winserv como serviço — garantia de qualidade e custo sem configuração manual pelo cliente. ChatGPT, Claude e Copilot são multi-tenant. Open WebUI e Dify exigem que o cliente monte e mantenha a infra.

4. Conformidade com o PL 2338/2023 — Marco Legal da IA no Brasil

O PL 2338/2023, já aprovado no Senado e em discussão na Câmara dos Deputados, estabelece exigências de transparência, supervisão humana e auditabilidade para sistemas de IA de alto risco — incluindo saúde, avaliação de crédito, recrutamento, segurança pública e identificação biométrica. O projeto segue a abordagem baseada em risco do AI Act europeu.

Abaixo, como o portal atende cada pilar hoje — não como promessa futura:

4.1 Pilar 1 — Transparência e Explicabilidade

Exigência do PL 2338 Winserv AI Portal ChatGPT Enterprise
Direito à informação clara: pessoas devem saber quando interagem com IA Sistema prompt: "sou o assistente do portal" — nunca finge ser humano Sem controle do prompt pelo gestor
Explicação dos critérios e lógica: fornecer dados e raciocínio usados na decisão Fact-Check afirmação por afirmação — extrai cada alegação, verifica contra fontes web, atribui veredito com justificativa Sem verificação de claims
Permitir contestação: usuário pode questionar e corrigir decisões algorítmicas Botão "Verificar" audita cada resposta. Botão "Regenerar" corrige Sem mecanismo de auditoria por resposta

4.2 Pilar 2 — Supervisão Humana

Exigência do PL 2338 Winserv AI Portal ChatGPT Enterprise
Supervisão humana efetiva: sistemas de alto risco devem permitir acompanhamento constante RBAC 4 níveis — global_admin, llm_manager, auditor, user. Gestor define quem supervisiona o quê Apenas 2 tiers (admin/user)
Revisão de decisões automatizadas: direito de solicitar intervenção humana em decisões significativas Fact-Check on-demand — cada resposta pode ser auditada com 1 clique. Modo auto_head para verificação automática de todas as respostas Sem verificação de decisões
Prevenir operação 100% autônoma: IA não pode decidir sozinha quando há impacto em direitos fundamentais Safety Gate classifica cada pergunta e cada resposta ANTES de entregar ao usuário. Bloqueia conteúdos inadequados ⚠️ Filtros básicos, sem classificação estruturada

4.3 Pilar 3 — Auditabilidade e Governança

Exigência do PL 2338 Winserv AI Portal ChatGPT Enterprise
Avaliação de Impacto Algorítmico (AIA): documentar riscos e mitigação antes de ativar o sistema System settings audit — toda alteração de modelo, prompt, limite é registrada com quem alterou e quando Sem registro de alterações de configuração
Registros (logs) para rastreabilidade: capacidade técnica de registrar eventos para auditoria de falhas Audit trail JSONB imutável — mensagens completas, tokens, custo, latência, modelo. Exportável, agrupado por conversa Logs de API parciais, sem conteúdo das mensagens
Testes para vieses discriminatórios: identificar e corrigir preconceitos de raça, gênero, etc. Safety Gate classifica input e output. Fact-Check detecta viés factual por verificação contra fontes Sem ferramentas de detecção de viés
Documentação de mitigação: comprovar medidas adotadas para reduzir riscos Single-tenant (dados isolados). Zero CDN externo (soberania). Cliente dono das API Keys (sem intermediação) Multi-tenant, dados nos EUA, dependência de CDNs
🏛️ Compliance de fábrica — não adaptação futura: Quando o PL 2338 for sancionado, empresas usando ChatGPT Enterprise terão 6-12 meses para se adaptar. Migrar dados, treinar pessoas, mudar processos — isso custa mais caro que adoção planejada. O Winserv AI Portal já entrega todos os requisitos como arquitetura de fábrica. Não é "vamos implementar quando a lei passar" — já está em produção.

5. O que o portal entrega que nenhum concorrente entrega

Diferencial ChatGPT Ent. Claude Ent. Gemini Direto Winserv Portal
Fact-Check afirmação por afirmação ✅ Integrado
Audit trail com conteúdo completo ✅ JSONB imutável
RBAC 4 níveis com feature flags
Single-tenant (banco isolado)
Cliente soberano (dados, conta Google, branding)
Grounding incluso ✅ Bing✅ Brave
Zero CDN externo (air-gap ready)
Custo previsível com daily limit
Suporte em português LimitadoLimitado✅ Nativo
Ciclo de vida de usuários (auto-cleanup + anonimização LGPD)
💡 Nota sobre pricing de API: Os preços na tabela acima referem-se ao modelo em produção: Gemini 3.5 Flash (Standard e Advanced). O FinOps dashboard reflete o custo real automaticamente — o cliente sempre sabe exatamente quanto está gastando.
💰 Token Economy: O portal implementa 5 camadas de cache que reduzem o consumo de tokens na API do Google — economia direta na fatura do cliente, sem intermediação da Winserv. Cada cache opera em um nível diferente da stack:
CacheDuraçãoEconomia
Context Cache (Gemini API)4-8h~75% nos tokens de entrada de documentos repetidos
Response Cache (documento + prompt)30min100% — resposta instantânea, zero tokens
Extraction Cache (arquivo + query)30min100% — não re-extrai o mesmo arquivo
Safety Gate Cache (SHA-256)24h100% — não re-classifica mesmo conteúdo
TTS Cache (áudio)7 dias100% — não re-sintetiza mesma frase

Exemplo real: um contrato de 100K tokens consultado 20× ao dia por um advogado custaria US$ 2.50/dia sem cache. Com Context Cache + Response Cache, o mesmo uso custa menos de US$ 0.03/dia — uma redução de 98%.

6. Resumo para o gestor

Usar Gemini/ChatGPT/Claude direto resolve o problema de 1 funcionário. Funciona para experimentação. Mas quando a empresa coloca IA nas mãos de 50+ pessoas, o que importa não é só a qualidade da resposta — é quem perguntou o quê, quanto custou, se a resposta era verdadeira, e se está tudo documentado para o dia em que o auditor ou o DPO bater na porta.

O Winserv AI Portal não compete com o Gemini — ele opera sobre o Gemini como camada de governança. É a diferença entre usar um carro sem freios e ter um painel de controle completo.

✅ Com o portal, o cliente ganha:

  • Documentos processados íntegros no Gemini — sem RAG, sem chunking
  • Compliance regulatório (LGPD, normas setoriais)
  • Previsibilidade de custo (daily limit por usuário)
  • Rastreabilidade total (quem, o quê, quando, quanto custou)
  • Dados em PostgreSQL isolado na VM do cliente
  • API Keys próprias — sem intermediação de tokens
  • Token Economy — 5 camadas de cache que reduzem até 98% do custo com tokens em uso repetido
  • Ciclo de vida de usuários — desativação imediata, cleanup automático por inatividade, anonimização LGPD em um clique

❌ Sem o portal, o cliente assume:

  • Risco de exposição de dados corporativos em APIs públicas
  • Impossibilidade de auditar uso de IA
  • Custo imprevisível e crescente
  • Zero controle sobre quem acessa o quê

7. Arquitetura

🌐 Internet
HTTPS :443
🔒 Caddy
TLS · Let's Encrypt
⚡ FastAPI :4001
winserv-llm-proxy
🗂️ StaticFiles: frontend/ (HTML+JS+CSS) 🔐 Middleware: CSP · HSTS · Rate Limit · BodyGuard 📋 Routers: Chat · Auth · Audio · Extract · Admin · Fact-Check 🛡️ RBAC 4-tier · Safety Gate · Audit Trail · FinOps
🧠 Google Gemini
AI Studio API Key
🎤 Google STT/TTS
Cloud API Key
🗄️ PostgreSQL 16
Schema ai_portal
LOGGED: users · roles · groups · conversations · request_telemetry · system_settings UNLOGGED: rate_limit · tts_cache · extract_cache · context_caches · safety_cache
🧩 Stack completa: O portal é um monorepo com backend FastAPI (winserv-llm-proxy/) e frontend vanilla JS (frontend/). O backend serve a API, o frontend estático e o painel admin. Tudo roda em 3 containers Docker: PostgreSQL (banco isolado), Portal (FastAPI+frontend) e Caddy (TLS automático via Let's Encrypt). Zero Redis, zero fila, zero CDN externo, zero Microsoft Graph. Superfície mínima para segurança máxima.

8. Glossário — Termos de IA e Infraestrutura

Para gestores, auditores e parceiros que precisam dominar o vocabulário da área. Organizado do conceito mais fundamental ao mais específico do portal.

Conceitos fundamentais de IA

TermoSignificadoPor que importa
LLM (Large Language Model) Modelo de IA treinado em bilhões de textos para entender e gerar linguagem natural. Ex: Gemini, GPT-5, Claude. É o "cérebro" por trás de qualquer chat de IA.
Token Unidade de processamento do modelo. ~1 token = ¾ de uma palavra em português. Modelos cobram por token de entrada (input) e de saída (output). Determina o custo da API. 1M tokens ≈ 750 mil palavras ≈ um livro de 3.000 páginas.
Context Window (Janela de Contexto) Quantidade máxima de tokens que o modelo "enxerga" de uma vez. Gemini 3.5 Flash: 1M tokens. Claude Enterprise (2026): 1M tokens. GPT-5. Define quanto conteúdo cabe numa conversa. 1M tokens = cabem PDFs de 500+ páginas inteiros.
Grounding (Web Search) Capacidade do modelo de buscar informações atualizadas na internet durante a resposta. O Gemini faz nativamente via Google Search. Reduz alucinações — o modelo consulta fontes reais em vez de "adivinhar".
Alucinação (Hallucination) Quando o modelo gera informação convincente mas factualmente incorreta. Ex: inventar um artigo de lei, um valor, uma data. É o principal risco jurídico do uso de IA. Fact-Check existe para mitigar isso.

Técnicas de processamento de documentos

TermoSignificadoO portal usa?
RAG (Retrieval-Augmented Generation) Técnica que fatia documentos em pedaços (chunks), armazena em banco vetorial e recupera trechos relevantes durante a pergunta. Usada por Dify, AnythingLLM, Copilot. ❌ Não usa — substituído por ICL. RAG é eficiente em custo de tokens, mas sacrifica contexto integral entre seções do documento e exige manutenção de embeddings. O portal escolheu ICL para preservar contexto profundo — o trade-off de custo é mitigado por 5 camadas de cache.
ICL (In-Context Learning) Envia o documento íntegro na janela de contexto do modelo, sem fatiar. O modelo lê o documento inteiro a cada conversa. ✅ Sim — viável graças à janela de 1M tokens do Gemini 3.5 Flash.
Chunking Processo de dividir um documento em pedaços menores (chunks) para indexação. Ex: quebrar um PDF de 100 páginas em 500 pedaços de 200 tokens cada. ❌ Não usa — desnecessário com ICL.
Embedding Representação numérica (vetor) do significado de um texto. Usado para busca semântica — encontrar trechos "parecidos" com a pergunta. ❌ Não usa — não há busca vetorial no portal.
Vector Store Banco de dados especializado em armazenar e buscar embeddings. Ex: pgvector, Pinecone, ChromaDB. ❌ Não usa — o portal usa apenas PostgreSQL tradicional.

Arquitetura e Infraestrutura

TermoSignificadoNo portal
Single-tenant Cada cliente tem seu próprio banco de dados e infraestrutura isolada. Oposto de multi-tenant (todos compartilham). Cada cliente recebe VM + PostgreSQL dedicados.
JSONB Formato binário de JSON no PostgreSQL. Permite armazenar documentos estruturados com consultas indexadas. Usado no audit trail — cada mensagem completa é armazenada em JSONB.
RBAC (Role-Based Access Control) Controle de acesso baseado em papéis. Cada usuário recebe um nível (ex: user, auditor, admin) que define o que pode fazer. 4 níveis: user → auditor → llm_manager → global_admin.
SSE (Server-Sent Events) Protocolo que permite ao servidor enviar dados ao navegador em tempo real. Usado para streaming de texto (resposta aparece palavra por palavra). Chat streaming usa SSE — tokens chegam em tempo real.

Componentes específicos do portal

TermoSignificadoPor que importa
JSONB Imutável JSONB (Binary JSON) é o formato nativo do PostgreSQL para armazenar documentos estruturados com indexação e consultas rápidas — superior ao JSON texto. No portal, a API expõe apenas INSERT — sem UPDATE nem DELETE. Na infra SaaS Winserv, não existe painel, API ou ferramenta que permita apagar registros — a imutabilidade é arquitetural. É o que torna o portal auditável de verdade. Numa auditoria real (Bacen, ANPD, CRC), logs que permitem UPDATE via aplicação não têm valor probatório. O portal elimina o fator humano da equação ao não expor nenhum mecanismo de adulteração via API. Ninguém pode ser coagido a apagar evidência porque simplesmente não existe o botão.
Fact-Check Sistema que extrai cada afirmação individual de uma resposta da IA e verifica contra fontes web. Atribui um dos 5 vereditos: Precisa (confirmada por fontes), Imprecisa (parcialmente correta), Contestada (fontes divergem), Não Verificável (sem fontes disponíveis), Enganosa (fontes contradizem). Sem equivalente integrado nos concorrentes hoje. Elimina o risco de um advogado protocolar uma petição com jurisprudência inventada pela IA, ou um contador enviar um parecer com artigo de lei que não existe. O veredito vem com fontes — o auditor humano decide.
Safety Gate Camada de classificação que analisa pergunta e resposta em 10 categorias de segurança (discurso de ódio, violência, conteúdo sexual, automutilação, etc.) antes da entrega ao usuário. Usa modelo Gemini Flash-Lite com cache SHA-256 (24h TTL). Política fail-open: se o classificador falhar, o conteúdo passa — segurança não pode bloquear produtividade. Diferente de filtros de API que simplesmente rejeitam, o Safety Gate classifica e registra. O gestor audita depois quais conteúdos foram bloqueados e por quê. Transparência total sobre o que a IA está entregando.
Audit Trail Registro completo e imutável de cada interação: quem perguntou (user_id), o quê (messages_json completo), qual modelo respondeu, quantos tokens (input + output), quanto custou (USD com 6 casas decimais), qual latência (ms), e se usou web search. Tudo armazenado em JSONB imutável, exportável em CSV agrupado por conversa. Quando o auditor do Bacen bater na porta perguntando "onde está o histórico de uso de IA desta equipe?", a resposta é um clique: exportar CSV. Sem audit trail, a resposta é "não temos como saber" — e isso custa a licença de funcionamento.
FinOps Dashboard de operações financeiras integrado ao portal. Mostra custo por modelo, por usuário, por dia. Projeções mensais com base no uso atual. Comparativo entre tiers (Standard vs Advanced). Permite configurar daily cost limit por usuário ou grupo — a IA bloqueia novas requisições quando o teto diário é atingido. O gestor financeiro não precisa acessar o billing do Google Cloud para saber quanto a IA está custando. Tudo visível no painel admin. Isso evita a "surpresa da fatura" e permite orçamento previsível.
Token Economy Conjunto de 5 caches independentes que reduzem o consumo de tokens: Context Cache (Gemini API, 4-8h, ~75% economia), Response Cache (documento+prompt, 30min, 100%), Extraction Cache (arquivo, 30min, 100%), Safety Gate Cache (SHA-256, 24h, 100%), TTS Cache (áudio, 7 dias, 100%). Exclusivo do portal. Exemplo real: um contrato de 100K tokens consultado 20× ao dia custaria US$ 2.50/dia sem cache. Com Context Cache + Response Cache, o mesmo uso custa menos de US$ 0.03/dia — redução de 98%. Isso impacta direto o orçamento de TI.
OIDC (OpenID Connect) Protocolo de autenticação baseado em OAuth 2.0. O portal usa OIDC puro multi-provider (Microsoft Entra ID, Google Workspaces). Conta de recuperação administrativa local (winserv, PBKDF2-SHA256) para emergências. Escopos mínimos (openid, profile, email), sem tokens Microsoft Graph. Validação com JWKS, nonce anti-replay, cookie assinado HMAC-SHA256. Princípio do menor privilégio: o portal sabe quem é o usuário, não o que ele tem no Microsoft 365. Se o PostgreSQL for comprometido, o invasor não consegue escalar para o tenant Microsoft do cliente. Defesa em profundidade.
STT (Speech-to-Text) Transcrição de áudio em texto via Google Cloud Speech-to-Text com modelo latest_short otimizado para comandos de voz curtos em pt-BR. VAD (Voice Activity Detection) nativo no navegador detecta silêncio de 1.5s e encerra a gravação automaticamente. Motor acústico — zero alucinação na transcrição. Diferente de LLMs que "escutam" e podem interpretar errado, o STT é processamento de sinal determinístico. O áudio original é preservado no banco para auditoria — acessível via painel admin.
TTS (Text-to-Speech) Síntese de voz via Google Cloud TTS Neural2 com voz pt-BR-Neural2-B. Áudio gerado sob demanda, cache de 7 dias, truncado a 5000 caracteres por payload. Voz natural em português brasileiro. Com cache de 7 dias, frases repetidas (ex: "Como posso ajudar?") não geram custo adicional de API.
Entra ID Plataforma de identidade da Microsoft (antigo Azure AD). Usado para login corporativo no portal. Google Workspaces também disponível como IdP alternativo. Conta de recuperação local winserv para emergências administrativas (V10). Single Sign-On corporativo — o usuário não cria mais uma senha. O admin do Entra ID controla quem acessa. Em caso de desligamento, o acesso ao portal cessa automaticamente.
Licenciamento / Ciclo de Vida Módulo de gestão do ciclo de vida de usuários. Controla limites de uso (hard-limit por plano), desativação manual pelo admin, auto-cleanup por inatividade (N dias configurável) e anonimização LGPD. O admin gerencia tudo na aba Licenciamento do painel. Resolve o problema de "ghost seats" — ex-funcionários com acesso ativo — e simplifica compliance de offboarding sem chamados de TI. O painel avisa quando o tier está próximo do limite e sugere upgrade automático.
Anonimização LGPD Processo que substitui nome, e-mail e identificador IdP de um usuário por dados neutros (anon-<hash>), mantendo o histórico técnico intacto. Irreversível. Disponível na aba Licenciamento para admins globais. Permite responder ao direito de esquecimento (Art. 18 LGPD) sem destruir trilhas de auditoria exigidas por normas setoriais. O auditor conserva o histórico completo — sem PII identificável.

Interessado?

Fale com a equipe Winserv para agendar uma demonstração do portal.

Falar com a Winserv

Feito por msamoilenko · WinServ TI · Maio 2026 · Versão 2.2