Limite de dados
Dados recuperados, embutidos e registrados
Quais documentos, registros, prompts, embeddings, logs, traces e dados de avaliação podem ser usados pelo fluxo de IA e onde eles podem ficar?
Retrieval
Bases, vetores, busca e ranking
O sistema usará Bedrock Knowledge Bases, vector store customizado, APIs de busca ou abordagem híbrida? Como permissões, atualização, citações e ranking serão tratados?
Ferramentas
Ações explícitas, limitadas e reversíveis
Quais ações são somente leitura, quais exigem aprovação e quais nunca devem ser delegadas a um agente? MCP deve tornar acesso a ferramentas explícito, limitado, registrado e reversível.
Produção
Qualidade, custo, latência e auditoria
O que será medido antes do lançamento: qualidade da resposta, precisão do retrieval, precisão das chamadas de ferramentas, custo por resposta, latência, recusa segura, auditabilidade e rollback?
Canadá
Região e privacidade por fluxo
Decida se prompts, contexto recuperado, embeddings, logs, traces, backups e dados de avaliação precisam ficar em uma região AWS canadense, e se cross-Region inference é aceitável para o fluxo.