Artigo
Claude Code na AWS: Guia de Configuração para Bedrock, Modelos Auto-Hospedados e Escolha do Plano

O Claude Code é o assistente de codificação com IA da Anthropic que vive no seu terminal, IDE ou navegador. Ele lê seu código-fonte, executa comandos, escreve e edita arquivos, e lida com tarefas complexas de engenharia — desde depuração até implementação de funcionalidades e refatoração — tudo guiado por instruções em linguagem natural.
Para organizações que operam na AWS, o Claude Code pode ser conectado diretamente ao Amazon Bedrock ou a modelos auto-hospedados dentro da sua própria VPC. Este guia percorre ambos os caminhos de ponta a ponta: pré-requisitos, configuração, IAM, fixação de versões de modelos, rede, rollout enterprise e melhores práticas operacionais.
Matriz de Decisão Rápida
| Você precisa de... | Escolha |
|---|---|
| Faturamento e governança AWS | Bedrock |
| Apps Claude prontos (web, mobile, desktop) | Team / Enterprise |
| Modelos open-source na sua VPC | Auto-hospedado |
| Engenharia + negócios juntos | Híbrido |
Bedrock vs. Claude Team/Enterprise: Controle Nativo AWS ou Experiência SaaS
A escolha se resume a controle nativo AWS versus experiência de aplicativo Claude pronta para uso. A documentação oficial da Anthropic posiciona o Claude Team/Enterprise como a melhor experiência para a maioria das organizações, enquanto o Bedrock é o melhor encaixe para deployments nativos AWS.
Claude no Amazon Bedrock
O Bedrock é a escolha certa para organizações com deployments nativos AWS que desejam:
- Faturamento e governança AWS. O consumo do Bedrock é baseado em uso e aparece na sua fatura padrão da AWS. A AWS também oferece capacidade reservada, inferência em lote e outros modelos de preço além do sob demanda. O gasto com Bedrock pode descontar de um compromisso existente do AWS Enterprise Discount Program (EDP); confirme a elegibilidade com sua equipe de conta AWS, pois os termos variam.
- Controles de segurança ancorados na AWS. As requisições são governadas pelo AWS IAM, processadas dentro da região selecionada, criptografadas em repouso e em trânsito, e não compartilhadas com provedores de modelos. Conectividade opcional via PrivateLink e VPC fornecem isolamento adicional em nível de rede.
- Serviços de desenvolvimento de aplicações AWS. Além da invocação de modelos, o Bedrock oferece avaliação, fine-tuning, RAG (bases de conhecimento), agentes, guardrails e fluxos de trabalho colaborativos pelo SageMaker Unified Studio.
A ressalva importante: o Bedrock não inclui a experiência de aplicativo Claude. Clientes usando Bedrock não têm acesso aos aplicativos Claude para web, iOS, Android ou desktop, nem a recursos do aplicativo Claude como Projects, Artifacts, conectores e fluxos de trabalho colaborativos que vêm prontos com um plano Claude. Se você precisa do Claude na web/desktop/mobile, colaboração integrada e conectores de workspace prontos, compare o Bedrock com Claude Team ou Enterprise — não apenas Bedrock isoladamente.
Claude Team e Enterprise (SaaS por Assento)
Os planos Claude Team e Enterprise operam fora do ecossistema AWS com um modelo de assinatura por assento (níveis padrão e premium, com uso extra opcional e controles de gasto). O que entregam é a adoção mais rápida:
- Acesso nativo via web, iOS, Android e desktop ao Claude
- Projects, Artifacts e fluxos de trabalho colaborativos
- Conectores de workspace (Google Workspace disponível amplamente; conectores personalizados e de workspace também disponíveis além do Team)
- Claude Code e Claude Cowork inclusos
- Administração organizacional, faturamento centralizado e controles de segurança
- Enterprise adiciona SSO/SCIM, retenção expandida e controles de administração avançados
Qual Caminho é o Certo?
| Dimensão | Claude no Bedrock | Claude Team / Enterprise |
|---|---|---|
| Modelo de faturamento | Baseado em uso (sob demanda, reservado, lote); pode descontar do EDP | Assinatura por assento (padrão / premium) com uso extra opcional |
| Dados e segurança | IAM, processamento regional, criptografia, PrivateLink/VPC opcional | Infraestrutura gerenciada pela Anthropic com controles de plataforma |
| Experiência de aplicativo Claude | Não incluída — API de modelo + serviços AWS | Completa: apps web/mobile/desktop, Projects, Artifacts, conectores |
| Serviços de desenvolvimento IA | Avaliação, fine-tuning, RAG, agentes, guardrails, SageMaker | Não aplicável — SaaS focado no usuário |
| Melhor para | Equipes de engenharia, integrações personalizadas, fluxos nativos AWS | Adoção organizacional ampla, valor imediato, usuários não técnicos |
Muitos de nossos clientes adotam ambos: Bedrock para equipes de engenharia e aplicações personalizadas, mais um plano Claude Team ou Enterprise para usuários de negócios. A Elevata pode ajudá-lo a projetar essa abordagem híbrida.
Cenário 1: Claude Code com Amazon Bedrock
O AWS Bedrock oferece acesso totalmente gerenciado aos modelos Claude da Anthropic sem hospedar ou escalar infraestrutura. Para equipes que já operam na AWS, este é o caminho mais direto para habilitar o Claude Code.
Pré-requisitos
- Uma conta AWS com acesso ao Bedrock habilitado
- Permissões AWS Marketplace necessárias (detalhadas abaixo)
- AWS CLI instalado e configurado (opcional)
Passo 1: Habilitar Acesso aos Modelos
Para usar o Claude pelo Amazon Bedrock, certifique-se de que sua conta tem as permissões AWS Marketplace necessárias e então complete o formulário de Primeiro Uso da Anthropic. O Bedrock pode habilitar automaticamente o acesso serverless aos modelos no primeiro uso, embora a assinatura e configuração iniciais possam levar vários minutos antes que as chamadas funcionem consistentemente.
- Navegue até o Amazon Bedrock no Console AWS.
- Acesse Model access e selecione os modelos Claude desejados.
- Complete o formulário de caso de uso da Anthropic (uma única vez por conta). O acesso é concedido imediatamente após o envio.
- Aguarde alguns minutos para que a assinatura inicial seja processada antes de fazer sua primeira chamada de API.
Passo 2: Solicitar Aumento de Cotas
As cotas padrão podem ser insuficientes para uso em equipe. Solicite aumentos proativamente:
| Cota | Padrão | Ação Recomendada |
|---|---|---|
| InvokeModel requisições/min | Varia por modelo | Aumento baseado no tamanho da equipe (est. 5–10 RPM por dev) |
| InvokeModelWithResponseStream | Varia por modelo | Aumento proporcional (Claude Code usa streaming) |
| Max tokens por requisição | Dependente do modelo | Verificar alinhamento com janela de contexto do Claude Code |
Passo 3: Configurar Permissões IAM
Crie uma política IAM com as permissões mínimas para o Claude Code:
{
"Version": "2012-10-17",
"Statement": [
{
"Sid": "AllowModelAndInferenceProfileAccess",
"Effect": "Allow",
"Action": [
"bedrock:InvokeModel",
"bedrock:InvokeModelWithResponseStream",
"bedrock:ListInferenceProfiles"
],
"Resource": [
"arn:aws:bedrock:*:*:inference-profile/*",
"arn:aws:bedrock:*:*:application-inference-profile/*",
"arn:aws:bedrock:*:*:foundation-model/*"
]
},
{
"Sid": "AllowMarketplaceSubscription",
"Effect": "Allow",
"Action": [
"aws-marketplace:ViewSubscriptions",
"aws-marketplace:Subscribe",
"aws-marketplace:Unsubscribe"
],
"Resource": "*",
"Condition": {
"StringEquals": {
"aws:CalledViaLast": "bedrock.amazonaws.com"
}
}
}
]
}Restrinja as permissões a ARNs de modelos específicos para acesso mais restritivo. Crie uma conta AWS dedicada para o Claude Code para simplificar rastreamento de custos e controle de acesso.
Passo 4: Configurar Variáveis de Ambiente
# Habilitar integração com Bedrock
export CLAUDE_CODE_USE_BEDROCK=1
export AWS_REGION=us-east-1 # ou sua região preferida
# Opcional: Região para o modelo pequeno/rápido (Haiku)
export ANTHROPIC_SMALL_FAST_MODEL_AWS_REGION=us-west-2Importante: AWS_REGION deve ser definido explicitamente. O Claude Code não lê do arquivo .aws/config. Ao usar o Bedrock, os comandos /login e /logout são desabilitados.
Passo 5: Configurar Autenticação AWS
| Método | Melhor Para | Configuração |
|---|---|---|
| AWS SSO / Identity Center | Equipes enterprise com identidade centralizada | aws sso login --profile=<profile> e definir AWS_PROFILE |
| Chaves de Acesso IAM | Desenvolvedores individuais ou contas de serviço | Definir AWS_ACCESS_KEY_ID e AWS_SECRET_ACCESS_KEY |
| Chaves de API Bedrock | Exploração e prototipagem | Definir AWS_BEARER_TOKEN_BEDROCK |
| Role de Instância/Container | Pipelines CI/CD ou workstations cloud | Nenhuma configuração necessária |
Nota sobre Chaves de API Bedrock: O uso de chaves de API é governado pela permissão bedrock:CallWithBearerToken. A AWS recomenda chaves de API Bedrock de longo prazo principalmente para exploração; para produção, prefira credenciais temporárias (SSO, roles de instância) para segurança mais forte.
Para SSO com renovação de credenciais, adicione awsAuthRefresh na configuração do Claude Code:
{
"awsAuthRefresh": "aws sso login --profile myprofile",
"env": {
"AWS_PROFILE": "myprofile"
}
}Passo 6: Fixar Versões de Modelos
Crítico para estabilidade em produção. Sem fixação, o Claude Code pode tentar usar uma versão mais nova indisponível na sua conta Bedrock.
export ANTHROPIC_DEFAULT_OPUS_MODEL='us.anthropic.claude-opus-4-6-v1'
export ANTHROPIC_DEFAULT_SONNET_MODEL='us.anthropic.claude-sonnet-4-6'
export ANTHROPIC_DEFAULT_HAIKU_MODEL='us.anthropic.claude-haiku-4-5-20251001-v1:0'Para múltiplas versões de modelo, use modelOverrides:
{
"modelOverrides": {
"claude-opus-4-6": "arn:aws:bedrock:us-east-2:123456789012:application-inference-profile/opus-46-prod",
"claude-opus-4-5-20251101": "arn:aws:bedrock:us-east-2:123456789012:application-inference-profile/opus-45-prod"
}
}Passo 7: Habilitar AWS Guardrails (Opcional)
Crie um Guardrail no console Bedrock, publique uma versão e adicione os headers:
{
"env": {
"ANTHROPIC_CUSTOM_HEADERS": "X-Amzn-Bedrock-GuardrailIdentifier: your-guardrail-id\nX-Amzn-Bedrock-GuardrailVersion: 1"
}
}Inferência Cross-Region
Perfis de inferência cross-region (IDs prefixados com us. ou eu.) permitem que o Bedrock roteie requisições entre regiões configuradas para melhorar throughput e performance. Habilite inferência cross-region nos seus Guardrails se estiver usando esses perfis.
Cenário 2: Modelos Auto-Hospedados na AWS
Organizações que precisam executar modelos open-source ou de terceiros podem hospedá-los na sua VPC e conectar o Claude Code a esses endpoints. Isso oferece controle total sobre seleção de modelos, residência de dados e custos, mas requer gerenciamento de infraestrutura e vem com limitações de compatibilidade.
Provisionar Computação GPU
| Família | GPU | Caso de Uso |
|---|---|---|
| p4d / p4de | NVIDIA A100 (40/80 GB) | Modelos grandes (70B+) |
| p5 | NVIDIA H100 | Maior performance |
| g5 | NVIDIA A10G | Custo-benefício (7B–34B) |
| inf2 | AWS Inferentia2 | Inferência otimizada |
Implantar Servidor de Inferência
Seu servidor deve implementar o formato da API de Mensagens da Anthropic (/v1/messages):
- vLLM (Recomendado): Suporte nativo ao formato Anthropic com inferência de alta vazão. O vLLM possui documentação específica para uso com Claude Code via sua API compatível com Anthropic.
- LiteLLM Proxy: Camada de tradução para modelos que suportam apenas endpoints OpenAI.
Notas de Compatibilidade
- Funcionalidades limitadas: Quando
ANTHROPIC_BASE_URLaponta para um host não oficial, a busca de ferramentas MCP é desabilitada por padrão, a menos que o proxy encaminhe os blocos necessários. - Segurança do LiteLLM: Esteja ciente de que as versões 1.82.7 e 1.82.8 do LiteLLM foram sinalizadas com um aviso de segurança na documentação de gateway da Anthropic. Verifique se está usando uma versão corrigida.
- Paridade de recursos: Modelos auto-hospedados podem não suportar todas as funcionalidades do Claude Code (como cache de prompt estendido ou uso avançado de ferramentas) que estão disponíveis via Bedrock ou API direta.
Rede e Segurança
- Servidor de inferência em sub-rede privada via VPN ou AWS Client VPN
- ALB interno com terminação TLS
- Security groups restritivos + CloudWatch para monitoramento
- AWS PrivateLink para padrões zero-trust
Configurar Claude Code
export ANTHROPIC_BASE_URL=https://your-vllm-endpoint.internal
export ANTHROPIC_AUTH_TOKEN=your-auth-tokenComparação de Cenários
| Dimensão | Bedrock (Gerenciado) | Auto-Hospedado |
|---|---|---|
| Complexidade | Baixa | Alta |
| Modelos disponíveis | Família Claude | Qualquer modelo |
| Infraestrutura | Totalmente gerenciada | Propriedade total |
| Custo | Baseado em uso, sem custos ociosos | Instância GPU sempre rodando |
| Paridade de recursos | Completa | Parcial (MCP limitado, sem cache de prompt) |
| Tempo até produção | Horas | Dias a semanas |
Rollout Enterprise
Para deployments em escala, a Anthropic documenta recursos de gerenciamento enterprise que vão além da configuração básica:
Configurações Gerenciadas pelo Servidor
Distribua configurações do Claude Code centralmente usando server-managed settings e endpoint-managed settings. Estes permitem que equipes de plataforma definam versões de modelos, políticas de autenticação e configurações de segurança que os usuários não podem substituir localmente — garantindo consistência em toda a organização.
Permissões Gerenciadas
Configure permissões gerenciadas para controlar quais ferramentas e ações o Claude Code pode executar. Isso dá às equipes de segurança controle granular sobre o que o Claude Code pode fazer no ambiente de cada desenvolvedor.
Analytics e Monitoramento
Implante dashboards de analytics para rastrear adoção, uso e ROI. O Claude Code suporta telemetria baseada em OpenTelemetry (OTel) para enviar métricas detalhadas de uso para sua stack de observabilidade.
Melhores Práticas para Produção
Perfis de Inferência de Aplicação
Use application inference profiles do Bedrock para rastreamento de custos com tags e métricas CloudWatch por equipe, projeto ou ambiente. Isso fornece visibilidade granular que tags simples do Cost Explorer não conseguem.
Cache de Prompt
O Claude Code é um caso de uso forte para prompt caching do Bedrock, que pode reduzir significativamente latência e custos para contextos de sistema repetitivos e conteúdo de codebase. Verifique a disponibilidade regional, pois o cache de prompt pode não estar disponível em todas as regiões.
Gateway LLM Enterprise
Para gerenciamento centralizado de autenticação, rate limiting e controles de custos, implante um LLM Gateway na frente do Bedrock via ANTHROPIC_BEDROCK_BASE_URL.
Telemetria OTel
Use a telemetria OpenTelemetry do Claude Code para enviar métricas de uso, latência e adoção para sua stack de observabilidade existente. Combine com perfis de inferência de aplicação para uma visão completa de custos e performance.
Segurança e Compliance
Habilite AWS CloudTrail para todas as chamadas Bedrock. Use Guardrails para filtragem de conteúdo. Para auto-hospedados, implemente logging de acesso no servidor de inferência.
Solução de Problemas
- Problemas de região:
aws bedrock list-inference-profiles --region your-region - Erro "On-demand throughput isn't supported": Use ID de perfil de inferência em vez de ID de modelo base.
- Expiração de credenciais: Configure
awsAuthRefreshpara re-autenticação automática. - Endpoint auto-hospedado: Deve implementar
/v1/messages. Use LiteLLM Proxy (versão corrigida) para endpoints apenas OpenAI.
Nota: O Claude Code usa a API Invoke do Bedrock e não suporta a API Converse.
Perguntas Frequentes
O Bedrock inclui o Claude na web?
Não. O Bedrock fornece acesso à API de modelo e serviços de desenvolvimento AWS. Os aplicativos Claude (web, desktop, mobile) e recursos como Projects e Artifacts estão disponíveis apenas nos planos Claude Team e Enterprise.
Preciso de aprovação para acessar modelos?
Não é uma fila de aprovação manual. Com as permissões AWS Marketplace corretas, complete o formulário de Primeiro Uso da Anthropic e o acesso é concedido imediatamente. A configuração inicial pode levar alguns minutos.
Chaves de API Bedrock são seguras para produção?
A AWS recomenda chaves de API Bedrock de longo prazo para exploração. Para produção, use credenciais temporárias (SSO, roles de instância). O acesso por chave de API é governado pela permissão bedrock:CallWithBearerToken.
O que não funciona com modelos auto-hospedados?
A busca de ferramentas MCP é desabilitada por padrão com hosts não oficiais. Cache de prompt estendido e uso avançado de ferramentas podem não estar disponíveis. Versões específicas do LiteLLM (1.82.7–1.82.8) têm alertas de segurança conhecidos.
Como a Elevata Pode Ajudar
Configurar o Claude Code é apenas o começo. Como AWS Advanced Tier Services Partner com a Competência AWS de IA Generativa, a Elevata ajuda organizações a construir a plataforma completa de desenvolvimento com IA na AWS.
- Implantação do Claude Code — setup completo para Bedrock e auto-hospedados, incluindo LLM Gateway, IAM, configurações gerenciadas e automação de onboarding.
- Infraestrutura de IA — dimensionamento de GPU, otimização de inferência, perfis de aplicação, cache de prompt e monitoramento OTel.
- Design de plano híbrido — decidir onde Bedrock e Claude Team/Enterprise se encaixam e construir as integrações.
- Elevata Orbit — engenheiros AWS sêniores sob demanda para setup, otimização e operações contínuas.
Entre em contato em elevata.io para discutir sua implantação do Claude Code, estratégia de IA ou necessidades de infraestrutura AWS.
Relacionados
Continue lendo
Leituras relacionadas a este tema.

02/02/2026
8 min de leitura
IA Generativa No-Code: Como Construir Agentes de Automação com Quick Flows e Quick Automate
Continuar leitura
02/02/2026
8 min de leitura
O Paradoxo da Nuvem: Por Que Sua Estratégia Milionária de Cloud Ainda Parece um Data Center Old School
Continuar leitura
02/02/2026
7 min de leitura
A Arquitetura da Autonomia: Por que sua Plataforma de Aplicações não Consegue Lidar com Agentes de Fronteira
Continuar leitura