Elevata

Artigo

Claude Code na AWS: Guia de Configuração para Bedrock, Modelos Auto-Hospedados e Escolha do Plano

PPaulo FrugisCTO da Elevata31 de março de 202611 min de leitura
Claude Code na AWS: Guia de Configuração para Bedrock, Modelos Auto-Hospedados e Escolha do Plano

O Claude Code é o assistente de codificação com IA da Anthropic que vive no seu terminal, IDE ou navegador. Ele lê seu código-fonte, executa comandos, escreve e edita arquivos, e lida com tarefas complexas de engenharia — desde depuração até implementação de funcionalidades e refatoração — tudo guiado por instruções em linguagem natural.

Para organizações que operam na AWS, o Claude Code pode ser conectado diretamente ao Amazon Bedrock ou a modelos auto-hospedados dentro da sua própria VPC. Este guia percorre ambos os caminhos de ponta a ponta: pré-requisitos, configuração, IAM, fixação de versões de modelos, rede, rollout enterprise e melhores práticas operacionais.

Matriz de Decisão Rápida

Você precisa de...Escolha
Faturamento e governança AWSBedrock
Apps Claude prontos (web, mobile, desktop)Team / Enterprise
Modelos open-source na sua VPCAuto-hospedado
Engenharia + negócios juntosHíbrido

Bedrock vs. Claude Team/Enterprise: Controle Nativo AWS ou Experiência SaaS

A escolha se resume a controle nativo AWS versus experiência de aplicativo Claude pronta para uso. A documentação oficial da Anthropic posiciona o Claude Team/Enterprise como a melhor experiência para a maioria das organizações, enquanto o Bedrock é o melhor encaixe para deployments nativos AWS.

Claude no Amazon Bedrock

O Bedrock é a escolha certa para organizações com deployments nativos AWS que desejam:

  • Faturamento e governança AWS. O consumo do Bedrock é baseado em uso e aparece na sua fatura padrão da AWS. A AWS também oferece capacidade reservada, inferência em lote e outros modelos de preço além do sob demanda. O gasto com Bedrock pode descontar de um compromisso existente do AWS Enterprise Discount Program (EDP); confirme a elegibilidade com sua equipe de conta AWS, pois os termos variam.
  • Controles de segurança ancorados na AWS. As requisições são governadas pelo AWS IAM, processadas dentro da região selecionada, criptografadas em repouso e em trânsito, e não compartilhadas com provedores de modelos. Conectividade opcional via PrivateLink e VPC fornecem isolamento adicional em nível de rede.
  • Serviços de desenvolvimento de aplicações AWS. Além da invocação de modelos, o Bedrock oferece avaliação, fine-tuning, RAG (bases de conhecimento), agentes, guardrails e fluxos de trabalho colaborativos pelo SageMaker Unified Studio.

A ressalva importante: o Bedrock não inclui a experiência de aplicativo Claude. Clientes usando Bedrock não têm acesso aos aplicativos Claude para web, iOS, Android ou desktop, nem a recursos do aplicativo Claude como Projects, Artifacts, conectores e fluxos de trabalho colaborativos que vêm prontos com um plano Claude. Se você precisa do Claude na web/desktop/mobile, colaboração integrada e conectores de workspace prontos, compare o Bedrock com Claude Team ou Enterprise — não apenas Bedrock isoladamente.

Claude Team e Enterprise (SaaS por Assento)

Os planos Claude Team e Enterprise operam fora do ecossistema AWS com um modelo de assinatura por assento (níveis padrão e premium, com uso extra opcional e controles de gasto). O que entregam é a adoção mais rápida:

  • Acesso nativo via web, iOS, Android e desktop ao Claude
  • Projects, Artifacts e fluxos de trabalho colaborativos
  • Conectores de workspace (Google Workspace disponível amplamente; conectores personalizados e de workspace também disponíveis além do Team)
  • Claude Code e Claude Cowork inclusos
  • Administração organizacional, faturamento centralizado e controles de segurança
  • Enterprise adiciona SSO/SCIM, retenção expandida e controles de administração avançados

Qual Caminho é o Certo?

DimensãoClaude no BedrockClaude Team / Enterprise
Modelo de faturamentoBaseado em uso (sob demanda, reservado, lote); pode descontar do EDPAssinatura por assento (padrão / premium) com uso extra opcional
Dados e segurançaIAM, processamento regional, criptografia, PrivateLink/VPC opcionalInfraestrutura gerenciada pela Anthropic com controles de plataforma
Experiência de aplicativo ClaudeNão incluída — API de modelo + serviços AWSCompleta: apps web/mobile/desktop, Projects, Artifacts, conectores
Serviços de desenvolvimento IAAvaliação, fine-tuning, RAG, agentes, guardrails, SageMakerNão aplicável — SaaS focado no usuário
Melhor paraEquipes de engenharia, integrações personalizadas, fluxos nativos AWSAdoção organizacional ampla, valor imediato, usuários não técnicos

Muitos de nossos clientes adotam ambos: Bedrock para equipes de engenharia e aplicações personalizadas, mais um plano Claude Team ou Enterprise para usuários de negócios. A Elevata pode ajudá-lo a projetar essa abordagem híbrida.

Cenário 1: Claude Code com Amazon Bedrock

O AWS Bedrock oferece acesso totalmente gerenciado aos modelos Claude da Anthropic sem hospedar ou escalar infraestrutura. Para equipes que já operam na AWS, este é o caminho mais direto para habilitar o Claude Code.

Pré-requisitos

  • Uma conta AWS com acesso ao Bedrock habilitado
  • Permissões AWS Marketplace necessárias (detalhadas abaixo)
  • AWS CLI instalado e configurado (opcional)

Passo 1: Habilitar Acesso aos Modelos

Para usar o Claude pelo Amazon Bedrock, certifique-se de que sua conta tem as permissões AWS Marketplace necessárias e então complete o formulário de Primeiro Uso da Anthropic. O Bedrock pode habilitar automaticamente o acesso serverless aos modelos no primeiro uso, embora a assinatura e configuração iniciais possam levar vários minutos antes que as chamadas funcionem consistentemente.

  1. Navegue até o Amazon Bedrock no Console AWS.
  2. Acesse Model access e selecione os modelos Claude desejados.
  3. Complete o formulário de caso de uso da Anthropic (uma única vez por conta). O acesso é concedido imediatamente após o envio.
  4. Aguarde alguns minutos para que a assinatura inicial seja processada antes de fazer sua primeira chamada de API.

Passo 2: Solicitar Aumento de Cotas

As cotas padrão podem ser insuficientes para uso em equipe. Solicite aumentos proativamente:

CotaPadrãoAção Recomendada
InvokeModel requisições/minVaria por modeloAumento baseado no tamanho da equipe (est. 5–10 RPM por dev)
InvokeModelWithResponseStreamVaria por modeloAumento proporcional (Claude Code usa streaming)
Max tokens por requisiçãoDependente do modeloVerificar alinhamento com janela de contexto do Claude Code

Passo 3: Configurar Permissões IAM

Crie uma política IAM com as permissões mínimas para o Claude Code:

{
  "Version": "2012-10-17",
  "Statement": [
    {
      "Sid": "AllowModelAndInferenceProfileAccess",
      "Effect": "Allow",
      "Action": [
        "bedrock:InvokeModel",
        "bedrock:InvokeModelWithResponseStream",
        "bedrock:ListInferenceProfiles"
      ],
      "Resource": [
        "arn:aws:bedrock:*:*:inference-profile/*",
        "arn:aws:bedrock:*:*:application-inference-profile/*",
        "arn:aws:bedrock:*:*:foundation-model/*"
      ]
    },
    {
      "Sid": "AllowMarketplaceSubscription",
      "Effect": "Allow",
      "Action": [
        "aws-marketplace:ViewSubscriptions",
        "aws-marketplace:Subscribe",
        "aws-marketplace:Unsubscribe"
      ],
      "Resource": "*",
      "Condition": {
        "StringEquals": {
          "aws:CalledViaLast": "bedrock.amazonaws.com"
        }
      }
    }
  ]
}

Restrinja as permissões a ARNs de modelos específicos para acesso mais restritivo. Crie uma conta AWS dedicada para o Claude Code para simplificar rastreamento de custos e controle de acesso.

Passo 4: Configurar Variáveis de Ambiente

# Habilitar integração com Bedrock
export CLAUDE_CODE_USE_BEDROCK=1
export AWS_REGION=us-east-1  # ou sua região preferida

# Opcional: Região para o modelo pequeno/rápido (Haiku)
export ANTHROPIC_SMALL_FAST_MODEL_AWS_REGION=us-west-2

Importante: AWS_REGION deve ser definido explicitamente. O Claude Code não lê do arquivo .aws/config. Ao usar o Bedrock, os comandos /login e /logout são desabilitados.

Passo 5: Configurar Autenticação AWS

MétodoMelhor ParaConfiguração
AWS SSO / Identity CenterEquipes enterprise com identidade centralizadaaws sso login --profile=<profile> e definir AWS_PROFILE
Chaves de Acesso IAMDesenvolvedores individuais ou contas de serviçoDefinir AWS_ACCESS_KEY_ID e AWS_SECRET_ACCESS_KEY
Chaves de API BedrockExploração e prototipagemDefinir AWS_BEARER_TOKEN_BEDROCK
Role de Instância/ContainerPipelines CI/CD ou workstations cloudNenhuma configuração necessária

Nota sobre Chaves de API Bedrock: O uso de chaves de API é governado pela permissão bedrock:CallWithBearerToken. A AWS recomenda chaves de API Bedrock de longo prazo principalmente para exploração; para produção, prefira credenciais temporárias (SSO, roles de instância) para segurança mais forte.

Para SSO com renovação de credenciais, adicione awsAuthRefresh na configuração do Claude Code:

{
  "awsAuthRefresh": "aws sso login --profile myprofile",
  "env": {
    "AWS_PROFILE": "myprofile"
  }
}

Passo 6: Fixar Versões de Modelos

Crítico para estabilidade em produção. Sem fixação, o Claude Code pode tentar usar uma versão mais nova indisponível na sua conta Bedrock.

export ANTHROPIC_DEFAULT_OPUS_MODEL='us.anthropic.claude-opus-4-6-v1'
export ANTHROPIC_DEFAULT_SONNET_MODEL='us.anthropic.claude-sonnet-4-6'
export ANTHROPIC_DEFAULT_HAIKU_MODEL='us.anthropic.claude-haiku-4-5-20251001-v1:0'

Para múltiplas versões de modelo, use modelOverrides:

{
  "modelOverrides": {
    "claude-opus-4-6": "arn:aws:bedrock:us-east-2:123456789012:application-inference-profile/opus-46-prod",
    "claude-opus-4-5-20251101": "arn:aws:bedrock:us-east-2:123456789012:application-inference-profile/opus-45-prod"
  }
}

Passo 7: Habilitar AWS Guardrails (Opcional)

Crie um Guardrail no console Bedrock, publique uma versão e adicione os headers:

{
  "env": {
    "ANTHROPIC_CUSTOM_HEADERS": "X-Amzn-Bedrock-GuardrailIdentifier: your-guardrail-id\nX-Amzn-Bedrock-GuardrailVersion: 1"
  }
}

Inferência Cross-Region

Perfis de inferência cross-region (IDs prefixados com us. ou eu.) permitem que o Bedrock roteie requisições entre regiões configuradas para melhorar throughput e performance. Habilite inferência cross-region nos seus Guardrails se estiver usando esses perfis.

Cenário 2: Modelos Auto-Hospedados na AWS

Organizações que precisam executar modelos open-source ou de terceiros podem hospedá-los na sua VPC e conectar o Claude Code a esses endpoints. Isso oferece controle total sobre seleção de modelos, residência de dados e custos, mas requer gerenciamento de infraestrutura e vem com limitações de compatibilidade.

Provisionar Computação GPU

FamíliaGPUCaso de Uso
p4d / p4deNVIDIA A100 (40/80 GB)Modelos grandes (70B+)
p5NVIDIA H100Maior performance
g5NVIDIA A10GCusto-benefício (7B–34B)
inf2AWS Inferentia2Inferência otimizada

Implantar Servidor de Inferência

Seu servidor deve implementar o formato da API de Mensagens da Anthropic (/v1/messages):

  • vLLM (Recomendado): Suporte nativo ao formato Anthropic com inferência de alta vazão. O vLLM possui documentação específica para uso com Claude Code via sua API compatível com Anthropic.
  • LiteLLM Proxy: Camada de tradução para modelos que suportam apenas endpoints OpenAI.

Notas de Compatibilidade

  • Funcionalidades limitadas: Quando ANTHROPIC_BASE_URL aponta para um host não oficial, a busca de ferramentas MCP é desabilitada por padrão, a menos que o proxy encaminhe os blocos necessários.
  • Segurança do LiteLLM: Esteja ciente de que as versões 1.82.7 e 1.82.8 do LiteLLM foram sinalizadas com um aviso de segurança na documentação de gateway da Anthropic. Verifique se está usando uma versão corrigida.
  • Paridade de recursos: Modelos auto-hospedados podem não suportar todas as funcionalidades do Claude Code (como cache de prompt estendido ou uso avançado de ferramentas) que estão disponíveis via Bedrock ou API direta.

Rede e Segurança

  • Servidor de inferência em sub-rede privada via VPN ou AWS Client VPN
  • ALB interno com terminação TLS
  • Security groups restritivos + CloudWatch para monitoramento
  • AWS PrivateLink para padrões zero-trust

Configurar Claude Code

export ANTHROPIC_BASE_URL=https://your-vllm-endpoint.internal
export ANTHROPIC_AUTH_TOKEN=your-auth-token

Comparação de Cenários

DimensãoBedrock (Gerenciado)Auto-Hospedado
ComplexidadeBaixaAlta
Modelos disponíveisFamília ClaudeQualquer modelo
InfraestruturaTotalmente gerenciadaPropriedade total
CustoBaseado em uso, sem custos ociososInstância GPU sempre rodando
Paridade de recursosCompletaParcial (MCP limitado, sem cache de prompt)
Tempo até produçãoHorasDias a semanas

Rollout Enterprise

Para deployments em escala, a Anthropic documenta recursos de gerenciamento enterprise que vão além da configuração básica:

Configurações Gerenciadas pelo Servidor

Distribua configurações do Claude Code centralmente usando server-managed settings e endpoint-managed settings. Estes permitem que equipes de plataforma definam versões de modelos, políticas de autenticação e configurações de segurança que os usuários não podem substituir localmente — garantindo consistência em toda a organização.

Permissões Gerenciadas

Configure permissões gerenciadas para controlar quais ferramentas e ações o Claude Code pode executar. Isso dá às equipes de segurança controle granular sobre o que o Claude Code pode fazer no ambiente de cada desenvolvedor.

Analytics e Monitoramento

Implante dashboards de analytics para rastrear adoção, uso e ROI. O Claude Code suporta telemetria baseada em OpenTelemetry (OTel) para enviar métricas detalhadas de uso para sua stack de observabilidade.

Melhores Práticas para Produção

Perfis de Inferência de Aplicação

Use application inference profiles do Bedrock para rastreamento de custos com tags e métricas CloudWatch por equipe, projeto ou ambiente. Isso fornece visibilidade granular que tags simples do Cost Explorer não conseguem.

Cache de Prompt

O Claude Code é um caso de uso forte para prompt caching do Bedrock, que pode reduzir significativamente latência e custos para contextos de sistema repetitivos e conteúdo de codebase. Verifique a disponibilidade regional, pois o cache de prompt pode não estar disponível em todas as regiões.

Gateway LLM Enterprise

Para gerenciamento centralizado de autenticação, rate limiting e controles de custos, implante um LLM Gateway na frente do Bedrock via ANTHROPIC_BEDROCK_BASE_URL.

Telemetria OTel

Use a telemetria OpenTelemetry do Claude Code para enviar métricas de uso, latência e adoção para sua stack de observabilidade existente. Combine com perfis de inferência de aplicação para uma visão completa de custos e performance.

Segurança e Compliance

Habilite AWS CloudTrail para todas as chamadas Bedrock. Use Guardrails para filtragem de conteúdo. Para auto-hospedados, implemente logging de acesso no servidor de inferência.

Solução de Problemas

  • Problemas de região: aws bedrock list-inference-profiles --region your-region
  • Erro "On-demand throughput isn't supported": Use ID de perfil de inferência em vez de ID de modelo base.
  • Expiração de credenciais: Configure awsAuthRefresh para re-autenticação automática.
  • Endpoint auto-hospedado: Deve implementar /v1/messages. Use LiteLLM Proxy (versão corrigida) para endpoints apenas OpenAI.

Nota: O Claude Code usa a API Invoke do Bedrock e não suporta a API Converse.

Perguntas Frequentes

O Bedrock inclui o Claude na web?
Não. O Bedrock fornece acesso à API de modelo e serviços de desenvolvimento AWS. Os aplicativos Claude (web, desktop, mobile) e recursos como Projects e Artifacts estão disponíveis apenas nos planos Claude Team e Enterprise.

Preciso de aprovação para acessar modelos?
Não é uma fila de aprovação manual. Com as permissões AWS Marketplace corretas, complete o formulário de Primeiro Uso da Anthropic e o acesso é concedido imediatamente. A configuração inicial pode levar alguns minutos.

Chaves de API Bedrock são seguras para produção?
A AWS recomenda chaves de API Bedrock de longo prazo para exploração. Para produção, use credenciais temporárias (SSO, roles de instância). O acesso por chave de API é governado pela permissão bedrock:CallWithBearerToken.

O que não funciona com modelos auto-hospedados?
A busca de ferramentas MCP é desabilitada por padrão com hosts não oficiais. Cache de prompt estendido e uso avançado de ferramentas podem não estar disponíveis. Versões específicas do LiteLLM (1.82.7–1.82.8) têm alertas de segurança conhecidos.

Como a Elevata Pode Ajudar

Configurar o Claude Code é apenas o começo. Como AWS Advanced Tier Services Partner com a Competência AWS de IA Generativa, a Elevata ajuda organizações a construir a plataforma completa de desenvolvimento com IA na AWS.

  • Implantação do Claude Code — setup completo para Bedrock e auto-hospedados, incluindo LLM Gateway, IAM, configurações gerenciadas e automação de onboarding.
  • Infraestrutura de IA — dimensionamento de GPU, otimização de inferência, perfis de aplicação, cache de prompt e monitoramento OTel.
  • Design de plano híbrido — decidir onde Bedrock e Claude Team/Enterprise se encaixam e construir as integrações.
  • Elevata Orbit — engenheiros AWS sêniores sob demanda para setup, otimização e operações contínuas.

Entre em contato em elevata.io para discutir sua implantação do Claude Code, estratégia de IA ou necessidades de infraestrutura AWS.

Relacionados

Continue lendo

Leituras relacionadas a este tema.