AWS 위클리 라운드업 정리: FinOps Agent 프리뷰, Bedrock의 Gemma 4, Kiro Pro Max
이번 주 뉴욕시에서 AWS Summit이 열렸고, 6월 17일에는 Swami Sivasubramanian와 Chet Kapoor가 진행하는 키노트 라이브스트림이 예정되어 있습니다. 개발자 도구, AI 인프라, 보안 영역의 새 기능을 다룹니다. 그 외에도 이번 주와 지난주에 비용 관리, 모델, 인스턴스, 관측성 쪽에서 살펴볼 만한 발표가 여러 건 나왔습니다. 고객 환경에 직접 영향을 줄 수 있는 항목들을 중심으로 정리합니다.
비용 질문에 답하는 AWS FinOps Agent (프리뷰)
AWS FinOps Agent가 프리뷰로 공개됐습니다. FinOps 담당자와 엔지니어링 팀을 대상으로 하는 에이전트로, 비용에 대한 질문에 답하고 최적화 기회를 찾아주며, 비용 이상 징후를 조사하고, 정해진 일정에 따라 반복적인 FinOps 워크플로를 실행합니다.
구체적으로는 AWS 비용을 질의하고, 재무 팀과 엔지니어링 팀을 위한 비용 리포트를 생성할 수 있습니다. 권장 사항은 AWS Cost Optimization Hub와 AWS Compute Optimizer에서 가져오며, 라이트사이징, 유휴 리소스, Savings Plans 관련 추천을 표면화합니다. 이 추천을 바탕으로 사용자를 대신해 Jira 티켓을 생성할 수도 있습니다. 비용 이상이 감지되면 근본 원인을 자동으로 조사하고 그 결과를 Slack 채널에 게시합니다.
비용 질의와 리포트 생성에 더해, 추천 사항이 곧바로 Jira 티켓으로 이어지고 이상 징후 조사 결과가 Slack에 게시되는 흐름이라, 정기적인 비용 점검 작업을 사람이 매번 수동으로 돌리지 않아도 됩니다. 프리뷰 단계이며, 지원 리전과 사용 조건 등 세부 사항은 AWS 공식 문서에서 확인할 수 있습니다.
Amazon Bedrock에 추가된 Gemma 4
Google DeepMind의 Gemma 4 제품군이 Amazon Bedrock에서 사용 가능해졌습니다. 세 가지 변형으로 제공됩니다.
- Gemma 4 31B: dense 아키텍처, 256K 토큰 컨텍스트 윈도, 추론과 코딩 워크로드에 적합합니다.
- Gemma 4 26B-A4B: mixture-of-experts 아키텍처로, 비용과 지연 시간에 민감한 워크로드를 겨냥합니다.
- Gemma 4 E2B: 가장 작은 변형으로, 저지연 인터랙티브 사용 사례를 위해 설계됐습니다.
세 변형 모두 네이티브 함수 호출, 구조화된 출력, 추론, 응답 스트리밍을 지원합니다. 입력은 텍스트, 이미지, 비디오, 오디오를 아우르는 멀티모달이며, 35개 이상의 언어를 지원합니다. 워크로드 성격에 따라 컨텍스트 길이가 중요한 경우 31B, 비용과 지연에 민감하면 26B-A4B, 가벼운 인터랙티브 응답이면 E2B를 선택하는 구분이 가능합니다.
Claude Fable 5: 출시와 접근 철회 안내
Anthropic Claude Fable 5는 6월 9일 Amazon Bedrock에 출시됐습니다. 확장된 비동기 작업 실행, 다이어그램·차트·PDF에 걸친 고급 비전 기능, 사전 자기 검증 기능을 제공합니다. 모델을 호출하기 전에 Data Retention API를 통해 데이터 공유에 옵트인해야 하며, Anthropic은 Mythos 등급 모델에 대해 입력과 출력의 30일 보관을 요구합니다.
다만 접근 가능 여부에 중요한 변동이 있습니다. 6월 12일, Anthropic은 미국 정부 수출 통제 지침 준수를 위해 모든 사용자에 대한 Claude Fable 5와 Claude Mythos 5 접근을 철회해 달라고 AWS에 요청했습니다. Opus 4.8을 포함한 다른 모든 모델은 영향을 받지 않습니다. 자세한 내용은 Anthropic 성명에서 확인할 수 있으며, AWS는 추가 업데이트가 나오는 대로 공유할 예정입니다. 따라서 현재 Fable 5 도입을 검토 중이라면 이 접근 철회 상태를 먼저 확인해야 합니다.
Graviton5 기반 EC2 M9g와 M9gd 정식 출시
AWS Graviton5 프로세서로 구동되고 6세대 AWS Nitro System 위에 구축된 M9g와 M9gd 인스턴스가 정식 출시됐습니다. Graviton4 기반 인스턴스 대비 컴퓨팅 성능이 최대 25% 향상되며, 웹 애플리케이션은 최대 35%, 머신러닝 추론은 최대 35%, 데이터베이스는 최대 30% 더 빠른 성능을 제공합니다.
Graviton5는 AWS 플릿에서 PCIe Gen6와 DDR5-8800 메모리를 지원하는 첫 프로세서이며, 이전 세대 대비 5배 큰 L3 캐시를 갖췄습니다. M9g와 M9gd는 M8g와 비교해 평균적으로 네트워크 대역폭이 최대 15%, Amazon EBS 대역폭이 20% 더 높습니다.
이번 릴리스에서는 Nitro Isolation Engine도 도입됐습니다. 형식 검증(formal verification)을 사용해 가상 머신 간 격리를 수학적으로 증명하는 Nitro System의 개선 기능으로, Nitro를 형식 검증된 첫 클라우드 하이퍼바이저로 만듭니다. M9gd는 최대 11.4TB의 NVMe SSD 로컬 스토리지를 추가하며 M8gd 대비 IOPS가 30% 높습니다. 두 인스턴스 유형 모두 Instance Bandwidth Configuration(IBC)을 지원해 EBS와 VPC 네트워킹 간 대역폭 할당을 최대 25%까지 조정할 수 있습니다.
OpenSearch Service의 MCP Apps로 에이전트 기반 관측성
Amazon OpenSearch Service가 MCP Apps를 지원합니다. Claude Desktop과 VS Code를 포함한 호환 에이전트 IDE 안에서 관측성 워크플로를 수행할 수 있습니다. 로컬 환경의 AI 에이전트가 OpenSearch 도메인과 컬렉션, Amazon Managed Service for Prometheus에 저장된 로그, 트레이스, 메트릭, 알림을 사용해 인시던트를 조사합니다.
각 MCP App 도구 호출은 이중 응답을 돌려줍니다. 에이전트가 추론에 사용할 텍스트 요약과, 같은 대화 스레드 안에 렌더링되는 인터랙티브 시각화입니다. 제공되는 도구는 로그·메트릭·트레이스 조사, 서비스 성능, 토폴로지, 동적 시각화, 에이전트 상태, 클러스터 상태, 계측 점수를 포괄합니다.
개발 팀을 위한 Kiro Pro Max
Kiro가 새로운 Pro Max 등급을 추가했습니다. 더 높은 사용 한도, 최신 프런티어 모델 접근, 개발 팀을 위한 추가 에이전트 기능을 제공합니다. 코딩, 명세 생성, 에이전트 주도 작업 전반에서 지속적으로 대량의 사용이 필요한 전문 개발자를 위한 등급입니다.
운영에서 챙겨야 할 두 가지 변경
AWS CLI v1이 유지보수 모드로 진입합니다. 유지보수 모드에서는 botocore와 s3transfer 의존성이 별도 패키지로 설치되는 대신 CLI v1 코드베이스에 직접 벤더링됩니다. 이에 따라 CLI v1을 업그레이드해도 독립형 botocore나 s3transfer 패키지는 더 이상 갱신되지 않으며, 이 패키지들을 따로 설치해도 CLI v1이 사용하는 버전에는 영향을 주지 않습니다. CLI v1과 boto3가 함께 설치된 환경에는 이 라이브러리들의 사본이 각각 별도로 존재하게 됩니다. 새 CLI v1 릴리스는 중대한 버그 수정과 보안 이슈로 제한되며, 권장 경로는 AWS CLI v2로의 마이그레이션입니다.
AWS Workload Credentials Provider도 새로 출시됐습니다. 장기 액세스 키 없이 워크로드가 단기 AWS 자격 증명을 얻도록 해주는 기능입니다. AWS 외부에서 실행되는 애플리케이션의 자격 증명 관리를 지원해, 서드파티나 온프레미스 환경의 워크로드에 최소 권한 접근 패턴을 적용할 수 있게 합니다.
프런티어 팀의 AI 네이티브 개발 사례
Swami가 수백 개 Amazon 엔지니어링 팀의 실험 데이터를 바탕으로 한 글을 게시했습니다. 6인 엔지니어 팀이 원래 30명이 12~18개월에 걸쳐 진행할 것으로 산정됐던 Amazon Bedrock 추론 엔진을 76일 만에 재구축한 사례가 담겼습니다. Amazon Stores 팀과 진행한 구조화된 파일럿에서 정규화된 배포 속도의 중간값 생산성 향상은 4.5배였고, 일부 팀은 10배를 넘겼습니다. Perfect Order Experience는 2주 기능 주기에서 오후 한나절 배포로, WW Grocery는 설계 문서 작성을 5일에서 몇 시간으로 단축했습니다.
이 글은 프런티어 팀이 되기 위한 다섯 가지 실천을 제시합니다. 첫째, 에이전트 컨텍스트에 투자해 프로덕션 코드를 작성하기 전에 스티어링 파일, 코딩 표준, 구조화된 리포지토리를 갖춥니다. 둘째, 워크플로를 재구성하는 동안의 초기 속도 저하를 예상하고 그 구간을 통과합니다. 셋째, 잘 정의된 작업을 꾸준히 백로그에 유지해 에이전트가 상시 감독 없이 병렬로 실행되도록 합니다. 넷째, 코드 생성 전에 구조화된 명세로 의도를 명시합니다. 다섯째, 테스트를 앞당겨 에이전트가 코드가 파이프라인에 도달하기 전에 스스로 교정하도록 합니다. 커밋 속도는 전체 그림의 일부일 뿐이며, 릴리스 관리와 운영, 보안 운영, EOL 업그레이드를 다루는 후속 글이 예고됐습니다.
일정과 추가 정보
다가오는 AWS Summit은 뉴욕시(6월 17일), 홍콩(6월 17일), 상하이(6월 23~24일), 일본(6월 25일), 워싱턴 D.C.(6월 30일~7월 1일), 타이베이(7월 15일), 보고타(7월 30일)에서 열립니다. AWS Community Day는 몬트리올(6월 20일), 인디애나폴리스(6월 24일), 항저우(6월 28일), 벵갈루루(7월 11일), 야운데(7월 25일)에서 예정되어 있습니다.
각 서비스의 지원 리전, 요금, 사용 조건 등 세부 사항은 AWS 공식 문서에서 확인할 수 있습니다. 특히 FinOps Agent는 프리뷰 단계이고, Claude Fable 5는 현재 접근이 철회된 상태이므로 도입 검토 시 최신 상태를 먼저 확인하는 것이 좋습니다.
원문: AWS Weekly Roundup: AWS FinOps Agent in preview, Gemma 4 on Bedrock, Kiro Pro Max, and more (June 15, 2026) · 발행일 2026-06-15