지난주 아마존 쇼핑몰이 6시간 동안 먹통이 됐다. 결제도 안 되고, 상품 페이지도 안 열리고, 계정 정보도 못 보는 수준. Downdetector 기준 22,000명 이상이 장애를 신고했다.
원인을 추적해보니 AI 코딩 도구로 만든 코드가 문제였다. 아마존 내부에서 "high blast radius"라고 표현했는데, 영향 범위가 너무 넓었다는 뜻이다. AWS 쪽에서도 비슷한 사고가 두 건 더 있었다고.
결국 아마존 이커머스 수석 부사장 Dave Treadwell이 엔지니어 전원을 소집해서 긴급 미팅을 열었다. 내부적으로 TWiST(This Week in Stores Tech)라는 주간 미팅인데, 이번에는 AI 관련 장애를 집중적으로 다뤘다. 그리고 새 정책이 나왔다. 주니어, 미드레벨 엔지니어가 AI로 만든 코드 변경사항은 반드시 시니어 엔지니어가 승인해야 배포할 수 있게 됐다.
코드 리뷰야 원래 있던 프로세스지만, "AI가 만든 코드"에 대해 별도 승인 절차를 둔 건 처음이다.
나도 지금 Claude Code로 거의 매일 코딩하고 있어서 이 뉴스가 좀 와닿았다. 교육 앱을 React Native + Python으로 만들고 있는데, 바이브 코딩으로 속도는 확실히 빠르다. 근데 가끔 AI가 짜준 코드를 그대로 머지했다가 예상 못한 사이드 이펙트가 나온 적이 있다. 규모가 작아서 바로 잡았지만, 아마존 규모에서는 6시간짜리 장애가 되는 거다.
아마존 내부 브리핑 노트에는 "아직 GenAI 활용에 대한 베스트 프랙티스와 안전장치가 충분히 확립되지 않았다"는 표현이 있었다고 한다. AI 코딩의 가이드라인이 아직 안 잡혀있다는 걸 회사 차원에서 인정한 거다.
일론 머스크도 이 소식에 "proceed with caution"이라고 반응했다고 Fortune이 전했다.
개인적으로 AI 코딩하면서 지키는 것들이 있다.
AI가 만든 코드는 내가 100% 이해한 상태에서만 커밋한다. 프로덕션 배포 전에는 반드시 테스트를 돌린다. AI 코드라 빨리 나오니까 테스트를 건너뛰는 유혹이 있는데, 그걸 참아야 한다. 인프라나 DB 스키마 변경처럼 영향 범위가 큰 작업은 AI한테 맡기되 더 꼼꼼하게 검토한다.
AI 코딩 도구가 생산성을 올려주는 건 맞다. 근데 그만큼 리뷰의 중요성도 같이 올라간다. 아마존 정도 되는 곳에서 이런 사고가 터졌다는 건, 어디서든 터질 수 있다는 뜻이다.
출처: Ars Technica, CNBC, Tom's Hardware
'AI' 카테고리의 다른 글
| AI로 앱 개발이 쉬워지면 구독 모델이 죽는다 (0) | 2026.03.10 |
|---|---|
| GPT-5.4 나왔다. 컴퓨터를 직접 쓰는 모델. (0) | 2026.03.10 |