런던에서 열린 한 컨퍼런스에서 흥미로운 발표가 있었다. AI 개발 도구에 대한 CEO들의 화려한 발언과 실제 개발 현장의 온도차를 파헤친 내용이었는데, 이 글에서는 그 핵심 내용을 정리해보려고 한다.
CEO들의 장밋빛 전망 vs 현실의 괴리
최근 AI 관련 헤드라인들을 보면 정말 화려하다. 마이크로소프트 CEO는 "전체 코드의 30%가 AI로 작성된다"고 했고, Anthropic CEO는 "1년 안에 모든 코드가 AI로 생성될 것"이라고 주장했다. 구글의 제프 딘은 "AI가 1년 안에 주니어 개발자 수준에 도달할 것"이라고 예측했다.
하지만 현실은 어떨까? 한 스타트업 엔지니어는 월 500달러짜리 자율 AI 에이전트 Devon을 사용했다가 버그 때문에 700달러의 손실을 봤다고 털어놓았다. 마이크로소프트 빌드 컨퍼런스에서는 Copilot 에이전트가 .NET 코드베이스에서 수정사항을 적용하려다 완전히 실패하는 모습이 공개되기도 했다.
이런 극명한 대조는 무엇을 의미할까? 발표자는 실제 개발자들과 대화를 통해 진짜 현실을 파악해보기로 했다.
AI 개발 도구 스타트업들의 실상
Anthropic의 경우
Anthropic 팀과의 인터뷰에서 흥미로운 사실들이 드러났다. 그들이 Claude Code에 접근권을 제공했을 때, 모든 엔지니어들이 매일 사용하기 시작했다고 한다. 더 놀라운 것은 Claude Code 제품의 90%가 Claude Code 자체로 작성되었다는 점이다.
Claude Code가 공개 출시된 지 한 달도 안 되었는데, 첫날부터 40% 사용량 증가를 보였고, 출시 이후 160% 증가를 기록했다고 한다.
Windsurf와 Cursor의 현실
Windsurf 팀은 자신들의 코드 95%가 Windsurf를 사용해서 작성된다고 주장했다. 반면 Cursor는 좀 더 솔직했다. 대략 40-50% 정도가 효과적이지만, 나머지는 그렇지 않다고 인정했다.
빅테크 기업들의 AI 도입 현황
구글의 내부 상황
구글은 모든 것이 커스텀이다. 쿠버네티스 대신 Borg를, GitHub 대신 자체 저장소를, VS Code 포크인 Cider라는 IDE를 사용한다.
구글 엔지니어들에 따르면, AI가 정말 모든 곳에 통합되어 있다고 한다. Cider IDE에 LLM이 통합되어 있고, 자동완성, 채팅 기반 IDE, 코드 리뷰 도구인 Critique에도 AI가 적용되어 있다.
특히 흥미로운 점은 구글 SRE 팀이 10배 많은 코드 라인이 프로덕션에 투입될 것을 대비해 인프라를 강화하고 있다는 것이다. 구글이 우리가 모르는 무언가를 보고 있는 것일까?
아마존의 숨겨진 강점
아마존은 AI로 잘 알려져 있지 않지만, 내부적으로는 거의 모든 엔지니어가 Amazon Q Developer Pro를 사용하고 있다고 한다. AWS 관련 코딩에 특히 뛰어나다고 평가받고 있다.
더 흥미로운 것은 아마존의 API 우선 접근법이다. 2002년부터 모든 팀이 서비스 인터페이스를 통해 데이터와 기능을 노출하도록 했는데, 이것이 MCP(Model Context Protocol) 서버를 쉽게 구축할 수 있게 만들었다. 현재 아마존 내부 도구와 웹사이트 대부분이 이미 MCP 지원을 하고 있다고 한다.
일반 스타트업과 독립 개발자들의 경험
성공 사례들
Incident.io의 Lawrence Jones는 팀원들이 AI를 적극적으로 활용해 서로 팁과 트릭을 공유하고 있다고 했다. 잘 정의된 티켓에 대해서는 에이전트가 첫 번째 패스를 만들어내는 것이 꽤 효과적이라고 한다.
Flask 프레임워크 창시자인 Armin Ronacher는 최근 "AI가 모든 것을 바꿨다"는 글을 발표했다. 6개월 전만 해도 가상 프로그래머 인턴을 이끄는 엔지니어링 리드가 되는 것을 선호한다고 하면 믿지 않았을 것이라고 고백했다.
실패 사례도 존재
한 바이오테크 AI 스타트업 엔지니어는 "여러 LLM을 실험해봤지만 정착된 것이 없다"고 솔직하게 털어놓았다. 올바른 코드를 작성하고 LLM 코드를 검토해서 문제를 수정하는 것이 더 빠르다는 것이다. 이들은 새로운 소프트웨어를 구축하고 있어서 기존 패턴에 의존하기 어려운 상황이다.
베테랑 개발자들의 관점
정말 흥미로운 것은 경험 많은 개발자들의 반응이다. PSPDF Kit 창시자인 Peter Steinberger는 "오랫동안 기술에 대해 이렇게 흥미롭고 놀라운 적이 없었다"고 했다. iOS 전문가인 그가 이제 TypeScript 같은 다른 언어로도 쉽게 코딩할 수 있게 되었다고 한다.
Django 창시자인 Simon Willison은 "코딩 에이전트가 실제로 작동한다"며 "지난 6개월간의 모델 개선이 어떤 전환점이 되었다"고 평가했다.
가장 인상적인 것은 52년간 프로그래밍을 해온 Ken Beck의 말이다. 그는 "52년 중 지금이 가장 재미있다"고 했다. LLM 덕분에 정말 야심찬 프로젝트들을 진행할 수 있게 되었다는 것이다.
남은 의문들
하지만 여전히 해결되지 않은 질문들이 있다:
1.왜 창업자와 CEO들이 엔지니어들보다 훨씬 더 열광적일까?AI 도구 회사인 Warp의 창업자조차 "시니어 엔지니어들이 AI를 잘 사용하지 않는다"고 토로했다.
2.AI 사용이 얼마나 주류가 되었을까?DX의 38,000명 개발자 대상 설문조사에 따르면, 중간 정도 조직에서는 50% 정도가 주 1회 이상 사용한다고 한다. 매일이 아니라 주 1회다.
3.실제로 얼마나 시간을 절약할까?Peter는 10-20배 생산성 향상을 말했지만, DX 설문조사에서는 주당 3-5시간 정도 절약한다고 나왔다.
4.왜 개인에게는 잘 작동하지만 팀 레벨에서는 그렇지 않을까?이것은 많은 사람들이 공통적으로 지적하는 문제다.
결론: 변화의 시작점에서
Martin Fowler는 이런 변화를 어셈블리어에서 고급 프로그래밍 언어로 넘어갔을 때와 비슷한 수준의 변화라고 평가했다. 다만 이번에는 처음으로 비결정적(non-deterministic)이라는 점이 다르다.
Ken Beck은 이를 마이크로프로세서, 인터넷, 스마트폰과 같은 수준의 변화라고 비교했다. 그는 "무엇이 싸고 무엇이 비싼지에 대한 전체 지형이 바뀌었다"며 "우리가 비싸거나 어렵다고 가정했던 것들이 터무니없이 싸져졌다"고 표현했다.
현재 상황을 종합해보면, AI 개발 도구는 분명히 어떤 전환점을 지나고 있는 것 같다. CEO들의 과장된 마케팅과 일부 실패 사례들 사이에서, 실제로는 점진적이지만 의미 있는 변화가 일어나고 있다.
특히 경험 많은 개발자들이 이 도구들에 대해 긍정적으로 반응하고 있다는 점이 주목할 만하다. 이들은 새로운 기술에 대해 회의적이었던 사람들인데, 이제는 오히려 가장 열정적인 사용자가 되고 있다.
결국 우리는 실험을 통해 무엇이 효과적이고 무엇이 그렇지 않은지 파악해야 할 시점에 있다. 스타트업들이 하고 있는 것처럼 말이다. 무엇이 싸고 무엇이 비싼지, 무엇이 가능하고 무엇이 불가능한지에 대한 기준이 완전히 바뀌고 있기 때문이다.
이런 변화의 물결 속에서 중요한 것은 맹목적인 수용도, 무조건적인 거부도 아닌 신중한 실험과 학습이다. AI 도구들이 완벽하지는 않지만, 분명히 소프트웨어 개발 방식을 바꿔놓고 있다. 이 변화를 어떻게 활용할지는 결국 우리 각자의 몫이다.