leangnews
Command Palette
Search for a command to run...
2025년 10월 10일 02:00
MIT의 ‘AI 95% 실패’ 오판? G2가 밝힌 AI 에이전트 ROI의 현실
기사 요약
- G2 조사에 따르면 기업의 약 60%가 생산 환경에서 에이전트를 운영하며 배포 후 실패율은 2% 미만이다.
- 인간 검증을 포함한 운영 모델이 완전 자율보다 비용 절감 달성 가능성이 높았고, 저위험 업무에는 자율 허용이 확산 중이다.
- 보안 사고 경험 비율이 39%에 달해 설명가능성과 IT 운영 참여, 밀리초 단위 재훈련 등 신뢰·거버넌스가 핵심으로 부상했다.
MIT 95% 실패 담론 재검증: 엔터프라이즈 ROI와 AI 에이전트
MIT 연구가 95% 실패라는 인상을 퍼뜨렸지만, G2의 최신 데이터는 상반된 현실을 보여준다. G2는 세계 최대급 소프트웨어 리뷰 플랫폼으로, 1,300명 이상의 B2B 의사결정자 조사를 통해 실제 도입·운영 추세를 집계했다. 현재 기업의 약 60%가 생산 환경에 에이전트를 배치했고, 배포 후 실제 실패율은 2% 미만으로 확인됐다. 공개 발표 중심의 학술 분석과 달리, 폐쇄루프 운영 데이터는 ROI 창출과 지속 사용성을 뒷받침한다.
도입 현황과 성과 지표: AI 에이전트 확산
조사에 따르면 57%가 생산 환경 운용, 70%는 에이전트를 ‘핵심 운영’으로 규정했다. 성과에 만족한다는 응답은 83%였고, 기업은 연간 평균 100만 달러 이상을 투자(4곳 중 1곳은 500만 달러 이상)했으며, 10곳 중 9곳이 향후 12개월 투자 확대를 계획했다. 비용 40% 절감, 워크플로 23% 가속, 특히 마케팅·세일즈에서 3곳 중 1곳이 50% 이상 속도 향상을 보고했고, 배치 부서의 직원 만족도도 90%에 육박해 높았다.
에이전트 운영 모델: ‘Let it rip’와 인간 검증의 균형
샌더스는 3곳 중 1곳이 이른바 ‘Let it rip’ 방식을 택해 에이전트에게 먼저 실행을 맡기되, 오류 시 즉시 롤백하거나 신속한 QA로 회수했다고 설명했다. 반면 인간 검증을 포함한 프로그램은 완전 자율 전략보다 75% 이상 비용 절감을 달성할 가능성이 두 배 높았다. 응답자의 절반 이상은 예상보다 강한 인간 관여가 있었다고 답했지만, IT 구매자의 절반가량은 데이터 정제·파이프라인 관리 등 저위험 워크플로에는 완전 자율을 허용할 의향이 있었다. BI·리서치는 최종 판단을 위한 사전 준비 작업으로, 모기지 대출 심사처럼 에이전트가 분석·정리를 완료하고 마지막 승인·반려는 사람이 맡는 형태가 신뢰를 높였다.
AI 에이전트 생태계와 배포 전략: Agentforce 38%
배포 방식에서는 Salesforce의 Agentforce가 38% 점유로 기성 에이전트와 사내 구축을 앞서가 우세했다. 많은 조직이 단기적으로는 하이브리드를 택해 궁극적으로 사내 도구를 세우려 하며, 신뢰할 수 있는 데이터 원천을 위해 Microsoft, ServiceNow, Salesforce 등 기록 시스템을 보유한 업체로 수렴할 것으로 전망됐다.
왜 지금 에이전트인가: 파킨슨의 법칙과 QA 속도
파킨슨의 법칙이 말하듯 일은 주어진 시간만큼 팽창한다. 인간은 마감에 좌우되지만 에이전트는 쉬지 않고 산만해지지 않는다. 데드라인을 바꾸지 않아도 지속적으로 처리를 이어가며, 자동화된 검증까지 포함한 더 빠른 QA 사이클에 집중하면 사람보다 에이전트를 더 신속히 고도화할 수 있다.
AI 에이전트 신뢰·보안 거버넌스: 설명가능성 우선
보안·신뢰 이슈도 분명하다. 응답자의 39%는 도입 후 보안 사고를 경험했고, 그중 25%는 심각했다. 기업은 잘못된 행동을 다시는 반복하지 않도록 에이전트를 재훈련하는 시간을 밀리초 단위로 측정해야 한다. 배포에는 반드시 IT 운영을 참여시켜 생성형 AI·RPA에서의 실패 원인과 설명가능성 문제를 짚어야 한다. 한편 벤더를 맹신해서는 안 된다. 응답자의 절반만이 벤더를 신뢰했고, 최우선 신뢰 신호는 설명가능성이었다. 그는 ‘설명하지 못하면 배포·운영할 수 없다’는 현장의 목소리를 전하며, 가장 큰 비즈니스 문제부터 역으로 접근하라고 조언했다. 아픈 과제에 먼저 적용하면 내부 사용자는 사고에 더 관대하고 개선에도 적극적이 되며, ‘신뢰는 당나귀를 타고 온다’는 말처럼 서서히 축적된다.