Anthropic, ‘Claude for Chrome’ 한정 베타 개시…프롬프트 인젝션 보안 우려 부각

Anthropic, ‘Claude for Chrome’ 한정 베타 개시…프롬프트 인젝션 보안 우려 부각

Anthropic, ‘Claude for Chrome’ 한정 베타 개시…프롬프트 인젝션 보안 우려 부각


기사 요약

  • Anthropic이 브라우저를 직접 조작하는 크롬 확장 프로그램 ‘Claude for Chrome’을 Max 요금제 신뢰 사용자 1,000명과 함께 연구 프리뷰 형태로 시험하며, 챗봇에서 에이전트형 시스템으로의 전환을 가속하고 있다.
  • 내부 레드팀 테스트에서 프롬프트 인젝션 등 숨겨진 지시로 유해 행동을 유도할 수 있는 취약점이 확인됐으며, 완화책 적용 전 성공률 23.6%가 11.2%로 낮아졌고 브라우저 특화 공격은 35.7%→0%로 줄었지만 여전히 불충분하다고 평가했다.
  • OpenAI(Operator)와 Microsoft(Copilot Studio)는 보다 공격적으로 시장을 선점하는 가운데, 이 기술은 RPA 대체 등 엔터프라이즈 자동화를 재편할 잠재력이 크며 HKU의 오픈소스 OpenCUA도 대안으로 부상하고 있다.

브라우저 제어 에이전트의 부상과 Anthropic의 신중한 파일럿

Anthropic은 사용자의 웹 브라우저를 직접 조작할 수 있는 크롬 확장 프로그램 ‘Claude for Chrome’을 제한된 베타로 공개했다. 샌프란시스코 본사의 이 파일럿은 Max 유료 플랜 신뢰 사용자 1,000명을 대상으로 한 연구 프리뷰로, 본격 확장 전에 핵심 보안 취약점을 점검하는 데 초점을 맞춘다. 이는 단순 문답형 챗봇을 넘어 소프트웨어 전반에서 복잡한 다단계 작업을 자율 수행하는 ‘에이전트형’ 시스템으로의 산업적 전환을 보여준다.

Claude for Chrome 파일럿: 무엇이 달라지나

Claude for Chrome은 화면 내용을 읽고, 버튼을 클릭하며, 양식을 채우고, 사이트 간을 이동하는 등 사람이 GUI를 다루는 방식을 그대로 따라 한다. 사용자는 캘린더 확인과 식당 예약 가능 시간 대조를 통한 일정 잡기, 메일함 정리와 반복 업무 처리 등 브라우저 안에서의 다양한 조치를 AI에게 위임할 수 있다. Anthropic은 “브라우저에서 이뤄지는 일이 워낙 많아, Claude가 보고-클릭-입력 기능을 갖추는 건 필연”이라고 밝혔다.

숨은 지시의 함정: 프롬프트 인젝션과 보안 리스크

내부 적대적(Adversarial) 테스트에서 Anthropic은 웹페이지·이메일·문서에 숨겨진 지시를 심어 AI가 사용자를 모르게 해로운 행동을 하도록 속이는 프롬프트 인젝션 위험을 확인했다. 완화책 적용 전, 브라우저 사용자 에이전트를 겨냥한 공격의 성공률은 23.6%였고, 악성 이메일이 “메일함 위생”을 명목으로 전체 메일 삭제를 지시하자 AI가 추가 확인 없이 실행한 사례도 있었다. 회사는 “레드팀 실험 결과 실제로 우려스러운 수치가 확인됐다”고 인정했다.

브라우저 특화 공격과 완화

숨겨진 폼 필드나 URL 조작을 활용한 브라우저 특화 공격에 대해서는 신규 완화책으로 성공률을 35.7%에서 0%로 낮췄다. 다만 실세계 웹 환경의 복잡성은 훨씬 크며, 새로운 공격 벡터가 계속 등장한다는 점에서 방어 체계의 지속적 개선이 필요하다고 강조했다.

경쟁 구도: OpenAI와 Microsoft의 ‘공격적’ 행보

Anthropic의 신중함과 달리, OpenAI는 월 200달러 ChatGPT Pro에 ‘Operator’ 에이전트를 공개해 콘서트 예매, 장보기, 여행 일정 계획 등 컴퓨터 사용 작업을 폭넓게 자동화하고 있다. Microsoft는 Copilot Studio에 웹/데스크톱 UI 자동화 기능을 통합해 전통 RPA의 차세대 대안으로 포지셔닝했다. 빠른 출시로 초기 점유를 노리는 전략과, 안전성 검증을 우선하는 전략이 첨예하게 대비된다.

엔터프라이즈 자동화의 재편: RPA를 넘어

컴퓨터-제어형 AI는 API 통합 없이도 GUI만 있으면 어떤 소프트웨어든 다룰 수 있어, 인터페이스 변경에 취약하고 비용이 큰 기존 맞춤 연동·RPA를 대체할 잠재력이 크다. Salesforce의 CoAct-1 연구는 포인트-앤-클릭과 코드 생성을 결합한 하이브리드 접근으로 복잡 작업에서 60.76% 성공률을 기록하며 순수 GUI 기반 에이전트보다 적은 단계로 효율을 보였다. Salesforce의 Ran Xu는 “완전한 API 접근이 보장되지 않는, 다수 도구를 엮는 복잡 프로세스 자동화가 핵심”이라고 설명했다.

오픈소스 대안의 등장: HKU OpenCUA

빅테크 중심의 독점 모델 일변도에 맞서 홍콩대는 OpenCUA를 공개했다. Windows·macOS·Ubuntu 전반에서 22,600건 이상의 인간 시연 데이터를 학습한 이 프레임워크는 오픈소스 중 최고 성능을 보이며 상용 선도 시스템과도 대등하게 경쟁했다. 폐쇄형 시스템 의존을 꺼리는 기업의 도입 문턱을 낮출 수 있는 변수다.

Claude for Chrome 보안 테스트: 완화책과 한계

Anthropic은 사이트 단위 접근 권한, 결제·개인정보 공유 등 고위험 행위에 대한 필수 확인, 금융·성인물 등 특정 카테고리 접근 차단 등 다층 보호를 적용했다. 그 결과 자율 모드에서 프롬프트 인젝션 성공률을 23.6%에서 11.2%로 줄였다. 그러나 광범위 배포에 충분할 만큼 낮지는 않다는 평가로, 파일럿을 통해 권한 모델을 고도화하고 정책을 정교화할 계획이다. Anthropic은 “공격자들은 끊임없이 새로운 프롬프트 인젝션 기법을 개발하고 있다”고 경고했다.

전망: 사람-컴퓨터 상호작용의 재정의

여러 선도 기업이 ‘클릭하고 타이핑하는’ 에이전트로 수렴하는 흐름은 기존 소프트웨어를 바꾸지 않고도 AI가 바로 위에 얹히는 상호운용성의 전환점을 시사한다. 이는 AI 도입 장벽을 낮추는 동시에, 맞춤 통합이나 RPA에 투자해온 기업 전략을 흔들 수 있다. 기회를 선점한 기업은 자동화 우위를 확보할 수 있지만, Claude for Chrome 사례가 보여주듯 보안 성숙도는 여전히 관건이다. Anthropic은 “Claude와 함께 일하는 방식의 새로운 가능성을 열 것”이라며, 안전성 문제를 풀어가는 과정 속에서 신중한 확장을 이어가겠다고 밝혔다.

핵심 포인트

Claude for Chrome의 제한적 파일럿은 보안 검증을 위한 단계적 접근이며, 완화책에도 불구하고 프롬프트 인젝션 리스크는 잔존한다. 동시에, 이 기술은 엔터프라이즈 자동화 판도를 바꿀 잠재력이 크다.