leangnews

2026년 01월 30일 14:02

구글 연구: ‘사고의 사회’ 내부 토론이 복잡한 추론·계획 정확도 크게 높인다

구글 연구: ‘사고의 사회’ 내부 토론이 복잡한 추론·계획 정확도 크게 높인다


기사 요약

  • 구글 연구에 따르면 강화학습을 거친 추론 모델은 내부에서 다중 에이전트형 토론(사고의 사회)을 자발적으로 시뮬레이션해 복잡 과제 정확도를 크게 높인다.
  • 단순히 체인을 길게 쓰는 것보다 관점 다양화, 가정 검증, 백트래킹, 대안 탐색 같은 사회적 추론 습성이 성능 향상을 이끈다.
  • 기업은 갈등 유도형 프롬프트, 사회적 확장 설계, ‘깨끗한’ 데이터 집착 완화, 내부 논쟁 노출, 오픈웨이트 전략을 통해 더 강건한 LLM을 구축할 수 있다.

요약: 내부 토론이 성능을 끌어올리다

구글의 새 연구는 고급 추론 모델이 다양한 관점·성향·전문성을 지닌 내적 페르소나 간 논쟁을 시뮬레이션함으로써 복잡한 추론과 계획 과제에서 높은 성능을 보인다고 보고한다. 연구진은 이 내부 토론을 ‘사고의 사회’(society of thought)라 부르며, DeepSeek-R1과 QwQ-32B 같은 강화학습(RL) 기반 모델에서 별도 지시 없이도 자발적으로 나타난다고 밝혔다.

‘사고의 사회’란 무엇인가

핵심 가설은 추론 모델이 사회적, 다중 에이전트 대화를 모사해 논리를 정련한다는 것이다. 인지과학의 통찰처럼 인간의 이성은 본래 토론과 상호 반박을 통해 진화했으며, 전문성과 성격의 차이에서 비롯된 인지적 다양성이 진성의 반대 의견과 함께할 때 문제 해결을 강화한다. 모델은 내부 페르소나 간 대화를 통해 검증과 백트래킹 같은 필수 점검을 수행해 편향이나 아첨성 응답을 피한다. DeepSeek-R1 같은 모델에서는 이 ‘사고의 사회’가 체인 오브 소트 내부에서 자연히 드러나며, 별도의 모델이나 프롬프트 없이 단일 인스턴스의 추론 과정에서 논쟁이 자율적으로 형성된다.

어떻게 성능이 향상되는가

연구는 단순히 체인을 길게 쓰는 것이 정확도를 올린다는 통념을 반박한다. 대신 서로 다른 렌즈로 보기, 초기 가정의 재검증, 실패 경로의 백트래킹, 대안 모색 같은 다양한 사회적 행동이 성능을 끌어올린다. 연구진은 모델의 활성화 공간을 조정해 ‘대화적 놀람’을 유도했을 때 더 넓은 성격·전문성 특성이 활성화되며 복잡 과제 정확도가 두 배로 뛰는 것을 확인했다. 이는 정답 지향적 보상에 의해 RL 과정에서 사회적 추론이 자발적으로 출현함을 시사한다. 일방 독백 자료로 학습한 모델은, 자연스럽게 다중 에이전트 대화를 형성한 순수 RL 대비 성능이 낮았고, 반대로 다자 대화·토론 데이터로 감독미세조정(SFT)한 경우 표준 체인 오브 소트 SFT보다 크게 앞섰다.

실제 적용 예시

유기화학 합성 문제: ‘기획자’와 ‘비판 검증자’의 충돌

복잡한 합성 경로 문제에서 DeepSeek-R1은 내부적으로 ‘기획자’와 ‘비판 검증자’ 등 상이한 페르소나의 논쟁을 시뮬레이션했다. 기획자가 정석 경로를 제안하자, 높은 성실성과 낮은 친화성을 지닌 검증자가 가정을 반박하고 새로운 사실로 반론했다. 이 적대적 점검을 통해 오류를 찾아 관점을 조정하고 올바른 합성 경로로 수정했다. 이러한 상호 반박은 ‘사고의 사회’가 실제 오답을 줄이는 방식의 전형적 예다.

문장 리라이팅: 창의 발상가 vs 의미 충실 검사자

“I flung my hatred into the burning fire” 문장을 다듬는 과제에서 모델은 ‘창의 발상가’와 ‘의미 충실 검사자’ 간 협상을 모사했다. 발상가가 “deep-seated”를 제안하자 검사자는 원문에 없는 개념을 추가한다며 제동을 걸었다. 최종 결과는 원뜻을 유지하면서도 표현을 개선한 절충안으로 수렴했다.

수학 퍼즐 카운트다운: 방법론자와 탐색가의 분업

학습 초반 모델은 독백으로 문제를 풀려 했으나, RL을 거치며 계산을 수행하는 ‘방법론적 문제 해결자’와 진행을 감시하며 전략 전환을 촉발하는 ‘탐색적 사상가’로 자발적 분화가 일어났다. “다시 실패… 음수 활용을 시도하자” 같은 개입이 실패 경로를 끊고 새로운 시도를 유도해 정답 도달 가능성을 높였다.

기업을 위한 시사점

갈등 유도형 프롬프트 엔지니어링

일반 목적 모델에도 ‘사고의 사회’ 구조를 촉발하는 프롬프트가 유효하다. 단, “스스로 토론하라”는 막연한 지시는 부족하다. 논문 공저자 제임스 에번스가 강조하듯, 상반된 성향과 목표(예: 리스크 회피 준법 담당자 vs 성장 지향 제품 관리자)를 부여해 필연적 논쟁을 만들고 대안을 분간하도록 설계해야 한다. 가벼운 ‘놀람’ 유도 신호만으로도 우월한 추론 경로가 활성화될 수 있다.

사회적 확장을 고려한 테스트타임 설계

생각하는 시간을 늘릴 때 이를 사회적 과정으로 구조화하라. 1인 다역의 ‘우리’ 관점, 자문자답, 명시적 대안 토론을 거쳐 합의에 도달하도록 앱 흐름을 설계하면, 멀티에이전트 시스템으로도 확장되어 상이한 페르소나 간 비판적 논쟁이 더 나은 결정을 낳는다.

데이터 ‘정화’ 집착을 멈추기

완벽한 정답 경로만 남긴 ‘골든 앤서’ 데이터는 오히려 역효과일 수 있다. 다자 토론과 해결 대화로 미세조정한 모델이 깔끔한 독백 데이터보다 훨씬 빠르게 추론을 개선했다. 심지어 틀린 결론으로 끝난 토론도, 이후 강화 단계에서 정답 강화와 맞먹는 효과를 보였다. 기업은 어수선한 엔지니어링 로그나 슬랙 스레드를 버리지 말라. 그 ‘지저분함’이 탐색 습관을 학습시키는 토양이다.

신뢰와 감사를 위한 내부 논쟁 노출

고위험 업무에서는 정답 제시만으로 충분치 않다. 사용자가 내부 이견을 확인할 수 있어야 출력을 신뢰한다. 인터페이스 차원에서 내적 논쟁을 체계적으로 드러내 사용자 참여적 보정이 가능하도록 하라. 이는 ‘사고의 사회’를 가시화하여 품질과 신뢰성을 동시에 높인다.

오픈웨이트의 전략적 가치

많은 상용 추론 모델은 체인 오브 소트와 내부 토론을 비공개로 두지만, 감사 가능성과 규제 대응이 필요한 산업에서는 내부 반대와 근거의 투명성이 경쟁력이다. 완전한 투명이 확보되기 전까지는 오픈웨이트가 ‘결정’뿐 아니라 ‘이견’을 볼 수 있는 실질적 이점을 제공한다.

맺음말

연구는 AI 아키텍트의 역할이 순수 모델링을 넘어 조직심리학에 가까운 ‘소집단·조직 설계’로 확장되고 있음을 시사한다. ‘사고의 사회’를 촉진하는 데이터, 프롬프트, 인터페이스, 거버넌스 설계를 통해 차세대 성능 클래스를 여는 것이 가능해지고 있다.

이 기사 공유하기