leangnews

2025년 11월 05일 09:00

자율 연구 논문 30분 완성: 오픈소스 AI ‘Denario’의 실험과 논란

자율 연구 논문 30분 완성: 오픈소스 AI ‘Denario’의 실험과 논란


기사 요약

  • 국제 연구팀이 오픈소스 AI Denario를 공개했으며, 약 30분·4달러로 아이디어부터 투고 가능한 논문 초안까지 자동 생성한다.
  • Denario는 아이디어·문헌·방법론·분석·작성·리뷰 모듈로 구성돼 코드 실행과 시각화, LaTeX 논문 작성까지 수행한다.
  • 그러나 환각 결과와 빈약한 증명 등 한계와 윤리 문제를 드러내, 인간 검증과 책임 있는 사용이 필수라는 경고를 남긴다.

개요: 다분야 자율 연구 보조원의 등장

국제 연구팀이 공개한 인공지능 시스템은 초기 아이디어에서 출판 가능한 원고 초안까지 약 30분, 한 편당 약 4달러로 생성한다. 이 시스템은 연구 아이디어 도출, 문헌 검토, 방법론 설계, 코드 작성·실행, 시각화 제작, 논문 작성과 자체 리뷰까지 수행하며, 오픈소스로 배포된다. 연구진은 과학 자동화가 아니라 과학 발견을 가속하는 ‘연구 보조원’을 목표로 삼았다고 밝혔고, 이는 대규모 언어모델의 과학 적용에서 중요한 전환점이지만 검증·저자성·과학 노동의 변화에 대한 질문도 제기한다. Denario는 이러한 목표와 한계를 동시에 보여 준다.

작동 방식: 모듈형 에이전트의 협업

아이디어 모듈: ‘아이디어 메이커’와 ‘아이디어 헤이터’의 적대적 토론

프로세스는 ‘아이디어 메이커’가 연구 주제를 제안하고 ‘아이디어 헤이터’가 실행 가능성과 과학적 가치를 혹독하게 비판하는 방식으로 시작한다. 이 반복 루프를 통해 조악한 구상이 더 견고한 연구 방향으로 정제된다.

문헌·방법론 모듈: 참신성 점검과 단계별 설계

가설이 정리되면 ‘문헌 모듈’이 Semantic Scholar 등에서 아이디어의 참신성을 조사하고, 이어 ‘방법론 모듈’이 세부 단계별 연구 계획을 수립한다. 이 설계는 이후 데이터 수집·분석의 기준점이 된다.

Denario 모듈의 실행과 자기평가: 분석·페이퍼·리뷰

‘분석 모듈’은 자체 파이썬 코드를 작성·디버깅·실행해 데이터를 분석하고 도표를 생성하며 결과를 요약한다. 이어 ‘페이퍼 모듈’이 데이터와 도표를 바탕으로 많은 과학 분야의 표준인 LaTeX 형식의 논문을 초안하고, ‘리뷰 모듈’은 AI 동료심사자처럼 강점과 약점을 비판적으로 평가한다. 이 과정은 전 단계에서 인간 연구자가 개입해 아이디어나 방법론을 교체·보완할 수 있도록 설계돼 있다.

성과와 검증

연구팀은 다양한 학문 분야에서 대량의 논문 초안을 생성해 성능을 점검했다. 특히 Denario가 전적으로 생성한 한 편의 논문이 AI 시스템 자체가 1저자로 참여하는 동료심사 학회 Agents4Science 2025에 채택됐다. 해당 논문은 암흑물질 헤일로 병합 트리 시뮬레이션을 분석하기 위해 양자물리, 머신러닝, 우주론 개념을 결합한 방법(“QITT-Enhanced Multi-Scale Substructure Analysis with Learned Topological Embeddings…”)을 제시했다.

한계, 실패 모드, 윤리적 쟁점

저자들은 이 시스템이 “큰 그림과 결과 연결 측면에서 훌륭한 학부생 또는 초급 대학원생 수준”에 가깝다고 솔직히 기술한다. 실제로 필수 수치 해법을 구현하지 않았음에도 그럴듯한 이야기에 맞춘 전체 논문을 ‘환각’한 사례가 있었고, 순수수학 문제에서는 형식상 증명처럼 보이지만 내용은 공허한 결과를 내기도 했다. 이런 취약성은 전문가의 지속적 검증, 즉 인간이 루프 안에 남아야 함을 보여 준다.

윤리적으로는 특정 정치·상업적 의제를 뒷받침하는 주장으로 학술 문헌을 급속히 범람시킬 위험이 지적된다. 또한 인간 지능을 모사하는 데 집착해 연구가 획일화되는 ‘튜링 트랩’ 우려도 제기되며, 이는 패러다임 전환적 혁신을 오히려 약화시킬 수 있다.

오픈소스 배포와 도입

시스템은 GPL-3.0 라이선스로 공개되며, 핵심 프로젝트와 그래픽 인터페이스인 DenarioApp을 포함해 GitHub에서 제공된다. 표준 파이썬 도구로 설치할 수 있고, 기업 환경의 재현성과 확장성을 위해 공식 Docker 이미지도 제공된다. Hugging Face Spaces의 공개 데모를 통해 기능을 직접 시험해 볼 수 있어 Denario의 접근성이 높다.

의미와 전망

이 도구는 숙련된 인간 전문가를 대체하기보다 코딩·디버깅·초안 작성 같은 소모적 작업을 넘겨받아 연구자의 시간과 인지를 깊은 비판적 사고와 올바른 질문 설정에 재배치하도록 돕는 ‘협업 조종사’로 자리매김한다. 자동화의 유혹을 경계하면서도, 초기 탐색과 문헌 검토를 가속해 과학적 발견의 문턱을 낮추는 방향이 바람직하다.

이 기사 공유하기