leangnews

2026년 01월 06일 15:02

엔비디아 Cosmos Reason 2, 물리적 AI로 추론형 VLM을 현실화

엔비디아 Cosmos Reason 2, 물리적 AI로 추론형 VLM을 현실화


기사 요약

  • 젠슨 황은 물리적 AI 시대를 선언했고, CES 2026에서 엔비디아는 에이전트를 물리 세계로 확장하는 신규 모델군을 공개했다.
  • Cosmos Reason 2는 2차원 온톨로지를 바탕으로 로봇이 다음 행동을 계획하도록 돕고, 기업 맞춤형 활용 유연성을 강화했다.
  • 엔비디아는 Gr00t와 Nemotron 계열, Nemotron Speech·RAG·Safety 등 오픈 모델 생태계로 데이터·추론·훈련을 통합하겠다는 구상을 밝혔다.

물리적 AI 전환과 엔비디아 전략

엔비디아는 “소프트웨어 속 AI”를 넘어 로봇과 자율주행 등 물리 세계의 에이전트로 영역을 넓히고 있다. CES 2026에서 공개된 새로운 모델군은 채팅형 인터페이스를 넘어 실제 환경에서 작동하는 에이전트를 목표로 한다. 구글의 PaliGemma와 미스트랄의 Pixtral Large처럼 시각 입력을 처리하는 VLM이 늘고 있지만, 상용 모델 모두가 고도 추론을 지원하는 것은 아니다. 엔비디아는 로보틱스가 단일 업무에 특화된 ‘전문가형’에서 폭넓은 지식과 과업별 깊은 숙련을 겸비한 ‘제너럴리스트 스페셜리스트’로 전환하는 분기점에 있다고 진단한다.

Cosmos Reason 2로 여는 물리적 AI 시대

엔비디아의 최신 비전-언어 모델은 체화된 추론(embodied reasoning)을 전제로 설계돼, 디지털 워크플로우에서 에이전트가 단계별로 추론하듯 물리 환경에서도 다음 행동을 계획하도록 돕는다. 이 모델은 로봇이 예측 불가능한 현실 공간을 안전하고 유연하게 탐색하도록 설계되었으며, 기업 환경에서 애플리케이션을 맞춤 구성할 수 있도록 옵션을 넓혔다.

Cosmos Reason 2의 핵심 업데이트와 활용

Cosmos Reason 2는 전작이 선보인 2차원 온톨로지를 계승·확장했다. 전작은 ‘비디오 물리 추론’ 리더보드에서 선도 성능을 보였고, 이번 버전은 그 기반 위에 기업 맞춤 기능과 행동 계획 능력을 강화했다. 아울러 로봇 학습용 시뮬레이션을 생성하는 모델 ‘Cosmos Transfer’의 신규 버전도 공개돼, 데이터 수집부터 훈련·검증에 이르는 로보틱스 파이프라인을 가속할 수 있게 됐다.

에이전틱 AI를 뒷받침하는 오픈 모델 생태계

엔비디아 로드맵의 핵심은 “모델을 넘어 시스템으로”다. 대규모 연산 자원과 세계를 모사하는 시뮬레이션, 학습의 연료가 되는 다양하고 개방된 데이터셋, 그리고 오픈 라이브러리와 학습 스크립트, 배포용 블루프린트까지 통합 제공해 개발자가 목적에 맞는 에이전트를 구성하도록 지원한다. 이렇게 축적된 자산을 디지털과 물리 세계의 에이전트가 공유하는 기업용 생태계로 묶겠다는 전략이다.

Cosmos Transfer, Gr00t, Nemotron 확장

엔비디아는 물리적 AI를 위한 Cosmos 계열과 로보틱스 도메인에 더해, 오픈 추론 VLA(비전-언어-액션) 모델 Gr00t, 에이전틱 AI용 Nemotron 계열을 전개한다. 서로 다른 분과의 오픈 모델을 한데 엮어 데이터·훈련·추론을 순환시키고, 현장 로봇부터 소프트웨어 에이전트까지 재사용 가능하도록 하는 것이 목표다. 이 흐름의 중심에는 Cosmos Reason 2를 포함한 체화 추론 모델군이 있다.

Nemotron Speech·RAG·Safety의 역할

엔비디아는 12월 공개한 에이전틱 추론 모델 ‘Nemotron 3’에 이어, Nemotron Speech·RAG·Safety를 추가했다. Nemotron Speech는 라이브 자막·음성 AI를 위한 초저지연 음성 인식을 제공하며, 엔비디아에 따르면 동급 모델 대비 최대 10배 빠르다. Nemotron RAG는 임베딩 모델과 재순위(rerank) 모델의 2종으로 구성되며, 이미지까지 이해해 데이터 에이전트에 멀티모달 통찰을 제공한다. 또한 MMTab(=Massive Multilingual Text Embedding Benchmark)에서 다국어 성능을 입증하면서도 메모리·연산 요구량을 낮춰, 고요청·저지연 환경에 적합하다. Nemotron Safety는 민감 정보를 탐지해 에이전트가 개인 식별 정보를 실수로 노출하지 않도록 보호한다.

의미와 전망

로보틱스가 ‘단일 작업 전문가’에서 ‘범용+전문 융합’ 체제로 이동하는 지금, Cosmos Reason 2는 예측 불가능한 물리 세계를 이해·계획·행동으로 잇는 추론 능력을 한층 끌어올린다. 엔비디아의 오픈 모델과 훈련·시뮬레이션·안전 도구가 결합되면, 기업은 디지털과 물리 환경 전반에서 일관된 에이전트를 설계·배포해 운영 효율과 안전성을 동시에 강화할 수 있다.

이 기사 공유하기