leangnews
Command Palette
Search for a command to run...
2025년 12월 02일 14:02
2025년 AI에 감사할 것들: 오픈·로컬·중국의 약진과 실사용 혁신
기사 요약
- 2025년 AI는 클라우드 대형 모델에서 오픈·로컬·중국 생태계까지 다변화하며 실사용 성과가 가시화되고 있다.
- OpenAI의 GPT-5/5.1, Atlas, Sora 2와 오픈 가중치, 중국의 DeepSeek·Qwen·ERNIE 등이 주목을 받았다.
- 소형·온디바이스 모델, Meta-미드저니 제휴, 구글 Gemini 3·Nano Banana Pro, Flux.2·Claude 4.5 등도 12~24개월 내 파급이 예상된다.
2025 AI 트렌드: 다변화된 생태계의 등장
올해는 매주 새로운 모델과 에이전트 프레임워크, “이것이 판을 바꾼다”는 데모가 쏟아진 한 해였다. 무엇보다도 2025 AI 트렌드의 핵심은 다양성이다. 클라우드의 최전선 모델 몇 개에 국한되지 않고, 오픈과 클로즈드, 대형과 초소형, 서구와 중국, 클라우드와 로컬이 공존하는 전체 생태계로 확장됐다. 이번 리뷰는 일시적 화제성을 넘어 12~24개월 안에 실질적 영향을 줄 발표들에 초점을 맞춘다.
OpenAI의 진군 — 2025 AI 트렌드의 촉매
생성형 AI 시대를 연 OpenAI는 2025년에도 속도를 늦추지 않았다. 8월 공개된 GPT-5와, 11월의 GPT-5.1(Instant·Thinking 변형 포함)은 작업 난이도에 따라 “생각 시간”을 동적으로 조절한다. 초반 수학·코딩 오류와 미지근한 반응이 있었지만 사용자 피드백을 반영해 빠르게 개선됐고, 실제 기업 현장에서는 KPI가 움직이고 있다. 예컨대 ZenDesk Global은 GPT-5 기반 에이전트가 고객 요청의 절반 이상을 해결한다고 밝혔고, 일부 고객사는 80~90% 해결률을 보았다.
개발 도구 측면에서는 장기 에이전트형 워크플로를 소화하는 코딩 모델 GPT-5.1-Codex-Max가 OpenAI Codex 환경의 기본값이 됐다. 또한 브라우저 자체에 ChatGPT를 녹인 ChatGPT Atlas는 사이드바 요약, 페이지 분석, 검색을 일반 탐색 흐름에 밀착시켜 “어시스턴트=브라우저” 수렴을 예고했다. 미디어 측면의 Sora 2는 물리 시뮬레이션, 동기화된 사운드와 대사, 스타일·샷 구조 제어를 강화한 영상·오디오 통합 모델로 진화했고, 전용 앱은 누구나 “내 손 안의 TV 네트워크”를 만들 수 있게 했다. 상징적으로 OpenAI는 Apache 2.0 스타일 라이선스로 gpt-oss-120B, gpt-oss-20B(오픈 가중치 MoE 추론 모델)도 공개했다.
중국 오픈소스 파도 — 2025 AI 트렌드의 또 다른 축
MIT·Hugging Face 연구에 따르면 중국은 DeepSeek, 알리바바 Qwen 계열의 견인으로 오픈 모델 다운로드에서 미국을 근소하게 앞섰다. 대표적으로 DeepSeek-R1은 MIT 라이선스 가중치와 증류 소형군을 갖춘 오픈 추론 모델로 출발해 보안·성능 튜닝 이슈까지 파급을 넓혔다. Moonshot의 Kimi K2 Thinking은 도구와 단계적 사고를 결합한 “생각하는” 오픈 모델로, 현 시점 최고 수준의 오픈 추론 경쟁력을 내세웠다.
Z.ai의 GLM-4.5/4.5-Air는 에이전틱 모델을 표방하며 베이스·하이브리드 추론 변형을 GitHub에 공개했고, 바이두의 ERNIE 4.5는 Apache 2.0으로 완전 공개된 멀티모달 MoE 제품군(0.3B 덴스 모델 및 차트·STEM·툴 사용에 특화된 비주얼 Thinking 변형 포함)을 선보였다. 알리바바의 Qwen3(코더, 대형 추론, Qwen3-VL 등)는 코드·번역·멀티모달 추론에서 오픈 가중치의 기준점을 끌어올리며 “Qwen의 여름”을 만들었다. 저예산으로 DeepSeek 기준선을 넘어선 Light-R1-32B, 웨이보의 초소형 VibeThinker-1.5B 등도 눈길을 끈다.
작고 로컬한 모델의 성숙
올해는 드디어 “쓸 만한” 소형 모델이 등장했다. Liquid AI의 LFM2 및 LFM2-VL은 처음부터 지연 시간과 디바이스 특성을 고려해 엣지 박스, 로봇, 제한된 서버에 맞춘 아키텍처로 설계됐다. 특히 LFM2-VL-3B는 임베디드 로보틱스·산업 자율을 겨냥해 ROSCon 데모가 예고됐다.
빅테크 측에서는 구글 Gemma 3가 “작아도 유능하다”는 반례를 제시했다. 270M~27B 파라미터 범위(대형 변형은 멀티모달 지원)에 오픈 가중치를 제공하며, 특히 Gemma 3 270M은 파인튜닝과 구조화 텍스트(포매터, 라우터, 워치독 등)에 최적화됐다. 이런 모델은 X에서 트렌드가 되진 않더라도 개인정보 민감 업무, 오프라인 워크플로, 씬 클라이언트, 그리고 모든 툴 호출을 초거대 LLM에 의존하고 싶지 않은 에이전트 스웜에 정확히 들어맞는다.
메타 × 미드저니: ‘미학’의 서비스화
올해의 반전은 메타가 미드저니와 경쟁하기보다 손을 잡은 것이다. 메타는 미드저니의 이미지·비디오 생성 스택을 라이선스해 페이스북·인스타그램 피드와 Meta AI 기능 등 차기 모델·제품에 통합하겠다고 밝혔다. 이는 미드저니급 시각 품질이 디스코드 봇을 넘어 대중적 소셜 도구에 스며드는 전환점이자, OpenAI·구글·Black Forest Labs에 품질 경쟁을 압박하는 신호다. 다만 미드저니 API 로드맵에는 변수가 생긴 모습이다.
구글 Gemini 3와 Nano Banana Pro
구글은 Gemini 3로 GPT-5에 대응했다. 향상된 추론·코딩·멀티모달 이해와 난해 과제를 위한 Deep Think 모드를 내세워 프런티어 벤치마크와 에이전틱 워크플로를 정면 겨냥했다. 의외의 히트는 주력 이미지 생성기 Nano Banana Pro(Gemini 3 Pro Image)다. 인포그래픽, 다중 피사체 장면, 다국어 텍스트를 2K·4K 해상도에서도 또렷이 렌더링해, 판타지 일러스트보다 실무용 도식·제품 설계·시스템 설명이 중요한 엔터프라이즈에 가치를 제공한다.
와일드카드: 주목해야 할 신흥 변수
Black Forest Labs의 Flux.2 이미지 모델은 품질과 제어력으로 Nano Banana Pro와 미드저니를 정조준한다. Anthropic의 Claude Opus 4.5는 더 저렴하면서 강력한 코딩·장기 과제 수행을 표방하고, Light-R1·VibeThinker 등 오픈 수학/추론 모델의 꾸준한 등장은 1억 달러급 학습이 아니어도 의미 있는 진전을 낼 수 있음을 보여준다.
마지막 생각 — 다양성이 만든 2025 AI 트렌드
2024년이 “클라우드의 하나의 거대 모델”의 해였다면, 2025년은 지도가 폭발한 해다. 최상단의 다중 프런티어, 오픈 모델에서 중국의 선도, 빠르게 성숙하는 소형·고효율 시스템, 그리고 미드저니 같은 크리에이티브 생태계의 빅테크 스택 편입까지. 2025 AI 트렌드는 선택지의 확장 그 자체다. 폐쇄형과 개방형, 로컬과 호스팅, 추론 중심과 미디어 중심 사이에서 저널리스트·빌더·기업이 상황에 맞는 조합을 설계할 수 있게 된 것이 가장 큰 진전이다.