뉴스 - 르앙뉴스

앤스로픽, 30시간 연속 코딩 가능한 Claude Sonnet 4.5 공개

2025년 10월 01일 로 박민찬

기사 요약 앤스로픽이 ‘Claude Sonnet 4.5’를 공개하며 SWE-bench Verified 77.2%와 30시간 이상 지속 작업 집중 능력을 앞세워 ‘세계 최고 코딩 모델’이라 주장했다. 코드 생성 시장 점유율 42%로 선두지만 매출의 상당 부분이 Cursor·GitHub Copilot에 집중돼 있고, OpenAI GPT-5의 공격적 가격 전략 속에서도 Sonnet 4.5 가격은 동결됐다. ASL-3 안전 장치와 프롬프트 인젝션 방어를 강화하고 개발자를 위한 Claude … Read more

기업의 99%가 AI 통합에 실패하는 이유와 1%의 성공 전략

2025년 09월 30일 로 박민찬

기사 요약 대부분의 기업이 AI에 투자하지만, 진정한 AI 성숙도에 도달해 업무에 완전히 통합한 곳은 1%에 불과하다. 대담한 도입과 함께 윤리·구조·절차적 가드레일을 설계해야 지속 가능한 가치 창출과 책임 있는 실험이 가능해진다. 채용·조직·거버넌스·학습문화·모니터링을 갖춘 체계가 1%의 성공을 가른다. 왜 대부분의 기업은 AI 통합에 실패하는가 이사회부터 휴게실까지 화두는 AI지만, 미래 대비는 챗봇 실험이나 몇 가지 자동화로 끝나지 않는다. … Read more

API 비용 없이 딥 리서치 에이전트 구축, 알리바바 Agentic CPT 돌파구

2025년 09월 30일 로 박민찬

기사 요약 알리바바 통이(Tongyi) 랩이 오픈소스 훈련 프레임워크 Agentic CPT를 공개해 상용 딥 리서치 모델에 견주는 오픈 LLM 에이전트를 만들 수 있게 했다. 핵심은 FAS/HAS 기반 오프라인 데이터 합성으로 방대한 에이전트 행동 데이터를 만들어 Agentic CPT 단계적 사전학습으로 계획·자기교정 능력을 길러주는 것이다. 이 방식으로 학습한 AgentFounder-30B가 BrowseComp, HLE, Academic Browse에서 최고 수준 성능을 기록해, 온프레미스 … Read more

구글 Gemini 2.5 Flash Lite, 최고 속도 경신과 주요 업데이트

2025년 09월 30일 로 박민찬

기사 요약 독립 평가에 따르면 Gemini 2.5 Flash Lite가 초당 887토큰으로 가장 빠른 폐쇄형 모델로 등극했다. Flash와 Flash Lite는 추론·도구 사용·멀티모달 품질과 비용 효율이 개선됐고, 새 별칭으로 최신 미리보기를 제공한다. Gemini Live API는 함수 호출 신뢰성과 자연스러운 대화가 강화됐으며 곧 ‘Thinking’ 기능도 도입된다. Gemini 2.5 Flash·Flash Lite 최신 업데이트 한눈에 구글은 대규모 숫자 버전 업데이트 … Read more

오픈AI 1억달러 제휴보다 큰 성과: 데이터브릭스 프롬프트 최적화로 AI 비용 90배 절감

2025년 09월 29일 로 박민찬

기사 요약 데이터브릭스가 GEPA 기반 프롬프트 최적화로 에이전트 브릭스 성능을 대폭 끌어올려, 모델 운영 비용을 최대 90배까지 낮출 수 있다고 밝혔다. 데이터브릭스의 프롬프트 최적화 돌파구 기업용 AI에서는 올바른 모델과 프롬프트를 고르는 것만큼이나 프롬프트 최적화가 핵심 과제다. 데이터브릭스는 6월 공개한 에이전트 브릭스(Agent Bricks)에 이를 적용해 꾸준히 고도화해 왔고, 이번에 GEPA(Generative Evolutionary Prompt Adaptation)라는 새 기법을 공개하며 … Read more

ChatGPT Pulse, 맞춤 리서치로 수동형 AI를 능동형으로 바꾼다

2025년 09월 29일 로 박민찬

기사 요약 오픈AI가 ChatGPT Pulse를 공개해 개인 맞춤 검색·업데이트를 자동으로 제공하며 수동형 ‘Tasks’를 대체·확장했다. 현재 프리뷰로 Pro 이용자와 모바일에서 제공되며, 밤마다 비동기 리서치로 다음 날 요약·일정·알림을 제안하고 앱 연동은 기본 비활성화다. 기업용 에이전트로의 진화 가능성과 ‘주위형(ambient) 에이전트’ 논의가 이어지는 가운데, 가치·산만함 논쟁과 Huxe 같은 경쟁도 부상했다. ChatGPT Pulse가 뭐가 달라졌나 오픈AI는 최신 업데이트로 ChatGPT Pulse를 … Read more

에이전트형 AI 재정의: MIT 출신 Liquid AI ‘Liquid Nanos’ 공개

2025년 09월 27일 로 박민찬

기사 요약 Liquid AI가 3.5억~26억 매개변수의 작업 특화 소형 모델 6종 ‘Liquid Nanos’를 공개해, 추출·번역·RAG·도구 호출·수학 추론 등 에이전트형 워크플로에서 대형 모델에 필적하는 성능을 제시했다. 모델은 LEAP와 허깅페이스를 통해 iOS·Android·노트북 등 온디바이스 배포가 가능하며, 연매출 1,000만 달러 미만은 무료(연구·상업)이고 그 이상은 별도 상업 계약이 필요하다. Liquid AI는 비트랜스포머 LFM2와 하이브리드(온디바이스+클라우드) 전략으로 비용·지연·프라이버시를 개선해 기업·연구 환경에서의 … Read more

Perplexity, 대규모 검색 API로 구글 검색 인프라에 도전

2025년 09월 27일 로 박민찬

기사 요약 Perplexity AI가 개발자에게 초대형 웹 인덱스를 개방하는 Perplexity 검색 API를 공개하며 구글의 개발자용 검색 지배력에 정면으로 도전했다. 실시간 인덱싱, 부분 문서 정밀도, 하이브리드 검색과 출처 표기 중심의 결과 구조 등으로 AI 애플리케이션에 최적화했다. 규제 압박과 비광고형 수익 모델을 기회로 삼지만, 구글의 규모·알고리즘 우위와 법적 분쟁, 인간 검증 필요성은 여전한 과제다. 출시 배경과 목표: … Read more

기업, 에이전틱 AI 난립에 잠행 중… 거버넌스로 각성하라

2025년 09월 26일 로 박민찬

기사 요약 에이전틱 AI 에이전트가 기업 곳곳에서 급증하며 내부자 위협을 능가하는 보안·운영 리스크를 키우고 있다. 모델 선택이 아니라 인프라와 거버넌스가 핵심이며, 발견 가능한 API, 이벤트 기반 아키텍처, 선제 제어가 필수다. 중앙화된 에이전트 관리와 A2A 프로토콜, 문화적 신뢰 구축이 난립을 통제하고 안전한 확장을 가능케 한다. 기업은 ‘에이전틱 AI 스프로울’에 눈감은 채 걷고 있다 에이전틱 AI는 고객지원, … Read more

메이투안 LongCat-Flash-Thinking, GPT-5에 견주는 오픈소스 추론 모델

2025년 09월 26일 로 박민찬

기사 요약 중국 메이투안이 5600억 파라미터 MoE 기반 LongCat-Flash와 추론 특화 LongCat-Flash-Thinking을 공개했다. LongCat-Flash-Thinking은 수학·코딩·정리 증명 등에서 GPT-5급 성능을 보이며 MiniF2F 등에서 오픈 모델 최고치를 기록했다. API와 오픈 가중치(MIT 라이선스)로 무료 제공되며, 대규모 배포 최적화와 토큰 사용 64.5% 절감까지 입증했다. 개요 중국 배달·커머스 앱 메이투안은 2025년 8월, 첫 오픈소스 LLM인 LongCat-Flash(일명 LongCat-Flash-Chat, 5600억 파라미터 MoE)를 … Read more