번역 - 르앙뉴스

추론 위기: 뒤집힌 AI 경제학과 수익형 아키텍처의 길

기사 요약 경계 모델의 상용화로 전력 한계, 추론 지연, 토큰 단가·사용량 급증이 맞물리며 전통적 규모 우선 아키텍처의 한계가 드러났다. 겉보기엔 추론 단가가 1000배 하락했지만 토큰 수요가 1만배 급증해 순 단위 경제성이 마이너스가 되었고, 투자자 보조금에 의존하는 구조가 지속된다. 에이전트 스웜과 추론 모델이 AGI로 가는 새 스케일링 법칙을 이끄는 가운데, 메모리/스토리지 재설계와 추론 최적화로 음(-)의 단위 … Read more

오픈AI, 7시간 자율 실행 가능한 GPT-5-Codex 공개

기사 요약 오픈AI가 소프트웨어 엔지니어링 전용 모델 GPT-5-Codex를 공개하고 Codex 전반을 통합 업데이트했다. 새 모델은 적응적 추론으로 단순 버그부터 대규모 리팩터링까지 처리하며, 대형 작업을 최대 7시간 이상 독립 실행한다. CLI·IDE 확장·클라우드 에이전트·자동 코드 리뷰가 강화됐고, 요금제는 ChatGPT 유료 플랜에 포함된다. GPT-5-Codex 한눈에 보기 오픈AI는 개발자 터미널, IDE, GitHub, 웹, ChatGPT 앱 전반에서 통합 경험을 제공하기 … Read more

마이크로소프트 rStar2-Agent, 저비용으로 고성능 추론 LLM 훈련

기사 요약 MS 리서치는 rStar2-Agent 강화학습 프레임워크로 복잡한 추론 과제를 수행하는 LLM을 기존 대비 훨씬 낮은 비용과 데이터로 훈련했습니다. 고성능 인프라, GRPO-RoC 알고리즘, 단계적 훈련 레시피를 결합해 도구 사용을 안전·효율적으로 확장했습니다. 14B 모델이 AIME24에서 80.6%로 거대 모델을 앞섰고 더 짧은 답변으로 비용을 낮춰, 기업용 에이전트와 소형 오픈소스 모델에 실질적 이점을 보여줍니다. 새 강화학습 프레임워크 개요 … Read more

바이브 코딩의 시대는 끝났다: 에이전틱 스웜 코딩이 기업의 새 해자

기사 요약 여름 사이 가속된 AI 코드 능력과 에이전틱 스웜 코딩의 성숙이 소프트웨어 제작 방식을 근본적으로 바꿨다. 스웜형 멀티 에이전트, 실제 개발 도구 통합, 장시간 자율 실행 등으로 프로토타입을 넘어 엔터프라이즈급 산출물이 가능해졌다. 다만 성능 변동성과 검증 부담이 커 개발자는 오케스트레이션과 품질 보증을 지휘하는 ‘에이전틱 엔지니어’로 역할이 재정의된다. 개요: 비행기에서 완성된 엔터프라이즈 앱 GALLOS Technologies의 … Read more

Qwen3-Next, 활성 30억 파라미터로 고효율·고성능 데뷔

기사 요약 알리바바 Qwen 팀이 하이브리드 아키텍처의 Qwen3-Next를 공개, Gated DeltaNet과 Gated Attention을 결합해 긴 문맥에서도 빠르고 정확합니다. 800억 파라미터 중 토큰당 30억만 활성화하고 기본 25.6만 토큰 컨텍스트를 지원해 추론 속도와 비용을 크게 낮췄습니다. 초희소 MoE(512 전문가), MTP, 안정화 기법을 도입해 벤치마크에서 Qwen3-32B와 동급 이상 성능을 보이며 Apache 2.0으로 무료 상용 이용이 가능합니다. Qwen3-Next: 30억 … Read more

AI 근해: 초기 생산성 도약과 불평등·불확실성의 동행

기사 요약 일상에 스며든 AI가 삶의 질과 업무 효율을 눈에 띄게 높이지만, 최종적 방향성은 여전히 불투명하다. 다음 5년은 풍요와 불평등이 함께 커지는 과도기이며, 일자리 전환과 인지 공간의 분절이 동시에 진행된다. 의도적이고 인간 중심의 설계, 안전망과 재교육, 그리고 용기 있는 리더십이 다리를 놓을 수 있다. AI 근해: 약속과 위험이 교차하는 초입 일상 곳곳에 스며든 AI가 만들어낸 … Read more

DevRev, 대화형 AI Computer로 엔터프라이즈 스택 통합

기사 요약 DevRev가 직원용 대화형 인터페이스 ‘Computer’를 공개했으며, 베타로 제공 중이고 2025년 후반에 폭넓은 출시가 예정돼 있다. Computer는 CRM·백로그·문서·협업 도구를 아우르며 구조화·비구조화 데이터를 통합하고, Computer Memory와 AirSync로 실제 업무를 생성·수정·실행한다. 사용량 기반 과금과 엣지 컴퓨팅·마이크로 테넌시 아키텍처를 채택했으며, 고객 사례에서는 티켓 85% 자동 해결·지원 비용 50% 절감·직원 주 10시간 절감 효과가 보고됐다. DevRev ‘Computer’ 공개: … Read more

딥마인드 경고: 단일 벡터 임베딩의 수학적 한계, RAG의 병목

기사 요약 구글 딥마인드가 단일 벡터 임베딩의 내재적 수학적 한계를 입증해, 복잡한 RAG·검색 과제가 임계점에서 무너질 수 있음을 밝혔다. LIMIT 데이터셋에서 최신 임베딩 모델들이 20% 미만의 리콜을 보인 반면 BM25는 강인성을 입증, 한계가 학습이나 도메인 문제가 아님을 시사한다. 기업은 하이브리드 검색과 조합적 질의 중심의 내부 평가, 교차 인코더·멀티벡터 등 대안 아키텍처를 병행해야 한다. 벡터 검색의 … Read more

Anthropic, 팀·엔터프라이즈용 Claude 메모리와 Incognito 모드 공개

기사 요약 Anthropic이 팀·엔터프라이즈용으로 프로젝트 기반의 Claude 메모리를 출시해 팀 선호와 업무 프로세스를 기억합니다. 메모리는 설정에서 옵트인 방식으로 관리되며, 요약 화면에서 확인·수정 가능하고 프로젝트별로 내려받아 ChatGPT·Gemini로 이식할 수 있습니다. 모든 이용자에게 Incognito 채팅이 제공되며 기록·메모리에 남지 않지만, 안전·법적 준수를 위해 최소 30일간 보관됩니다. 팀 생산성 강화: Claude 메모리 도입 샌프란시스코의 AI 스타트업 Anthropic이 Claude AI에 … Read more

시간당 900달러 엔지니어, PromptQL의 AI 컨설팅이 빅4를 겨냥한다

기사 요약 기업가치 10억 달러 이상인 PromptQL이 시간당 900달러로 자사 AI 엔지니어를 투입하는 컨설팅을 출시해, 전략만 제시하던 전통 컨설팅과의 판도를 흔들고 있다. 이 서비스는 MIT가 지적한 엔터프라이즈 AI 95% 실패율을 겨냥해 불확실성 신호, 피드백 학습, 정량 평가(GATs)로 ROI를 검증 가능하게 만든다. 베타 단계임에도 포춘 500과 7자리 계약, 페타바이트급 데이터 처리, 2.5만 사용자 배포를 성사시키며 신뢰 … Read more