번역 - 르앙뉴스

폰 노이만을 넘어: 엔터프라이즈 AI 위한 통합 결정적 실행 아키텍처

기사 요약 지난 반세기 지배한 폰 노이만/하버드 모델을 넘어, 사이클 정밀 스케줄링으로 추측 없이 실행하는 결정적 실행이 제안된다. 이 접근법은 스칼라·벡터·매트릭스 연산을 단일 프로세서에서 통합해 가속기 없이도 예측 가능한 성능과 낮은 전력을 제공한다. 시간-자원 매트릭스, 팬텀 레지스터, 듀얼 뱅크 레지스터 파일 등 혁신으로 LLM 추론부터 실시간 제어까지 일관된 처리량을 달성한다. 개요: 폰 노이만을 넘어서는 통합 … Read more

화웨이 오픈소스 SINQ 양자화, LLM 메모리 60~70% 절감

기사 요약 화웨이가 취리히 연구소에서 공개한 SINQ 양자화는 보정 없이도 60~70% 메모리 절감을 달성해 대형 LLM을 더 저렴한 하드웨어에서 구동 가능하게 한다. 이중 축 스케일링과 Sinkhorn 정규화로 행·열 표준편차를 맞추고 매트릭스 불균형을 줄여, RTN·HQQ·하다마드 대비 낮은 퍼플렉시티와 플립률을 보인다. Apache 2.0으로 GitHub·Hugging Face에 공개됐으며, NF4·AWQ(A‑SINQ) 지원과 빠른 양자화 속도로 연구·프로덕션 모두에 적합하다. SINQ 양자화로 대형 … Read more

OpenAI DevDay 2025 프리뷰: 브라우저 공개와 엔터프라이즈 전략

기사 요약 샌프란시스코 포트 메이슨에서 열리는 OpenAI DevDay 2025는 1,500명 이상 개발자가 참여하며 키노트만 라이브 중계된다. 구글 Gemini·앤트로픽 Claude·메타의 추격 속에 OpenAI는 가격 인하와 개발자 경험 중심으로 전략을 재정비한다. 엔터프라이즈 세션, Sora·GPT-5 데모, 조니 아이브 대담과 함께 루머인 ChatGPT 브라우저 공개 가능성이 주목된다. 행사 개요 키노트와 일정 핵심 정리 (OpenAI DevDay 변주) OpenAI DevDay 2025는 … Read more

단 78개 예제로 자율 AI 에이전트 학습하는 LIMI 프레임워크

기사 요약 상하이 교통대·GAIR 연구진이 제안한 LIMI는 대규모 데이터 없이도 복잡한 자율 과제를 수행할 LLM을 학습할 수 있음을 입증했다. 정교하게 선별한 단 78개 시연 데이터로 GLM-4.5를 미세조정해 AgencyBench 73.5%를 기록, 수천 건 학습 모델을 크게 앞섰다. 코드·가중치 공개로 기업은 소수의 고품질 내부 데이터만으로 맞춤 에이전트 구축이 가능해져 비용과 시간 부담을 줄일 수 있다. LIMI: 적은 … Read more

구글 ‘Jules’ 코딩 에이전트, CLI·API로 채팅을 넘어 터미널로 확장

기사 요약 구글이 개발자 워크플로우에 밀착한 Jules Tools CLI와 Jules API를 공개해 터미널·IDE 통합을 강화했다. 기업 사용자는 CLI·API를 통해 사용 위치와 방식에 대한 제어와 유연성을 확보하고, Slack·CI/CD·GitHub 등과 연동할 수 있다. 파일 선택기·메모리·환경변수 관리 등 업데이트가 더해졌고 전반적 반응은 긍정적이지만, 두 가지 CLI 공존으로 혼선도 제기된다. Jules 코딩 에이전트: CLI와 API로 워크플로우 네이티브화 구글은 개발자가 … Read more

세일즈포스, 엔터프라이즈 AI ‘신뢰 레이어’로 80% 실패 돌파 노린다

기사 요약 세일즈포스가 분산 데이터·약한 거버넌스·보안 우려로 난항하는 기업 AI 도입을 해결하려고 신뢰 레이어를 앞세운 데이터 관리·거버넌스 신기능을 발표했다. 신제품군은 통합 데이터 기반, 보안·컴플라이언스 내재화, 그리고 이질적 플랫폼 간 AI 에이전트 연결을 핵심으로 하며 컨텍스트 색인, 데이터 클린룸, 테이블로 시맨틱스, 뮬소프트 에이전트 패브릭을 포함한다. 마이크로소프트·구글·아마존 등과의 경쟁 속에서 플랫폼 통합 강점과 인포매티카 인수를 무기로 정확도와 … Read more

다르메시 샤가 말하는 AI 활용법: 프롬프트·맥락·실험이 핵심

기사 요약 샌프란시스코 INBOUND 기조연설에서 허브스폿 CTO 다르메시 샤는 AI를 ‘경쟁’이 아닌 ‘협업’ 대상으로 보고 함께 빌드하라고 강조했다. 성과는 모델 선택, 프롬프트 엔지니어링, 맥락 제공의 질에 좌우되며, 무엇이든 먼저 AI로 시도하고 반복·실험하라고 조언했다. 그는 AI 에이전트의 10년이 시작됐다며 TEAM(분류·실험·자동화·측정) 전략과 인간의 EQ가 결합된 증강 지능의 가치를 역설했다. INBOUND 2024: 다르메시 샤의 AI 마스터리 핵심 허브스폿의 … Read more

IBM, 하이브리드 맘바·트랜스포머 LLM ‘Granite 4.0’ 공개

기사 요약 IBM가 맘바·트랜스포머 하이브리드 아키텍처를 채택한 오픈소스 LLM 패밀리 Granite 4.0을 공개했다. Apache 2.0, ISO 42001 인증, 서명된 체크포인트와 버그바운티 등으로 엔터프라이즈 신뢰성과 보안을 강화했다. GPU 메모리 최대 70% 절감과 뛰어난 벤치마크 성능으로 RAG·함수호출·지시 따르기 등 업무 시나리오에 실전 투입 가능성을 높였다. Granite 4.0 한눈에 보기 IBM이 오픈소스 대규모 언어모델 패밀리 ‘Granite 4.0’을 발표했다. … Read more

MS, AutoGen 종료하고 Agent Framework로 기업용 에이전트 통합

기사 요약 마이크로소프트가 Agent Framework를 공개 프리뷰로 내놓고 AutoGen·Semantic Kernel을 유지보수 모드로 전환, 단일 프레임워크로 통합한다. Agent Framework는 단일 SDK로 AI 에이전트 구축·멀티에이전트 배포·관측성을 제공하고 Azure AI Foundry 및 OpenTelemetry와 연동한다. Task Adherence·PII Detection·Prompt Shields 등 책임 있는 AI 기능을 더해 보안과 관리성을 강화하며, LangChain·CrewAI·LlamaIndex와 경쟁 구도를 형성한다. Agent Framework 공개 프리뷰와 통합 전략 마이크로소프트의 … Read more

기업은 GitHub, 시장은 Claude—Cursor의 속도만으로는 수주 못 한다

기사 요약 코딩용 생성형 AI 경쟁에서 속도보다 보안·컴플라이언스·배포 통제가 엔터프라이즈 채택을 좌우하며, 대기업에선 GitHub Copilot이, 전체 채택에선 Claude Code가 선도했다. 86개 팀 설문과 실사용 테스트 결과, 대기업은 보안을 최우선(58%)으로 보고 GitHub을 선호하고, 소규모 팀은 Claude·Cursor·Replit로 분산되며 ROI 불확실성이 주요 장애(33%)로 드러났다. Claude는 느리지만 체계적이고 규정 준수에 민감했고, Windsurf만 FedRAMP로 규제 산업에 적합했으며, 다수 조직이 GitHub+Claude … Read more