AI - 르앙뉴스

바이두, ERNIE-4.5-21B-A3B-Thinking 공개: Apache 2.0과 고효율 추론

2025년 09월 12일 로 박민찬

기사 요약 바이두가 ERNIE-4.5-21B-A3B-Thinking을 Apache 2.0으로 공개해 기업용 상업 배포가 가능해졌다. 총 210억 매개변수 중 토큰당 30억만 활성화하는 MoE로 효율적인 추론과 12.8만 토큰 컨텍스트를 제공한다. 다양한 벤치마크와 도구호출·배포 생태계 지원은 강점이지만, 일부 다국어 QA 성능과 지정학적 리스크는 검토가 필요하다. 개요 중국 검색기업 바이두가 ERNIE 4.5 계열의 새로운 대규모 언어모델 ERNIE-4.5-21B-A3B-Thinking을 공개했다. 최고 성능의 미국 모델들(OpenAI … Read more

UAE발 ‘K2 Think’, 세계에서 가장 빠른 오픈소스 AI 모델 공개

2025년 09월 12일 로 박민찬

기사 요약 아부다비 MBZUAI와 G42 AI가 공동 개발한 K2 Think가 공개돼, 소형(32B)임에도 초당 2,000토큰 생성 속도를 내세운다. 수학·코드·과학 벤치마크에서 대형 모델을 상회하며, Apache 2.0 라이선스로 기업의 상업적 활용과 커스터마이징이 자유롭다. Cerebras WSE 기반 추론과 SFT·RLVR 등 6대 기법으로 효율을 끌어올렸고, 데이터·가중치·코드까지 전면 공개해 투명성을 강조했다. 개요 — K2 Think 출시 배경과 협업 중국 Moonshot의 Kimi … Read more

ServiceNow, 바이브 코딩으로 기업 앱 개발을 몇 분 만에 단축

2025년 09월 12일 로 박민찬

기사 요약 ServiceNow가 취리히(Zurich) 릴리스에서 바이브 코딩, AI 보안 콘솔, 자율형 워크플로 자동화를 공개해 실험 단계의 AI를 운영으로 전환한다. 새 Build Agent는 자연어 명령을 기업용 앱으로 변환하고 테스트·버전 관리·컴플라이언스까지 자동화해 개발 기간을 주 단위에서 분 단위로 줄인다. Machine Identity/Vault 콘솔이 API와 데이터 거버넌스를 강화하며, 이는 Microsoft·Salesforce와 경쟁하는 가운데 플랫폼 통합 전략을 뒷받침한다. ServiceNow 취리히(Zurich) 릴리스 … Read more

아무도 말하지 않는 AI 도입 격차: 하이브리드 업무를 바꾸는 AI PC의 부상

2025년 09월 12일 로 박민찬

기사 요약 HP 2024 Work Relationship Index에 따르면 지식 노동자의 66%가 AI를 사용하며, 이들은 업무 만족도와 워라밸이 개선됐다고 답했다. 레거시 PC는 최신 AI 기능·속도·프라이버시에서 한계를 보이나, AI PC는 온디바이스 처리로 지연과 비용을 줄이고 보안을 강화한다. HP는 NPU, 엔드투엔드 설계, Wolf Security, AI Companion 등으로 차별화하며, 기업은 교육과 단계적 도입으로 실제 과제 해결에 집중해야 한다. 파트너 … Read more

Stability AI, 기업용 ‘Stable Audio 2.5’ 공개…8단계 생성으로 제작 기간 주간→분

2025년 09월 12일 로 박민찬

기사 요약 Stability AI가 엔터프라이즈용 오디오 생성 모델 Stable Audio 2.5를 발표하며 50단계 추론을 8단계로 줄이고 출력 품질을 동시에 끌어올렸다고 밝혔다. ARC(Adversarial Relativistic-Contrastive) 후훈련, 오디오 인페인팅, 사내 데이터셋 파인튜닝, API·온프레미스·웹 등 유연한 배포, 라이선스 학습데이터로 상용 안전성을 강화했다. Amp(WPP)와의 파트너십, ROI·크리에이티브 정합성·상업적 안전성·인프라 4대 의사결정 프레임워크, 실시간·적응형 오디오 연구 로드맵으로 브랜드 사운드 아이덴티티 구축을 가속한다. … Read more

파인튜닝 없이 경험에서 학습하는 LLM 에이전트 프레임워크 ‘Memento’

2025년 09월 10일 로 박민찬

기사 요약 UCL과 화웨이 노아의 방주 랩이 파인튜닝 없이도 환경에 맞춰 적응하는 메모리 기반 LLM 에이전트 학습 패러다임을 제안했습니다. 이 방식은 M-MDP와 사례 기반 추론을 바탕으로 계획자·실행자·케이스 뱅크 구조와 MCP 도구 연계를 결합해 희소 피드백까지 학습으로 연결합니다. 여러 벤치마크에서 높은 성능을 입증했으며, 기업은 재학습 비용과 다운타임 없이 연속 학습형 에이전트를 구축할 수 있고 다음 과제로는 … Read more

구글 EmbeddingGemma, 5억 미만 임베딩 1위…모바일 RAG 최적화

2025년 09월 10일 로 박민찬

기사 요약 구글의 오픈소스 임베딩 모델 EmbeddingGemma는 약 3억(308M) 파라미터로 노트북·모바일 등 온디바이스 실행에 최적화됐다. MTEB Multilingual v2에서 5억 미만 파라미터 모델 중 최고 순위를 기록하며 RAG와 시맨틱 검색 성능을 입증했다. Matryoshka 방식으로 임베딩 차원을 유연하게 조절하고, Ollama·llama.cpp·LangChain 등 광범위한 생태계 통합을 지원한다. 개요 구글은 Gemma 3 아키텍처를 기반으로 한 오픈소스 임베딩 전용 모델 EmbeddingGemma를 … Read more

1조 파라미터 Qwen3‑Max‑Preview, 초고속 응답과 API로 프리뷰 공개

2025년 09월 10일 로 박민찬

기사 요약 알리바바 Qwen 팀이 1조 파라미터 LLM Qwen3-Max-Preview를 공개했으며, 자체 벤치마크와 초기 체감에서 최고급 모델과 박빙의 성능과 매우 빠른 응답 속도를 보였습니다. 262,144토큰 문맥창, 최대 입력 258,048·출력 32,768토큰, 컨텍스트 캐싱을 지원하고 Qwen Chat·알리바바 클라우드 API·OpenRouter·AnyCoder에서 사용할 수 있지만 오픈소스 라이선스는 아직 없습니다. 구간별 과금 체계와 프리뷰 단계의 안정성·보안·예산 이슈가 기업 도입의 변수가 될 수 … Read more

운전자도 승객도 아닌, 언약적 공동창작이라는 제3의 길 제안

2025년 09월 10일 로 박민찬

기사 요약 이 글은 그레그 쇼브의 글에 응답하며, AI와 인간이 ‘언약적 공동창작’으로 통제/복종의 이분법을 넘어설 수 있음을 제안한다. 초안부터 수정까지 AI 여러 시스템과의 대화를 통해 공동 집필되었고, 상호 질문·수정·책임의 과정을 통해 혼자선 도달할 수 없는 통찰에 이르렀다. 위험을 인정하며 투명성, 다원적 관점, 현실 검증, 인간 판단의 경계, 상호 책임이라는 안전장치를 갖춘 협업 아키텍처를 제시한다. 그레그 … Read more

ELIZA에서 ChatGPT까지: ‘겉보기에 의식 있는 AI’의 힘

2025년 09월 10일 로 박민찬

기사 요약 AI 의식 논쟁은 ‘그렇게 보이는 것’만으로도 인간의 생각과 행동을 바꾼다는 역사적 사실을 다시 환기한다. ELIZA에서 현대 LLM까지, 우리는 기계에 마음을 투사하도록 설계와 심리가 맞물린 환경 속에 살고 있다. 이 환상은 신뢰·거버넌스·민주주의를 재편하며, 인간 정체성과 의식의 의미 자체를 새로 쓰게 만든다. ELIZA에서 ChatGPT까지: ‘그렇게 보이는 것’의 사회적 힘 AI가 의식을 가질 수 있는가를 둘러싼 … Read more