본문 바로가기

IT301

애플 뉴럴 엔진 최적화 오픈소스 ‘ANEMLL’, LLM 온디바이스 혁신 이끈다 LLM 변환부터 추론까지, 완전 자동화 파이프라인 제공Swift·Python·iOS 등 다양한 샘플 코드와 벤치마크 도구 지원 애플 뉴럴 엔진(ANE) 기반 대형 언어 모델(LLM) 추론을 위한 오픈소스 프로젝트 ‘ANEMLL’이 2025년 6월, 깃허브(https://github.com/Anemll/Anemll)를 통해 알파 버전(0.3.0)으로 공개됐다. ANEMLL은 누구나 손쉽게 Hugging Face 모델을 ANE에 최적화된 CoreML 포맷으로 변환·배포할 수 있도록 지원하며, iOS·macOS 등 엣지 디바이스에서의 프라이버시와 성능을 극대화한다.ANEMLL은 LLM 변환 도구, Swift 참조 구현, Python 샘플 코드, iOS/macOS 샘플 앱, ANE 벤치마크 등 5가지 핵심 컴포.. 2025. 5. 4.
마이크로소프트, 일론 머스크의 Grok AI 모델 Azure에 도입 추진 OpenAI와의 긴장 속, Azure AI Foundry에 Grok 모델 탑재 논의AI 생태계 주도권 경쟁…마이크로소프트의 전략적 행보 마이크로소프트가 일론 머스크의 AI 스타트업 xAI가 개발한 Grok AI 모델을 자사 클라우드 플랫폼 Azure AI Foundry에 호스팅하는 방안을 추진 중이다. 이 움직임은 마이크로소프트와 오픈AI(OpenAI) 간의 긴장, 그리고 글로벌 AI 생태계의 주도권 경쟁이 격화되는 가운데 나온 것이어서 업계의 이목이 집중된다. 최근 마이크로소프트는 자사 AI 인프라 엔지니어들에게 Grok AI 모델 호스팅 준비를 지시한 것으로 알려졌다. 이로써 개발자들은 Azure AI Foundry를 통해 Grok AI를 활용한 다양한 애플리케이션과 에이전트를 개발할 수 있게 될 전.. 2025. 5. 2.
AI2, 소형 AI 모델 ‘Olmo 2 1B’로 구글·메타·알리바바 능가 1B 파라미터 모델, GSM8K·TruthfulQA 등 주요 벤치마크서 경쟁사 앞서공개 데이터·코드로 누구나 재현 가능…개발자 접근성 대폭 향상 비영리 인공지능 연구기관 AI2가 2025년 5월 1일, 10억(1B) 파라미터 규모의 소형 AI 모델 ‘Olmo 2 1B’를 공개했다. 이 모델은 구글, 메타, 알리바바 등 글로벌 빅테크의 동급 모델을 여러 벤치마크에서 앞서는 성능을 보이며, 오픈소스 AI 생태계에 새로운 바람을 불러일으키고 있다. Ai2Ai2 has 498 repositories available. Follow their code on GitHub.github.com AI2의 Olmo 2 1B는 4조 토큰의 고품질 데이터로 학습됐으며, Apache 2.0 라이선스로 공개되어 누구나 자유롭게 .. 2025. 5. 2.
Pinterest, AI 생성 콘텐츠에 공식 라벨 도입…플랫폼 투명성 한층 강화 “AI 이미지 자동 감지 및 라벨링, 사용자 신뢰 제고”“AI 이미지 노출 줄이는 ‘see fewer’ 기능도 곧 제공” Pinterest가 AI로 생성되거나 수정된 이미지에 ‘AI 수정됨’ 라벨을 공식 도입했다. 이번 조치는 AI 콘텐츠의 급증과 그에 따른 신뢰성 논란에 대응하기 위한 것으로, 플랫폼 내 투명성 강화와 사용자 경험 개선에 중점을 두고 있다. 최근 Pinterest는 AI 생성 이미지가 급격히 늘어나면서, 사용자가 진짜와 가짜 이미지를 구분하기 어려워졌다는 지적이 이어졌다. 이에 따라 Pinterest는 AI로 생성되거나 수정된 이미지를 자동으로 감지해 ‘AI 수정됨(AI modified)’ 라벨을 부착하는 시스템을 전면 도입했다.Pinterest는 이미지의 메타데이터와 자체 개발한 AI.. 2025. 5. 2.
딥시크 R2, AI 산업에 ‘두 번째 쇼크’ 예고 GPT-4 대비 2.7% 수준 초저가1.2조 파라미터·다국어·코딩 능력 대폭 강화 중국 AI 스타트업 딥시크(DeepSeek)가 차세대 인공지능 언어모델 ‘딥시크 R2(DeepSeek R2)’를 2025년 4월 말~5월 초 조기 출시한다. 이번 신모델은 1.2조 파라미터의 대형 모델로, 오픈AI GPT-4 터보 대비 토큰당 가격이 2.7%에 불과하며, 코드 생성과 다국어 추론 능력이 대폭 강화된 것이 특징이다. 딥시크는 화웨이 AI칩 기반의 독자적 아키텍처를 활용해 글로벌 AI 시장 판도 변화를 노리고 있다.딥시크 R2 주요 특징 및 경쟁력딥시크 R2는 하이브리드 전문가 혼합(MoE) 3.0 아키텍처와 1.2조 파라미터를 탑재해 기존 R1 대비 두 배 이상 성능을 높였다. 특히, GPT-4 터보의 입력 .. 2025. 4. 30.
AWS, '코딩 에이전트' 벤치마크 SWE-PolyBench 전격 공개 파이썬 한계 넘은 다국어·실전 환경 평가실제 깃허브 이슈 기반, 복합 작업까지 정밀 검증 아마존웹서비스(AWS)가 4월 23일(현지시간) 인공지능(AI) 코딩 에이전트의 실질적 성능을 평가할 수 있는 다국어 벤치마크 'SWE-PolyBench'를 공개했다. 이 벤치마크는 기존 파이썬 중심의 평가 도구 한계를 극복하고, 현실적인 개발 환경에서 다양한 언어와 복합 업무 유형에 대한 AI의 실력을 정밀하게 검증하기 위해 마련됐다. Amazon introduces SWE-PolyBench, a multilingual benchmark for AI Coding Agents | Amazon Web ServicesCoding agents powered by large language models have shown.. 2025. 4. 30.