분류 전체보기296 AMD, ROCm 6.4 공개로 AI 생태계 확장 본격화 최적화된 컨테이너와 성능 향상으로 AI 워크로드 가속화모듈식 드라이버 구조로 유연한 배포 환경 제공 AMD가 지난 4월 11일 최신 오픈소스 GPU 컴퓨팅 스택인 ROCm 6.4를 공식 출시하며 인공지능 및 고성능 컴퓨팅(HPC) 시장에서의 입지를 강화하고 있다. 이번 업데이트는 AMD Instinct GPU를 위한 사전 최적화된 컨테이너와 성능 개선을 통해 현대적 AI 워크로드의 효율적 처리를 지원하는 데 중점을 두었다. ROCm 6.4의 가장 주목할 만한 특징은 AI 훈련 및 추론을 위한 최적화된 컨테이너 제공이다. 이 컨테이너들은 Llama 3.1, Gemma 3, DeepSeek 등 최신 대형 언어 모델(LLM)을 즉시 지원하도록 설계되어 연구자와 개발자들이 복잡한 설정 과정 없이 바로 작업을 시.. 2025. 4. 23. 대학생 2명이 개발한 AI 음성 모델 'Dia', 구글의 NotebookLM에 도전장 AI 경험 부족에도 불구하고 3개월 만에 개발 성공오픈 액세스 모델로 Hugging Face와 GitHub에서 이용 가능 두 명의 대학생이 인공지능 분야에 깊은 배경 지식 없이도 구글의 NotebookLM과 유사한 팟캐스트 스타일 오디오 클립을 생성할 수 있는 AI 모델을 개발했다. 이들은 지난 4월 22일 Nari Labs를 통해 'Dia'라는 이름의 모델을 공개했으며, 사용자에게 음성 생성에 대한 더 많은 제어권과 "스크립트의 자유"를 제공하는 것을 목표로 했다.Nari Labs의 공동 창업자인 토비 김은 "3개월 전에 음성 AI 탐색을 시작했다"며 구글의 TPU 리서치 클라우드 프로그램을 활용해 모델을 훈련시켰다고 밝혔다. 16억 개의 매개변수를 가진 Dia는 주어진 스크립트에서 대화를 생성하고, .. 2025. 4. 23. Microsoft Copilot Studio, UI 자동화를 위한 '컴퓨터 사용' 기능 발표 AI 혁신의 새로운 전환점비즈니스 효율성을 높이는 자동화 도구 Microsoft는 최근 Copilot Studio에 새로운 '컴퓨터 사용' 기능을 추가하여 UI 자동화를 혁신적으로 변화시키고 있습니다. 이 기능은 사용자가 웹사이트와 데스크톱 애플리케이션과 상호작용할 수 있도록 하여 비즈니스 프로세스를 자동화하는 데 큰 도움을 줄 것으로 기대됩니다. AI 혁신이 가속화되고 있는 가운데, Microsoft Copilot Studio는 비즈니스 문제를 해결하기 위한 플랫폼으로 자리잡고 있습니다. 이번에 발표된 '컴퓨터 사용' 기능은 사용자가 직접 애플리케이션을 조작하는 것처럼, AI 에이전트가 버튼 클릭, 메뉴 선택, 필드 입력 등을 통해 작업을 수행할 수 있게 합니다. 이는 API가 없는 시스템에서도 작업을.. 2025. 4. 21. OpenAI, Windsurf 인수 협상 중 - 30억 달러 규모 AI 코딩 어시스턴트 시장의 경쟁 심화OpenAI의 전략적 결정이 미칠 영향OpenAI가 AI 코딩 어시스턴트인 Windsurf를 약 30억 달러에 인수하기 위한 협상에 들어갔다고 보도되었다. 이 거래가 성사될 경우, OpenAI는 Anysphere와 같은 다른 AI 코딩 어시스턴트 제공업체와 직접 경쟁하게 된다.https://windsurf.com/ Windsurf (formerly Codeium) - The most powerful AI Code EditorWindsurf (formerly Codeium) is the world's most advanced AI coding assistant for developers and enterprises. Windsurf Editor — the first A.. 2025. 4. 21. 인간처럼 말하는 AI? Canopy AI, Llama-3b 기반 오픈소스 TTS 'Orpheus' 공개 Canopy AI가 최첨단 오픈소스 텍스트-음성 변환(TTS) 시스템인 Orpheus-TTS를 공개했다. Llama-3b 대규모 언어 모델(LLM)을 기반으로 개발된 이 시스템은 인간과 유사한 자연스러운 음성 합성과 제로샷 음성 복제 등 LLM의 새로운 가능성을 보여준다.제로샷 음성 복제, 감정 제어까지… LLM 기반 TTS의 놀라운 능력Canopy AI가 발표한 Orpheus-TTS는 기존 폐쇄 소스 TTS 모델을 능가하는 성능을 목표로 개발되었다. 주요 특징은 다음과 같다:인간과 유사한 음성: 자연스러운 억양, 감정, 리듬을 구현하여 사람처럼 들리는 음성을 생성한다.제로샷 음성 복제: 별도의 파인튜닝 과정 없이 새로운 목소리를 즉시 복제할 수 있다.감정 및 억양 제어: 웃음(), 한숨() 등 간단한 .. 2025. 4. 21. 구글, 제미나이 탑재 스마트글래스 시연… '증강 지능' 시대 예고 구글이 최근 TED 강연에서 인공지능(AI) 제미나이(Gemini)를 탑재한 차세대 스마트글래스 시제품을 공개하며, '증강 지능(Augmented Intelligence)' 시대의 비전을 제시했다.실시간 번역, 물건 위치 기억… 제미나이 AI 기반 '프로젝트 아스트라' 첫선구글의 증강현실(AR) 및 확장현실(XR) 부문을 이끄는 샤람 이자디(Shahram Izadi) 부사장은 TED 강연 무대에서 안드로이드 XR 운영체제를 기반으로 구동되는 스마트글래스를 직접 착용하고 시연에 나섰다. 이 스마트글래스는 카메라, 마이크, 스피커는 물론, 렌즈 내부에 초소형 컬러 디스플레이를 탑재해 기존 스마트글래스와 차별화된 경험을 제공한다. 시연의 핵심은 구글의 멀티모달 AI 제미나이와, 이를 기반으로 주변 환경을 인식.. 2025. 4. 19. 이전 1 ··· 9 10 11 12 13 14 15 ··· 50 다음