본문 바로가기
반응형

IT239

구글, 워크스페이스에 혁신적 AI 기능 대거 추가... "생산성 혁명 가속화" 오디오 오버뷰와 캔버스 기능으로 업무 효율성 극대화경쟁사와 차별화된 AI 전략으로 기업 사용자 확보 나서 구글이 자사의 생산성 앱 워크스페이스(Workspace)에 다양한 AI 기능을 추가하며 업무 환경 혁신에 박차를 가하고 있다. 이번 업데이트는 제미니(Gemini) AI 모델을 기반으로 한 새로운 도구들을 포함해 사용자들의 업무 방식을 근본적으로 변화시킬 전망이다. 이번에 발표된 신기능 중 가장 주목할 만한 것은 '오디오 오버뷰(Audio Overviews)'와 '캔버스(Canvas)' 기능이다. 오디오 오버뷰는 원래 구글의 NotebookLM에서 처음 선보인 기능으로, 이제 워크스페이스 사용자들도 문서나 프레젠테이션을 업로드하여 팟캐스트 형태의 오디오 파일로 변환할 수 있게 되었다. 구글 관계자는 .. 2025. 4. 24.
AMD, ROCm 6.4 공개로 AI 생태계 확장 본격화 최적화된 컨테이너와 성능 향상으로 AI 워크로드 가속화모듈식 드라이버 구조로 유연한 배포 환경 제공 AMD가 지난 4월 11일 최신 오픈소스 GPU 컴퓨팅 스택인 ROCm 6.4를 공식 출시하며 인공지능 및 고성능 컴퓨팅(HPC) 시장에서의 입지를 강화하고 있다. 이번 업데이트는 AMD Instinct GPU를 위한 사전 최적화된 컨테이너와 성능 개선을 통해 현대적 AI 워크로드의 효율적 처리를 지원하는 데 중점을 두었다. ROCm 6.4의 가장 주목할 만한 특징은 AI 훈련 및 추론을 위한 최적화된 컨테이너 제공이다. 이 컨테이너들은 Llama 3.1, Gemma 3, DeepSeek 등 최신 대형 언어 모델(LLM)을 즉시 지원하도록 설계되어 연구자와 개발자들이 복잡한 설정 과정 없이 바로 작업을 시.. 2025. 4. 23.
대학생 2명이 개발한 AI 음성 모델 'Dia', 구글의 NotebookLM에 도전장 AI 경험 부족에도 불구하고 3개월 만에 개발 성공오픈 액세스 모델로 Hugging Face와 GitHub에서 이용 가능 두 명의 대학생이 인공지능 분야에 깊은 배경 지식 없이도 구글의 NotebookLM과 유사한 팟캐스트 스타일 오디오 클립을 생성할 수 있는 AI 모델을 개발했다. 이들은 지난 4월 22일 Nari Labs를 통해 'Dia'라는 이름의 모델을 공개했으며, 사용자에게 음성 생성에 대한 더 많은 제어권과 "스크립트의 자유"를 제공하는 것을 목표로 했다.Nari Labs의 공동 창업자인 토비 김은 "3개월 전에 음성 AI 탐색을 시작했다"며 구글의 TPU 리서치 클라우드 프로그램을 활용해 모델을 훈련시켰다고 밝혔다. 16억 개의 매개변수를 가진 Dia는 주어진 스크립트에서 대화를 생성하고, .. 2025. 4. 23.
Microsoft Copilot Studio, UI 자동화를 위한 '컴퓨터 사용' 기능 발표 AI 혁신의 새로운 전환점비즈니스 효율성을 높이는 자동화 도구 Microsoft는 최근 Copilot Studio에 새로운 '컴퓨터 사용' 기능을 추가하여 UI 자동화를 혁신적으로 변화시키고 있습니다. 이 기능은 사용자가 웹사이트와 데스크톱 애플리케이션과 상호작용할 수 있도록 하여 비즈니스 프로세스를 자동화하는 데 큰 도움을 줄 것으로 기대됩니다. AI 혁신이 가속화되고 있는 가운데, Microsoft Copilot Studio는 비즈니스 문제를 해결하기 위한 플랫폼으로 자리잡고 있습니다. 이번에 발표된 '컴퓨터 사용' 기능은 사용자가 직접 애플리케이션을 조작하는 것처럼, AI 에이전트가 버튼 클릭, 메뉴 선택, 필드 입력 등을 통해 작업을 수행할 수 있게 합니다. 이는 API가 없는 시스템에서도 작업을.. 2025. 4. 21.
OpenAI, Windsurf 인수 협상 중 - 30억 달러 규모 AI 코딩 어시스턴트 시장의 경쟁 심화OpenAI의 전략적 결정이 미칠 영향OpenAI가 AI 코딩 어시스턴트인 Windsurf를 약 30억 달러에 인수하기 위한 협상에 들어갔다고 보도되었다. 이 거래가 성사될 경우, OpenAI는 Anysphere와 같은 다른 AI 코딩 어시스턴트 제공업체와 직접 경쟁하게 된다.https://windsurf.com/ Windsurf (formerly Codeium) - The most powerful AI Code EditorWindsurf (formerly Codeium) is the world's most advanced AI coding assistant for developers and enterprises. Windsurf Editor — the first A.. 2025. 4. 21.
인간처럼 말하는 AI? Canopy AI, Llama-3b 기반 오픈소스 TTS 'Orpheus' 공개 Canopy AI가 최첨단 오픈소스 텍스트-음성 변환(TTS) 시스템인 Orpheus-TTS를 공개했다. Llama-3b 대규모 언어 모델(LLM)을 기반으로 개발된 이 시스템은 인간과 유사한 자연스러운 음성 합성과 제로샷 음성 복제 등 LLM의 새로운 가능성을 보여준다.제로샷 음성 복제, 감정 제어까지… LLM 기반 TTS의 놀라운 능력Canopy AI가 발표한 Orpheus-TTS는 기존 폐쇄 소스 TTS 모델을 능가하는 성능을 목표로 개발되었다. 주요 특징은 다음과 같다:인간과 유사한 음성: 자연스러운 억양, 감정, 리듬을 구현하여 사람처럼 들리는 음성을 생성한다.제로샷 음성 복제: 별도의 파인튜닝 과정 없이 새로운 목소리를 즉시 복제할 수 있다.감정 및 억양 제어: 웃음(), 한숨() 등 간단한 .. 2025. 4. 21.
반응형