본문 바로가기

전체 글301

OpenAI, 차세대 음성 AI 모델 '위스퍼 3'와 '보이스 엔진' 공개 "99% 정확도의 위스퍼 3, 실시간 음성 인식의 새 지평 열어""맞춤형 음성 생성 가능한 '보이스 엔진' 상용화 시동" OpenAI가 혁신적인 음성 AI 기술의 새 장을 열었다. 향상된 음성 인식 모델 '위스퍼 3(Whisper 3)'와 음성 합성 시스템 '보이스 엔진(Voice Engine)'을 발표하며 음성 AI 시장의 판도 변화를 예고했다. 위스퍼 3, 인간 수준의 음성 인식 달성위스퍼 3는 기존 모델 대비 대폭 개선된 성능을 자랑한다. 영어 음성 인식에서 99%의 정확도를 달성했으며, 다양한 언어와 악센트에 대한 이해도도 크게 향상됐다.주요 특징:실시간 음성 인식 지원다중 화자 구분 기능배경 소음에 강한 내구성80개 이상 언어 지원"위스퍼 3는 인간의 음성 인식 능력에 근접한 성능을 보여주고 있.. 2025. 3. 23.
2025년 Claude AI의 웹 검색 기능 활용법 목차Claude AI의 혁신적인 웹 검색 기능 인공지능 기술의 발전은 우리의 정보 접근 방식을 근본적으로 변화시키고 있습니다. 그 중심에는 Anthropic의 Claude AI가 있으며, 2025년 가장 주목받는 기능이 바로 '웹 검색' 통합입니다. Claude AI는 이제 인터넷 검색을 통해 실시간으로 최신 정보를 찾아 대화에 통합할 수 있게 되었습니다. 이는 단순한 기능 추가가 아닌, AI와 인터넷의 결합이라는 새로운 패러다임을 열었습니다. 이 글에서는 Claude의 웹 검색 기능이 어떻게 작동하는지, 다양한 분야에서 어떻게 활용할 수 있는지, 그리고 이 혁신적인 기능을 최대한 활용하는 방법을 상세히 알아보겠습니다.  Claude의 웹 검색 기능이란?🔍 Claude의 웹 검색 기능은 AI 대화 중에.. 2025. 3. 21.
LG AI Research, 자체 개발 추론 AI 'EXAONE Deep' 출시... 글로벌 경쟁력 입증 LG AI Research가 자체 개발한 추론 AI 모델 'EXAONE Deep'을 공개했다. 이번에 공개된 모델은 320억 개의 매개변수를 가진 'EXAONE-32B'와 7.8B, 2.4B 등 다양한 규모의 모델로 구성되어 있다. 특히 EXAONE-32B는 앤트로픽의 클로드(Claude)나 OpenAI의 GPT 같은 글로벌 대형 언어 모델과 비교해도 경쟁력 있는 성능을 보여주며 한국 기업의 AI 기술력을 입증했다.적은 매개변수로 글로벌 최고 수준 성능 달성EXAONE-32B는 앤트로픽의 클로드 R1(6710억 개 매개변수)의 단 5% 수준의 매개변수만으로도 글로벌 최고 수준의 성능을 달성했다. 2025학년도 대학 수학능력시험에서 94.5점의 우수한 성적을 기록했으며, 복잡한 문제 해결과 자동 코딩 능력.. 2025. 3. 20.
미스트랄, 2025년 최고 성능의 Small 3.1 멀티모달 모델 출시 목차 🚀 인공지능 기술의 새로운 이정표가 등장했습니다. 미스트랄 AI가 2025년 3월 17일, 자사의 최신 모델인 'Mistral Small 3.1'을 공식 발표했습니다. 이 새로운 모델은 기존 Mistral Small 3의 기반 위에 텍스트 성능 향상, 멀티모달 이해 능력, 그리고 최대 128k 토큰까지 확장된 컨텍스트 윈도우를 제공합니다. 특히 주목할 점은 이 모델이 Gemma 3와 GPT-4o Mini와 같은 유사한 모델보다 우수한 성능을 보이면서도 초당 150 토큰이라는 빠른 추론 속도를 제공한다는 것입니다.   미스트랄 Small 3.1의 주요 특징🌟 성능 및 기술적 발전미스트랄 Small 3.1은 동급 모델 중 최고의 성능을 자랑합니다. 이 모델은 다음과 같은 주요 특징을 갖추고 있습니다.. 2025. 3. 18.
바이두, AI 모델 ERNIE 4.5 및 ERNIE X1 출시로 중국 AI 경쟁 격화 ERNIE 4.5, 멀티모달 이해 능력 강화ERNIE X1, 딥씽킹 모델로 DeepSeek R1 성능에 도전  중국의 기술 기업 바이두가 2025년 3월 16일, 최신 AI 모델인 ERNIE 4.5와 ERNIE X1을 공개하며 중국 내 AI 경쟁에 불을 지폈다. ERNIE 4.5는 멀티모달 이해 능력을 갖춘 기초 모델로, 텍스트와 이미지, 오디오, 비디오를 통합 처리할 수 있으며, ERNIE X1은 딥씽킹(reasoning) 능력을 강화한 모델로 DeepSeek R1과 유사한 성능을 절반의 비용으로 제공한다.    ERNIE 4.5: 멀티모달 이해의 진화바이두의 최신 기초 모델 ERNIE 4.5는 텍스트, 이미지, 오디오, 비디오 등 다양한 데이터 유형을 통합 처리하는 멀티모달 능력을 갖추고 있다. 이 .. 2025. 3. 17.
Google Assistant를 Gemini로 대체: 2025년 안드로이드 사용자가 알아야 할 모든 것 구글이 2025년 후반기에 기존 Google Assistant를 Gemini로 완전히 대체할 예정입니다. 이 변화가 안드로이드 사용자에게 미치는 영향과 Gemini의 새로운 기능에 대해 알아보세요. 18일부터 시작되는 베타 테스트 참여 방법도 확인하세요.구글의 AI 어시스턴트 변화: 새로운 시대의 시작2025년 후반, 구글은 2016년부터 사용되어 온 Google Assistant를 Gemini로 완전히 대체할 예정입니다. 출시된 지 약 1년이 지난 Gemini가 이제 안드로이드 스마트폰의 주요 AI 어시스턴트로 자리매김하게 됩니다. 이는 단순한 기능 업데이트가 아닌, 생성형 AI를 통한 기술 플랫폼의 근본적인 변화를 의미합니다. 🔄 Google Assistant에서 Gemini로: 무엇이 바뀌나요?G.. 2025. 3. 16.