본문 바로가기
반응형

전체 글189

알리바바, AI 경쟁 격화 속 'QwQ-32B' 공개…주가 8% 급등 "딥식 R1 대비 1/20 규모로 동등 성능" 주장오픈소스 전략으로 글로벌 생태계 확장 가속화 중국 알리바바가 3월 6일 새로운 AI 추론 모델 'QwQ-32B'를 공개하며 자국 내 AI 스타트업 딥식(DeepSeek)과의 경쟁에 본격적으로 뛰어들었다. 이 모델은 32억 개의 매개변수로 구성됐음에도 딥식의 671억 매개변수 모델 'R1'과 동등한 성능을 구현하며, 기술 효율성 측면에서 국제적 주목을 받고 있다. 발표 직후 홍콩 증시에서 알리바바 주가는 8% 급등했다.1. 기술적 혁신과 시장 영향QwQ-32B는 알리바바 클라우드의 Qwen 팀이 개발한 오픈소스 모델로, Apache 2.0 라이선스로 공개됐다. 수학 문제 해결(AIME24) 벤치마크에서 79.5점을 기록해 딥식 R1(79.8점)과 0.3점 .. 2025. 3. 7.
Mistral OCR API: 문서 처리 혁신으로 AI 시대 열다 PDF를 마크다운으로 변환, 기업용 AI 워크플로우 가속화  Mistral OCR | Mistral AIIntroducing the world’s best document understanding API.mistral.ai AI 스타트업 미스트랄(Mistral)이 3월 6일, 복잡한 PDF 문서를 AI 처리에 최적화된 마크다운 형식으로 변환하는 새로운 OCR(광학 문자 인식) API를 출시했다. 이 기술은 수학 공식, 다국어 문서, 표 및 이미지가 혼재된 파일도 정확하게 처리하며, 기업의 내부 문서를 대규모 언어 모델(LLM)에 통합하는 과정을 혁신할 것으로 기대된다. AI 시대의 문서 처리 패러다임 전환다중 모달 기능으로 텍스트·이미지 통합 인식기존 OCR과 달리 미스트랄 OCR API는 ▲그래픽 요소.. 2025. 3. 7.
OpenAI, ChatGPT에 AI 영상 생성기 '소라' 통합 예정…콘텐츠 제작 혁신 예고 AI 비디오 툴의 플랫폼 통합으로 창작 생태계 변화 전망접근성 vs 전문성 논란 속 업계 경쟁 본격화 오픈AI가 AI 영상 생성 모델 '소라(Sora)'를 ChatGPT에 통합할 계획을 발표하며 생성형 AI 시장에 새 지각변동을 예고했습니다. 이번 조치는 일반 사용자들이 별도 플랫폼 전환 없이 텍스트 채팅 인터페이스 내에서 영상 콘텐츠를 제작할 수 있도록 함으로써, AI 기반 크리에이티브 도구의 민주화를 가속화할 전망입니다. 2025년 3월 2일 디스코드 Q&A 세션에서 공개된 이 계획은 ▲통합 일정 ▲기능 제한 ▲업계 영향 등 다양한 논점을 양산하고 있습니다.1. 통합 전략의 핵심 포인트플랫폼 간 시너지 창출현재 소라는 별도 웹앱(https://sora.com)에서 운영되며 텍스트 프롬프트 기반 20초.. 2025. 3. 2.
오픈AI, 감성지능 강화 및 성능 개선된 GPT-4.5 '오리온' 공식 출시 2월 28일 공식 출시…월 200달러 프로 구독자 우선 제공"감성지능 47% 향상·환각 현상 40% 감소" 성능 개선 주장 오픈AI가 2025년 2월 28일(현지시간) 차세대 AI 모델 GPT-4.5 '오리온(Orion)'을 공식 출시했습니다. 이 모델은 ▲역대 최대 규모의 파라미터 ▲감성지능(EQ) 강화 ▲멀티모달 기능 통합 등 3대 혁신을 내세웠으나, 동시에 ▲과도한 연산 비용 ▲애니악 효과(기술 발전 속도 저하) 논란이라는 도전과제도 노출시켰습니다.기술적 도약의 상징GPT-4.5는 2023년 GPT-4 출시 이후 2년 만에 공개된 메이저 업데이트입니다. 테크크런치에 따르면 이 모델은 1.8조 개의 파라미터를 자랑하며, 전작 대비 300% 증가한 학습 데이터셋을 활용했습니다. 오픈AI 미아 글레제스 .. 2025. 2. 28.
ElevenLabs, 차세대 음성인식 모델 'Scribe' 출시 99개 언어 지원·초고정확도 기술로 글로벌 시장 공략 가속화엔터프라이즈 솔루션부터 개인 창작자 지원까지...음성 AI 생태계 확장 ElevenLabs가 2025년 2월 27일 자체 개발한 차세대 음성인식 모델 'Scribe'를 정식 출시하며 AI 음성 기술 분야에서 또 한 번 기술적 도약을 이루어냈습니다. 이번 출시는 2024년 1월 8천만 달러 규모의 시리즈 B 펀딩 유치에 이은 주요 기술 혁신 사례로 평가받으며, 기업용 음성 솔루션 시장에서의 경쟁력을 한층 강화할 것으로 기대됩니다.기술 혁신의 핵심: Scribe 모델의 차별화된 성능Scribe 모델은 99개 이상의 언어를 지원하며 이 중 25개 언어에서는 5% 미만의 오류율을 기록, 기존 음성인식 솔루션과 비교해 뛰어난 정확도를 입증했습니다. 특히 .. 2025. 2. 27.
윈도우에서 Claude Code 설치하기: AI 코딩 파트너로 개발 생산성 높이기 개발자라면 누구나 코딩 작업을 더 효율적으로 만들어줄 도구를 찾고 있습니다. 최근 인공지능의 발전으로 코딩 작업에 혁신적인 변화가 일어나고 있으며, 그 중심에 Anthropic의 Claude Code가 있습니다. 이 글에서는 Windows 환경에서 Claude Code를 설치하고 활용하는 방법을 알아보겠습니다. Claude Code란 무엇인가?Claude Code는 터미널에서 작동하고 코드베이스를 이해하며 자연어 명령을 통해 더 빠른 코딩을 도와주는 에이전트 코딩 도구입니다. 개발 환경에 직접 통합되어 코딩 작업의 효율성을 크게 향상시킵니다. 분석, 예측, 콘텐츠 생성, 코드 생성 등의 능력이 뛰어나며, 비영어 언어에 대한 대화 능력도 갖추고 있어 글로벌 개발자들에게 유용합니다.Windows에서 Clau.. 2025. 2. 26.
반응형