반응형 전체 글496 "70% 크기, 100% 정확도: LLM 압축 기술의 혁신적 발전" "Dynamic-Length Float (DFloat11) 기술로 LLM 크기 30% 감소""GPU 추론 효율성 향상, 메모리 사용량 최적화" 최근 AI 기술의 발전으로 Large Language Models (LLMs)의 크기가 급격히 증가하면서, 제한된 하드웨어 자원에서의 효율적인 배포가 중요한 과제로 떠오르고 있습니다. 이에 Tianyi Zhang과 그의 동료들이 개발한 Dynamic-Length Float (DFloat11) 기술이 주목받고 있습니다. DFloat11은 LLM의 크기를 30%까지 줄이면서도 원본 모델과 동일한 출력을 제공하는 무손실 압축 프레임워크입니다. 이 기술은 BFloat16 가중치 표현의 낮은 엔트로피를 활용하여, 빈도에 기반한 동적 길이 인코딩을 적용함으로써 정보 최적화에.. 2025. 4. 27. 구글, 워크스페이스에 혁신적 AI 기능 대거 추가... "생산성 혁명 가속화" 오디오 오버뷰와 캔버스 기능으로 업무 효율성 극대화경쟁사와 차별화된 AI 전략으로 기업 사용자 확보 나서 구글이 자사의 생산성 앱 워크스페이스(Workspace)에 다양한 AI 기능을 추가하며 업무 환경 혁신에 박차를 가하고 있다. 이번 업데이트는 제미니(Gemini) AI 모델을 기반으로 한 새로운 도구들을 포함해 사용자들의 업무 방식을 근본적으로 변화시킬 전망이다. 이번에 발표된 신기능 중 가장 주목할 만한 것은 '오디오 오버뷰(Audio Overviews)'와 '캔버스(Canvas)' 기능이다. 오디오 오버뷰는 원래 구글의 NotebookLM에서 처음 선보인 기능으로, 이제 워크스페이스 사용자들도 문서나 프레젠테이션을 업로드하여 팟캐스트 형태의 오디오 파일로 변환할 수 있게 되었다. 구글 관계자는 .. 2025. 4. 24. AMD, ROCm 6.4 공개로 AI 생태계 확장 본격화 최적화된 컨테이너와 성능 향상으로 AI 워크로드 가속화모듈식 드라이버 구조로 유연한 배포 환경 제공 AMD가 지난 4월 11일 최신 오픈소스 GPU 컴퓨팅 스택인 ROCm 6.4를 공식 출시하며 인공지능 및 고성능 컴퓨팅(HPC) 시장에서의 입지를 강화하고 있다. 이번 업데이트는 AMD Instinct GPU를 위한 사전 최적화된 컨테이너와 성능 개선을 통해 현대적 AI 워크로드의 효율적 처리를 지원하는 데 중점을 두었다. ROCm 6.4의 가장 주목할 만한 특징은 AI 훈련 및 추론을 위한 최적화된 컨테이너 제공이다. 이 컨테이너들은 Llama 3.1, Gemma 3, DeepSeek 등 최신 대형 언어 모델(LLM)을 즉시 지원하도록 설계되어 연구자와 개발자들이 복잡한 설정 과정 없이 바로 작업을 시.. 2025. 4. 23. 대학생 2명이 개발한 AI 음성 모델 'Dia', 구글의 NotebookLM에 도전장 AI 경험 부족에도 불구하고 3개월 만에 개발 성공오픈 액세스 모델로 Hugging Face와 GitHub에서 이용 가능 두 명의 대학생이 인공지능 분야에 깊은 배경 지식 없이도 구글의 NotebookLM과 유사한 팟캐스트 스타일 오디오 클립을 생성할 수 있는 AI 모델을 개발했다. 이들은 지난 4월 22일 Nari Labs를 통해 'Dia'라는 이름의 모델을 공개했으며, 사용자에게 음성 생성에 대한 더 많은 제어권과 "스크립트의 자유"를 제공하는 것을 목표로 했다.Nari Labs의 공동 창업자인 토비 김은 "3개월 전에 음성 AI 탐색을 시작했다"며 구글의 TPU 리서치 클라우드 프로그램을 활용해 모델을 훈련시켰다고 밝혔다. 16억 개의 매개변수를 가진 Dia는 주어진 스크립트에서 대화를 생성하고, .. 2025. 4. 23. Microsoft Copilot Studio, UI 자동화를 위한 '컴퓨터 사용' 기능 발표 AI 혁신의 새로운 전환점비즈니스 효율성을 높이는 자동화 도구 Microsoft는 최근 Copilot Studio에 새로운 '컴퓨터 사용' 기능을 추가하여 UI 자동화를 혁신적으로 변화시키고 있습니다. 이 기능은 사용자가 웹사이트와 데스크톱 애플리케이션과 상호작용할 수 있도록 하여 비즈니스 프로세스를 자동화하는 데 큰 도움을 줄 것으로 기대됩니다. AI 혁신이 가속화되고 있는 가운데, Microsoft Copilot Studio는 비즈니스 문제를 해결하기 위한 플랫폼으로 자리잡고 있습니다. 이번에 발표된 '컴퓨터 사용' 기능은 사용자가 직접 애플리케이션을 조작하는 것처럼, AI 에이전트가 버튼 클릭, 메뉴 선택, 필드 입력 등을 통해 작업을 수행할 수 있게 합니다. 이는 API가 없는 시스템에서도 작업을.. 2025. 4. 21. OpenAI, Windsurf 인수 협상 중 - 30억 달러 규모 AI 코딩 어시스턴트 시장의 경쟁 심화OpenAI의 전략적 결정이 미칠 영향OpenAI가 AI 코딩 어시스턴트인 Windsurf를 약 30억 달러에 인수하기 위한 협상에 들어갔다고 보도되었다. 이 거래가 성사될 경우, OpenAI는 Anysphere와 같은 다른 AI 코딩 어시스턴트 제공업체와 직접 경쟁하게 된다.https://windsurf.com/ Windsurf (formerly Codeium) - The most powerful AI Code EditorWindsurf (formerly Codeium) is the world's most advanced AI coding assistant for developers and enterprises. Windsurf Editor — the first A.. 2025. 4. 21. 이전 1 ··· 42 43 44 45 46 47 48 ··· 83 다음 반응형