반응형 IT571 구글 Gemma 완벽 가이드: 로컬 환경에서 즐기는 구글의 강력한 오픈 모델 최근 인공지능 기술의 흐름은 거대한 클라우드 서버를 넘어 사용자의 개인 PC, 즉 '로컬 환경'으로 빠르게 확장되고 있습니다. 이러한 변화의 중심에는 구글 딥마인드가 선보인 오픈 모델 'Gemma(젬마)'가 있습니다. 오늘은 개발자와 IT 입문자 모두가 주목해야 할 Gemma의 정체와 이를 로컬 환경에서 효율적으로 구축하는 방법을 심층적으로 분석해 보겠습니다. 1. 구글 Gemma란 무엇인가? 오픈 모델의 새로운 기준Gemma는 구글의 최첨단 AI 모델인 Gemini(제미나이)와 동일한 기술적 뿌리를 공유하는 '경량 오픈 모델'입니다. 구글 딥마인드와 구글 내부의 여러 팀이 협력하여 제작한 이 모델은, 누구나 자유롭게 활용하고 재배포할 수 있는 오픈 소스 성격을 띠고 있어 개발 생태계에 큰 반향을 일으켰.. 2026. 4. 6. 인공지능 인프라 투자 과열… ‘소버린 AI’·인재 양성 총력전 구글 ‘젬마 4’ 공개 및 오픈AI 차세대 모델 ‘스퍼드’ 예고… 보안 결함 우려도 공존 인공지능(AI) 시장의 주도권을 잡기 위한 글로벌 빅테크의 신기술 발표와 인프라 구축 경쟁이 2026년 4월 현재 정점으로 치닫고 있다. 구글은 성능이 대폭 향상된 오픈 모델 ‘젬마 4’를 전격 공개하며 생태계 확장에 나섰으며, 중소벤처기업부는 AI 실무 인재 양성을 위한 ‘이어드림스쿨’ 6기 모집을 오늘(6일)부터 시작하며 국가 차원의 AI 역량 강화에 돌입했다. 6일 IT 업계와 외신 등에 따르면, 오픈AI는 기존 영상 생성 AI ‘소라(Sora)’ 프로젝트의 방향을 수정하고 차세대 비밀 무기인 ‘스퍼드(Spud)’를 수 주 내 공개할 것으로 알려졌다. 샘 올트먼 오픈AI CEO는 이 모델이 “경제를 가속할 .. 2026. 4. 6. Holo3, 실무 자동화 '성공률 78.8%' 달성… "컴퓨터 직접 쓰는 AI 시대" OSWorld 벤치마크서 압도적 성능 입증... 35B·122B 모델 오픈 소스로 공개 단순한 텍스트 답변을 넘어 인간처럼 컴퓨터를 조작하는 AI 모델 'Holo3'가 실무 자동화의 새로운 지평을 열었다. 4일 업계에 따르면, Holo3는 최신 AI 실행력 측정 지표인 OSWorld-Verified 벤치마크에서 78.85%라는 높은 성공률을 기록하며 단순 보조 도구를 넘어선 '실행형 AI'로서의 가능성을 증명했다.Holo3의 핵심은 사람의 감독 하에 화면을 시각적으로 인식하고, 직접 클릭과 타이핑을 수행하며 다단계 작업을 완수하는 능력이다. 기존 LLM(거대언어모델)이 API 연동에 의존했던 것과 달리, Holo3는 일반적인 운영체제 환경에서 인간과 동일한 방식으로 소프트웨어를 제어한다. 개발 측은 연구.. 2026. 4. 4. 알리바바, 옴니모달 'Qwen3.5-Omni' 기습 공개… 구글·오픈AI에 도전장 영상·음성만으로 코딩 척척... 제미나이 3.1 Pro와 대등한 성능 확보 중국 알리바바가 텍스트, 이미지, 오디오, 비디오를 동시에 처리하는 강력한 옴니모달(Omni-modal) AI 모델 'Qwen3.5-Omni'를 공개하며 글로벌 선두권과의 격차를 좁혔다. 특히 별도의 코딩 학습 없이 시각 정보와 음성 지시만으로 복잡한 프로그램을 설계하는 능력을 선보여 업계를 놀라게 했다.Qwen3.5-Omni는 구글의 '제미나이 3.1 Pro'와 대등하거나 일부 지표에서는 이를 상회하는 성능을 보여주는 것으로 나타났다. 가장 큰 특징은 실시간 스트리밍 대화 능력이다. 사용자가 카메라로 주변 환경을 보여주며 실시간으로 질문하면, AI가 즉각적인 오디오 피드백과 함께 관련 정보를 인터넷에서 검색해 답변한다. 이는 구.. 2026. 4. 4. Mistral, 오픈소스 음성 생성 모델 공개 텍스트-to-스피치 분야에서 고품질 오픈 모델로 경쟁 가속… “개발자 중심 AI” 선언 프랑스 AI 스타트업 Mistral AI가 2026년 3월 26일(현지시간) 새로운 오픈소스 음성 생성 모델 ‘Mistral Speech’를 공식 출시했다. 이 모델은 기존 상용 TTS(Text-to-Speech) 모델(Google TTS, ElevenLabs, OpenAI TTS 등) 대비 음성 품질과 자연스러움에서 동등하거나 뛰어나면서도 완전 오픈소스로 공개되어 개발자·기업들의 즉각적인 커스터마이징이 가능하다.Mistral은 모델 가중치, 코드, 학습 데이터셋 구성까지 GitHub에 공개했으며, Hugging Face와 연동해 누구나 1클릭으로 로컬·클라우드에서 실행할 수 있도록 지원한다. 특히 다국어(한국어 포함.. 2026. 3. 30. Mistral, 기업용 커스텀 AI 플랫폼 ‘Forge’ 출시 데이터 완전 통제하며 자체 모델 구축 가능… 유럽 기업 시장 공략 프랑스 AI 스타트업 Mistral이 2026년 3월 22일 ‘Forge’ 플랫폼을 공식 론칭했다. Forge는 기업이 자사 데이터를 100% 프라이빗하게 유지하면서 전용 대형언어모델(LLM)을 구축·배포할 수 있는 엔터프라이즈급 솔루션이다. OpenAI나 AWS의 클라우드 의존을 벗어나 ‘유럽형 데이터 주권’을 강조하며 유럽 기업 시장을 집중 공략하고 있다.Forge의 특징은 ‘Zero-Data-Leak’ 아키텍처다. 모든 학습·추론 과정이 고객 전용 온프레미스 또는 Mistral 전용 VPC 안에서만 이뤄지며, Mistral 본사조차 데이터에 접근할 수 없다. 기업은 Mistral Large 2를 기반으로 미세 조정(Fine-tunin.. 2026. 3. 25. 이전 1 2 3 4 ··· 96 다음 반응형