본문 바로가기
반응형

분류 전체보기549

새 AI '문드림 3' 공개... 20억 활성 파라미터로 '경이로운' 성능 MoE 아키텍처로 소비자용 하드웨어에서 구동 가능객체 탐지, 시각 추론, GUI 분석까지... '과소평가된 모델' 평가 새로운 소형 비전 언어 모델(VLM) '문드림 3(Moondream 3)'가 공개되어 주목받고 있다. 이 모델은 총 90억 개의 파라미터를 가졌지만, 전문가 혼합(MoE) 아키텍처를 사용해 실제 활성 파라미터는 20억 개에 불과하다. 작은 크기에도 불구하고 "현재 최고의(goated) 모델 중 하나"이자 "경이로운" 성능을 보여준다는 평가다.문드림 3는 소비자용 하드웨어에서도 실행할 수 있을 만큼 가벼운 것이 특징이다. 허깅페이스(Hugging Face)를 통해 모델에 접근할 수 있으나, 전용 토큰을 사용한 접근 승인이 필요하다. 라이선스 측면에서는 상업적 이용은 가능하지만, 모델 자체.. 2025. 11. 16.
OpenAI, GPT-5.1 성능 극대화 위한 '프롬프트 가이드' 공개 '메타프롬프팅' 도입… AI가 스스로 프롬프트 오류 수정코딩 오류 35% 줄이는 'apply_patch' 툴 등 개발자 제어 기능 강화 OpenAI가 새로운 GPT-5.1 모델의 성능을 극대화하고 개발자들의 워크플로 전환을 돕기 위한 공식 프롬프트 가이드를 발표했다. 이번 가이드는 GPT-5.1의 향상된 에이전트 제어 기능, 코딩 성능 최적화, 그리고 '메타프롬프팅'과 같은 새로운 기법을 중점적으로 다룬다.가이드는 우선 기존 모델 사용자를 위한 마이그레이션 경로를 제시한다. GPT-4.1에서 업그레이드하는 경우, 이전 모델과 유사하게 낮은 지연 시간으로 작동하는 새로운 'none' 추론 모드 사용이 권장된다. 반면 GPT-5에서 전환하는 경우, GPT-5.1이 때때로 "지나치게 간결할(excessivel.. 2025. 11. 16.
OpenAI, GPT-5.1 공개... 더 따뜻한 AI '인스턴트'·'씽킹' 2종 분리… 적응형 추론 도입8개 성격 프리셋·이모지 조절 등 개인화 강화 OpenAI가 11월 12일(현지시간) ChatGPT의 주요 업데이트인 GPT-5.1을 발표했다. 이번 업데이트는 GPT-5의 혼합된 반응 이후, 사용자의 피드백을 반영해 '더 스마트하고 즐겁게 대화할 수 있는' AI를 제공하는 데 초점을 맞췄다. 핵심은 'GPT-5.1 인스턴트'와 'GPT-5.1 씽킹'이라는 두 가지 새로운 모델 변형과 대폭 강화된 개인화 기능이다.GPT-5.1 인스턴트는 가장 많이 사용되는 모델로, 더 빠르고 자연스러운 대화를 제공하며 기본적으로 '더 따뜻한' 톤을 갖도록 설계됐다. 특히 이번 버전은 처음으로 '가벼운 적응형 추론'을 사용해, 간단한 질문에는 신속하게 답하고 어려운 질문.. 2025. 11. 13.
구글, ‘프라이빗 AI 컴퓨트’ 공개… “클라우드 AI도 개인정보 보호” 제미나이 클라우드 모델 성능과 온디바이스급 개인정보 보호 결합픽셀 10 ‘매직 큐’ 등 민감 정보 다루는 기능에 우선 적용 구글이 클라우드 기반 AI 모델의 성능과 온디바이스(기기 내장) 수준의 강력한 개인정보 보호 기능을 결합한 새로운 AI 처리 플랫폼 ‘프라이빗 AI 컴퓨트(Private AI Compute)’를 11일(현지시간) 공개했다.프라이빗 AI 컴퓨트는 사용자의 개인 데이터가 구글을 포함한 어느 누구에게도 접근 불가능하도록 비공개로 유지하면서, 제미나이(Gemini) 클라우드 모델의 속도와 성능을 AI 경험에 활용할 수 있게 한다. 구글은 이 기술이 민감한 정보를 처리할 때에도 데이터가 격리되고 비공개로 유지되는 ‘강화된 보안 공간’에서 작동한다고 설명했다. 이는 기기 내에서(on-devic.. 2025. 11. 12.
구글, AI 사진 편집 ‘나노 바나나’·‘애스크 포토’ 공개 제미나이 앱, ‘나노 바나나’ 모델로 일관성 있는 인물 수정구글 포토 ‘애스크 포토’, 100개국·17개 언어 확대 구글이 제미나이(Gemini) 앱과 구글 포토의 AI 기능을 대폭 강화했다. 구글은 딥마인드의 최신 이미지 편집 모델인 ‘나노 바나나(Nano Banana)’를 제미나이 앱에 도입하고, 구글 포토의 AI 검색 기능인 ‘애스크 포토(Ask Photos)’를 100개국 이상으로 확대한다고 밝혔다.‘나노 바나나’는 구글 딥마인드가 개발한 ‘제미나이 2.5 플래시 이미지(Gemini 2.5 Flash Image)’ 모델의 별칭이다. 이 기능은 제미나이 앱에 탑재되어 사용자가 사진 속 인물의 모습을 일관되게 유지하면서 의상, 배경, 직업 등을 변경할 수 있게 돕는다. 또한 여러 장의 사진을 자연스럽.. 2025. 11. 12.
MS, 자체 개발 AI 이미지 생성기 ‘MAI-Image-1’ 공개 ‘사실적 묘사’에 중점… LMArena 리더보드 톱 10 진입코파일럿·빙 이미지 크리에이터에 곧 탑재 예정 마이크로소프트(MS)가 2025년 10월 13일, 첫 번째 자체 개발(in-house) 텍스트-이미지 AI 모델인 ‘MAI-Image-1’을 발표했다. 이 모델은 특히 고품질의 사실적인 이미지 생성에 중점을 두고 개발됐다. MAI-Image-1은 커뮤니티 기반 LMArena 리더보드에서 공개 직후 텍스트-이미지 모델 부문 10위권에 진입하며 경쟁력을 입증했다. MS에 따르면 이 모델은 사실적인 조명, 복잡한 구도, 자연스러운 질감 표현에 강점을 보인다. 이는 일반적인 이미지 생성 외에도 게임, 영화 등 전문적인 창작 워크플로우에서 아티스트와 디자이너가 복잡한 아이디어를 빠르게 시각화하는 데 도움을 .. 2025. 11. 5.
반응형