본문 바로가기
반응형

분류 전체보기543

구글, 제미나이 2.5 플래시 이미지 일반 공개...10가지 화면 비율 지원 확대 '나노 바나나' 코드명, 일관된 캐릭터 유지·자연어 정밀 편집 기능 강화개발자는 AI 스튜디오 및 Vertex AI에서 활용 가능, GIF 생성 기능도 추가 구글이 이미지 생성 및 편집 모델인 ‘제미나이 2.5 플래시 이미지(Gemini 2.5 Flash Image)’를 일반 공개(GA)하고, 개발자 환경에서 즉시 사용할 수 있도록 했다. 코드명 ‘나노 바나나(Nano Banana)’로도 불리는 이 모델은 10가지에 달하는 다양한 화면 비율 지원과 함께 일관된 캐릭터 유지 등 창작의 자유도를 대폭 확장하는 신규 기능을 탑재했다. 이번 업데이트는 이미지 생성 및 편집 워크플로우를 가속화하고, 사용자가 시네마틱 풍경부터 소셜 미디어용 세로 이미지까지 다양한 플랫폼에 최적화된 콘텐츠를 쉽게 제작하도록 돕는 데.. 2025. 10. 5.
Character.AI, 메타 출신 새 CEO 영입… “AI가 대화하는 방식 바꿀 것” 카란딥 아난드 CEO, TechCrunch Disrupt 2025 AI 스테이지 연사로 나서취임 후 60일 로드맵 공개: “과도한 필터 완화, 메모리 및 모델 품질 개선 약속” AI 챗봇 플랫폼 Character.AI가 카란딥 아난드(Karandeep Anand) 신임 최고경영자(CEO)를 선임하고, 다가오는 TechCrunch Disrupt 2025 행사에서 미래 전략을 공개할 예정으로 주목받고 있다. 아난드 CEO는 Microsoft, Meta(페이스북), Brex 등 주요 테크 기업에서 핵심적인 역할을 수행하며 소비자 제품 확장에 능통한 베테랑이다. 그는 Meta에서 비즈니스 제품 총괄 부사장을 역임했으며, 취임 전 9개월 동안 Character.AI의 이사회 자문위원으로 활동하며 제품 전략을 구축.. 2025. 10. 1.
OpenAI, ‘소라 2’ 모델과 ‘틱톡 대항마’ 소셜 앱 동시 출시 AI 생성 영상 전용 플랫폼 'Sora 앱' 공개… 틱톡과 유사한 알고리즘 피드 채택새로운 ‘카메오(Cameo)’ 기능 탑재… 사용자 본인과 친구 얼굴 AI 영상에 구현 Sora 2 is here. pic.twitter.com/hy95wDM5nB— OpenAI (@OpenAI) September 30, 2025인공지능(AI) 개발사 OpenAI가 차세대 동영상 생성 모델인 ‘Sora 2’를 공개하는 동시에, 이를 활용한 ‘Sora 앱(App)’을 출시하며 소셜 미디어 시장에 진출했다. 특히 이 앱은 AI 생성 영상만을 위한 틱톡(TikTok) 스타일의 경쟁 플랫폼을 표방한다. Sora 앱은 사용자들이 텍스트 설명만으로 최대 10초 길이의 AI 영상을 만들고, 이를 알고리즘 기반의 세로 피드에서 공유할 수.. 2025. 10. 1.
엔트로픽, “세계 최고 코딩 AI” '클로드 소네트 4.5' 공개 에이전트 기능 대폭 강화… 복잡한 장기 코딩 작업에서 강점API 가격은 이전 모델과 동일, 토큰당 $3/$15 유지해 가격 경쟁력 확보 인공지능(AI) 기업 엔트로픽(Anthropic)이 코딩과 복잡한 에이전트(Agent) 작업에서 “세계 최고” 수준의 성능을 구현하는 새로운 대규모 언어 모델(LLM)인 ‘클로드 소네트 4.5(Claude Sonnet 4.5)’를 9월 29일(현지시간) 출시했다. 엔트로픽은 소네트 4.5가 특히 코딩 및 컴퓨터 사용에서 자사의 모델 중 가장 뛰어난 성능을 보이며, 복잡한 에이전트를 구축하는 데 가장 강력한 모델이라고 강조했다. 모델은 SWE-bench Verified 벤치마크에서 77.2%의 성능을 달성하며 코딩 분야의 새로운 경계를 확장했다. 장기 코딩 프로젝트와 에이.. 2025. 9. 30.
OpenAI, 챗GPT를 '능동적 비서'로 전환한다 모바일 'Pro' 사용자 대상 'ChatGPT Pulse' 선공개챗 기록·피드백 기반 맞춤형 업데이트… 캘린더 연동 기능 추가 인공지능(AI) 연구 기업 OpenAI가 챗지피티(ChatGPT)를 사용자의 질문에 답하는 수동적 방식에서 벗어나, 먼저 정보를 제공하고 업무를 제안하는 능동적인 AI 비서로 전환한다. OpenAI는 9월 25일(현지시간) 모바일 'ChatGPT Pulse' 기능을 Pro 사용자에게 선공개한다고 밝혔다. 이 기능은 챗지피티가 사용자의 채팅 내역, 피드백, 그리고 연결된 외부 앱(Gmail, Google Calendar 등) 정보를 종합해 맞춤형 업데이트와 후속 조치 아이디어를 제공하는 새로운 경험이다.질문 없어도 필요한 정보 먼저 제공하는 'Pulse'OpenAI는 그동안 사용자.. 2025. 9. 29.
마이크로소프트, 최대 90분 길이 팟캐스트 제작 가능한 AI 모델 '바이브보이스' 공개 다중 화자 대화·감정 표현 구사... "자발적 노래 생성 능력까지 잠재"초저프레임 오디오 토크나이저 혁신, 긴 오디오 시퀀스 처리 효율 극대화 인공지능(AI) 기술팀 = 마이크로소프트(MS)가 팟캐스트와 같은 긴 형식의 다중 화자 대화 오디오를 텍스트로 생성하는 새로운 AI 모델 '바이브보이스(VibeVoice)'를 공개했다. 이 모델은 최대 90분 길이의 연속적인 음성 합성이 가능하며, 자연스러운 감정 표현과 화자 일관성 유지 능력을 통해 기존 텍스트-음성 변환(TTS) 기술의 한계를 뛰어넘었다는 평가를 받는다. 최근 팟캐스트, 오디오북 등 장문 오디오 콘텐츠 시장이 급성장하고 있으나, 기존의 TTS 모델은 대부분 짧은 문장이나 단일 화자 음성 생성에 초점을 맞추어 왔다. 여러 화자가 등장하는 긴 대화.. 2025. 9. 28.
반응형