본문 바로가기

AI개발8

오픈AI, 개발자 대상 '심층 연구 에이전트' 구축 교육 진행 LLM 기반 자율 에이전트 개발 확산 가속화단순 챗봇 넘어, 복잡한 문제 해결하는 '인공지능 비서' 시대 예고 인공지능(AI) 기술의 선두 주자인 오픈AI가 개발자들을 대상으로 대규모 언어 모델(LLM)을 활용한 '심층 연구 에이전트(Deep Research Agents)' 구축 방법을 교육하며 AI 애플리케이션 개발의 새로운 지평을 열고 있다. 이는 단순한 질의응답을 넘어, 복잡하고 전문적인 연구 과제를 스스로 수행하는 **자율 에이전트(Autonomous Agent)**의 확산을 가속화할 것으로 보인다. 오픈AI가 이번에 공개한 가이드에 따르면, 심층 연구 에이전트는 특정 주제에 대한 방대한 정보를 수집, 분석하고 종합하여 인간에게 보고서를 제공하는 복합적인 AI 시스템을 의미한다. 이는 기존 챗봇.. 2025. 6. 30.
구글, 오픈소스 Gemini CLI 출시: 명령줄 기반 AI 개발 시대 개막 개발자들에게 명령줄 인터페이스 통해 AI 모델 활용 및 에이전트 구축 지원AI 개발의 민주화 및 확산 가속화 기대 구글(Google)이 자사의 강력한 인공지능(AI) 모델인 제미나이(Gemini)를 활용하여 AI 에이전트를 개발하고 관리할 수 있는 새로운 명령줄 인터페이스(CLI, Command-Line Interface)를 오픈소스로 출시하며 AI 개발의 새로운 지평을 열었습니다. Gemini CLI, 개발자의 AI 에이전트 구축을 위한 강력한 도구구글이 선보인 'Gemini CLI'는 개발자들이 터미널 환경에서 제미나이 모델을 직접 활용하여 AI 에이전트를 설계하고 배포할 수 있도록 돕는 도구입니다. 이 CLI는 다음과 같은 핵심 기능을 제공합니다.AI 에이전트 생성 및 관리: 개발자는 복잡한 AI .. 2025. 6. 26.
앤스로픽 클로드 코드, 프로/맥스 플랜 사용자에게 혁신적 코딩 지원 제공 강력한 AI 코드 생성 및 분석 기능으로 개발 생산성 극대화전문 사용자를 위한 맞춤형 코딩 도구, AI 개발 환경 변화 예고 인공지능(AI) 스타트업 앤스로픽(Anthropic)이 자사의 대규모 언어 모델(LLM) 클로드(Claude)의 '클로드 코드(Claude Code)' 기능을 프로(Pro) 및 맥스(Max) 플랜 사용자들에게 제공하며 전문 개발자 및 기술 사용자의 코딩 효율성과 생산성을 획기적으로 향상시킬 방침입니다. '클로드 코드', 개발자의 생산성을 위한 AI 조력자클로드 코드 기능은 프로 및 맥스 플랜 구독자에게 고급 코드 생성, 디버깅, 분석 및 최적화 기능을 제공합니다. 이 도구는 특히 복잡한 프로그래밍 작업에서 발생할 수 있는 오류를 줄이고, 코드 작성 시간을 단축하며, 기존 코드의 효.. 2025. 6. 5.
구글, AI 모델 성능 비교 위한 오픈소스 'LMEval' 프레임워크 공개 GPT-4o부터 Claude까지, 통합 벤치마킹으로 AI 모델 객관적 평가 가능멀티모달 지원과 안전성 분석 기능으로 차세대 AI 개발 가속화 구글이 대형 언어 모델과 멀티모달 AI 모델의 성능을 표준화된 방식으로 비교 평가할 수 있는 오픈소스 프레임워크 'LMEval'을 공개했다고 26일 발표했다. 이 도구를 통해 연구자와 개발자들은 GPT-4o, Claude 3.7 Sonnet, Gemini 2.0 Flash, Llama-3.1-405B 등 서로 다른 회사의 AI 모델들을 동일한 기준으로 체계적으로 평가할 수 있게 됐다.AI 모델 비교의 새로운 표준 제시그동안 AI 업계에서는 각 기업이 자체적인 API와 데이터 형식, 벤치마크 설정을 사용해 모델 간 객관적 비교가 어려웠다. 구글은 "LMEval이 이러.. 2025. 5. 27.
OpenAI, ChatGPT에 AI 코딩 에이전트 ‘Codex’ 공식 출시 코드 자동화의 새 시대, AI가 30% 코드 작성클라우드 샌드박스·반복 테스트로 개발 효율성 강화 OpenAI가 2025년 5월 16일, 자사의 최신 AI 코딩 에이전트 ‘Codex’를 ChatGPT에 공식 도입했다. Codex는 클라우드 기반 샌드박스 환경에서 반복 테스트와 멀티태스킹을 지원하며, 소프트웨어 개발 자동화의 새로운 전환점을 예고한다. OpenAI는 16일(현지시각) “Codex는 o3 AI 모델을 소프트웨어 엔지니어링에 최적화한 codex-1을 기반으로, 더 깔끔한 코드와 정확한 명령 이행, 반복 테스트를 제공한다”고 밝혔다. Codex는 사용자의 GitHub 저장소와 연동해 다양한 개발 작업을 동시에 처리할 수 있으며, 클라우드 샌드박스 환경에서 안전하게 실행된다. 업계에 따르면 구글,.. 2025. 5. 19.
아마존, 웹 브라우저 자동 제어하는 AI 에이전트 '노바 액트' 공개 AI 에이전트 경쟁에 본격 뛰어든 아마존경쟁사 대비 6% 성능 앞서... 알렉사 플러스에 이미 통합 중 미국 시애틀에 본사를 둔 글로벌 기술 기업 아마존이 2025년 3월 31일(현지시간) 웹 브라우저를 독립적으로 제어하고 작업을 수행할 수 있는 인공지능 에이전트 '노바 액트(Nova Act)'를 공개했다. 이 기술은 아마존이 최근 샌프란시스코에 설립한 AGI 연구소에서 개발했으며, 개발자들이 프로토타입을 구축할 수 있도록 노바 액트 SDK도 함께 출시했다. 노바 액트는 웹 브라우저 환경에서 사용자를 대신해 온라인 쇼핑, 양식 작성, 예약 등 다양한 작업을 자동으로 수행할 수 있다. 아마존에 따르면 이 AI 에이전트는 화면 텍스트와 상호작용하는 능력을 측정하는 ScreenSpot Web Text 테스트에.. 2025. 4. 1.