본문 바로가기

llm26

새로운 연구, 애플 LLM 추론 능력 저하 연구에 반박 제기 대규모 언어 모델 '추론 붕괴' 현상, 연구 방법론에 의문 제기AI 모델의 안정적 진화 가능성 시사…학계 논의 활발 최근 발표된 한 연구 보고서가 애플(Apple)이 제기했던 대규모 언어 모델(LLM)의 '추론 붕괴(reasoning collapse)' 현상에 대해 반박을 제기하며, AI 모델의 장기적 안정성과 발전 가능성에 대한 학계의 논의를 재점화하고 있다. 이는 AI 모델의 성능 변화를 평가하는 방법론의 중요성을 부각시키며, 관련 연구의 신뢰도에 대한 심층적인 검토를 요구하고 있다.애플의 '추론 붕괴' 연구와 새로운 반박의 배경앞서 애플 연구진은 LLM이 자체 생성한 데이터를 통해 반복적으로 훈련될 경우, 시간이 지남에 따라 '추론 붕괴' 현상이 발생하여 모델의 추론 능력이 저하될 수 있다는 연구 .. 2025. 6. 17.

메타, 내부 위험 및 데이터 보호 점검 90% AI로 자동화 추진…보안·규제 준수 강화 소셜 미디어 기업 메타(Meta)가 내부 위험 관리 및 데이터 보호 점검의 90%를 인공지능(AI)으로 자동화할 계획이라고 밝혔습니다. AI 시대의 복잡성 대응: 데이터 보호의 새로운 해법메타는 방대한 사용자 데이터와 끊임없이 변화하는 규제 환경 속에서 내부 시스템의 위험을 효과적으로 관리하고 데이터 보호를 강화하기 위해 AI 기술을 전면에 내세우고 있습니다. 기존의 수동적인 점검 방식으로는 증가하는 데이터 양과 복잡성을 감당하기 어렵다는 판단에 따른 것입니다. AI 기반 자동화는 잠재적 취약점을 신속하게 식별하고, 데이터 유출 위험을 줄이며, 규제 준수 여부를 실시간으로 모니터링하는 데 기여할 것으로 기대됩니다.효율성 및 신뢰성 동시 확보: LLM 기반 자동화 시스템 구축메타는 대규모 언어 모델(LLM.. 2025. 6. 2.

앤스로픽 클로드, 음성 기능에 일레븐랩스 기술 채택 인공지능(AI) 스타트업 앤스로픽(Anthropic)의 대규모 언어 모델(LLM) 클로드(Claude)가 음성 기능 구현을 위해 자체 개발 모델 대신 음성 AI 전문 기업 일레븐랩스(ElevenLabs)의 기술을 채택한 것으로 알려지면서, AI 업계의 협업과 전문화 추세가 더욱 가속화될 것이라는 분석이 나오고 있습니다. 클로드, 음성 기능 강화 위해 '일레븐랩스'와 손잡다앤스로픽은 클로드의 음성 상호작용 기능을 강화하기 위해 일레븐랩스의 첨단 음성 합성 기술을 통합했습니다. 일레븐랩스는 자연스럽고 감성적인 음성 생성 능력으로 잘 알려진 기업으로, 그들의 기술을 통해 클로드는 더욱 풍부하고 인간적인 음성 대화 경험을 제공할 수 있게 될 것입니다. 이러한 결정은 앤스로픽이 LLM 개발이라는 핵심 역량에 집중.. 2025. 6. 1.

"70% 크기, 100% 정확도: LLM 압축 기술의 혁신적 발전" "Dynamic-Length Float (DFloat11) 기술로 LLM 크기 30% 감소""GPU 추론 효율성 향상, 메모리 사용량 최적화" 최근 AI 기술의 발전으로 Large Language Models (LLMs)의 크기가 급격히 증가하면서, 제한된 하드웨어 자원에서의 효율적인 배포가 중요한 과제로 떠오르고 있습니다. 이에 Tianyi Zhang과 그의 동료들이 개발한 Dynamic-Length Float (DFloat11) 기술이 주목받고 있습니다. DFloat11은 LLM의 크기를 30%까지 줄이면서도 원본 모델과 동일한 출력을 제공하는 무손실 압축 프레임워크입니다. 이 기술은 BFloat16 가중치 표현의 낮은 엔트로피를 활용하여, 빈도에 기반한 동적 길이 인코딩을 적용함으로써 정보 최적화에.. 2025. 4. 27.

AMD, ROCm 6.4 공개로 AI 생태계 확장 본격화 최적화된 컨테이너와 성능 향상으로 AI 워크로드 가속화모듈식 드라이버 구조로 유연한 배포 환경 제공 AMD가 지난 4월 11일 최신 오픈소스 GPU 컴퓨팅 스택인 ROCm 6.4를 공식 출시하며 인공지능 및 고성능 컴퓨팅(HPC) 시장에서의 입지를 강화하고 있다. 이번 업데이트는 AMD Instinct GPU를 위한 사전 최적화된 컨테이너와 성능 개선을 통해 현대적 AI 워크로드의 효율적 처리를 지원하는 데 중점을 두었다. ROCm 6.4의 가장 주목할 만한 특징은 AI 훈련 및 추론을 위한 최적화된 컨테이너 제공이다. 이 컨테이너들은 Llama 3.1, Gemma 3, DeepSeek 등 최신 대형 언어 모델(LLM)을 즉시 지원하도록 설계되어 연구자와 개발자들이 복잡한 설정 과정 없이 바로 작업을 시.. 2025. 4. 23.

오픈AI, 오픈소스 전환 검토: 인공지능 생태계 변화의 신호탄? 오픈AI, 오픈소스 전환 가능성 검토…"AI 생태계 판도 바꿀까""역사의 잘못된 편에 섰다" 샘 알트먼 CEO의 전략 수정 발표 1. 오픈AI의 전략 전환 배경최근 오픈AI는 폐쇄형 AI 모델 개발 전략을 재검토하며, 오픈소스 전환 가능성을 공식화했습니다. 샘 알트먼 CEO는 2월 1일 레딧 AMA 세션에서 "오픈소스 전략을 재정비해야 한다"고 밝히며, 이는 중국의 경쟁사 딥씽(DeepSeek)이 공개한 고성능·저비용 오픈소스 모델의 등장에 대응하기 위한 움직임으로 분석됩니다. 📊 핵심 통계:2023년 오픈소스 소프트웨어 사용량은 전년 대비 41% 증가(State of Open Source 보고서)오픈소스 AI 모델 시장 점유율은 2027년까지 기업용 AI의 40% 차지 전망2. 산업계 반응과 기술적 .. 2025. 2. 5.

이전 1 2 3 4 5 다음

티스토리툴바