OpenAI '위스퍼'·'GPT-4o' 기반…음성 입력·요약 지원
듣기(TTS) 넘어 말하기(STT)로 영역 확장

텍스트 음성 변환(TTS) 플랫폼 스피치파이(Speechify)가 '말하기' 영역으로 사업을 확장했다. 스피치파이는 자사 크롬 확장 프로그램에 음성 입력(Voice Typing)과 AI 음성 비서 기능을 새롭게 추가했다고 밝혔다.
이번 업데이트로 사용자는 키보드 입력 대신 목소리로 지메일(Gmail)을 작성하거나 구글 문서(Google Docs)를 편집할 수 있게 됐다. 기존의 텍스트를 읽어주는 기능에서 나아가, 사용자의 음성을 텍스트로 변환하고 명령을 수행하는 양방향 AI 도구로 진화한 것이다.

새로운 기능은 브라우저 사이드바 형태로 제공된다. 사용자가 마이크 버튼을 누르고 말하면, AI가 실시간으로 내용을 받아 적는다. 단순한 받아쓰기를 넘어 "이 페이지 요약해 줘", "문법 확인해 줘", "스페인어로 번역해 줘"와 같은 음성 명령을 수행하는 '음성 비서' 역할도 겸한다.
기술적으로는 오픈AI(OpenAI)의 음성 인식 모델 '위스퍼(Whisper)'와 최신 언어 모델 'GPT-4o'가 적용됐다. 이를 통해 높은 정확도의 받아쓰기 성능을 구현했으며, 다양한 맥락의 명령을 자연스럽게 처리할 수 있다. 클리프 와이츠먼(Cliff Weitzman) 스피치파이 최고경영자(CEO)는 "생각을 마찰 없이 텍스트로 옮길 수 있는 도구"라고 강조했다.
서비스는 부분 유료화(Freemium) 모델로 운영된다. 무료 사용자는 10분의 음성 입력 및 비서 기능을 이용할 수 있으며, 연 139달러(약 19만5000원)의 프리미엄 요금제 가입 시 무제한 사용이 가능하다.
업계는 이번 기능 추가로 스피치파이가 오터(Otter.ai)나 그래머리(Grammarly)와 직접적인 경쟁 구도를 형성할 것으로 보고 있다. 난독증 환자를 돕기 위해 시작해 3000만 명의 사용자를 확보한 스피치파이가 텍스트 입력 시장에서도 영향력을 확대할지 주목된다.
참고자료:https://chromewebstore.google.com/detail/speechify-%E2%80%94-voice-ai-assi/ljflmlehinmoeknoonhibbjpldiijjmmhttps://techcrunch.com/2025/11/25/speechify-adds-voice-typing-and-voice-assistant-to-its-chrome-extension/
Speechify adds voice typing and voice assistant to its Chrome extension | TechCrunch
In the last 12 months, there has been a proliferation of voice detection tools, thanks to overall quality improvement in speech recognition models. Speechify is hitching its wagon to this train and launching its own dictation tool with support for English.
techcrunch.com
'IT' 카테고리의 다른 글
| 구글 TPU, 엔비디아 독점 흔드나 (0) | 2025.11.26 |
|---|---|
| 워너뮤직, AI 음악 '수노'와 파트너십…소송전 끝내고 '적과의 동침' (0) | 2025.11.26 |
| 앤스로픽 ‘오퍼스 4.5’ 출시…엑셀·웹 직접 제어 (0) | 2025.11.25 |
| 구글, 이미지 생성 AI ‘나노 바나나 프로’ 공개… “챗GPT 모멘트 왔다” (0) | 2025.11.21 |
| 오픈AI ‘코덱스 맥스’ 출시…“24시간 연속 코딩” (0) | 2025.11.20 |