'말하는 AI' 뜬다...앤트로픽 '클로드'에 음성 모드 탑재
앤트로픽이 자사의 AI(인공지능) 모델 '클로드'에 음성 모드를 탑재하면서 '음성 대화형 인공지능(Conversational AI)' 시장에 본격적으로 뛰어들었다. 기존 텍스트 중심의 인터페이스에 사용자 음성을 실시간으로 인식해 응답하는 기능이 더해져 구글, 오픈AI 등 선두 주자들과의 경쟁이 한층 치열해질 전망이다. 앤트로픽은 27일(현지 시간) 클로드 모바일 앱에 '음성 모드'를 베타 기능으로 제공한다고 발표했다. 이번 업그레이드는 단순한 언어 처리에서 벗어나 인간과의 유사한 상호 작용을 구현하려는 글로벌 AI 업계의 기술 지향점을 반영한다. 앤트로픽은 음성 모드가 ▲일상 계획 ▲학습 ▲창의적 사고 ▲커뮤니케이션 능력 향상 ▲아이디어 포착 등 일상 속 다양한 상황에서 유용하게 쓰일 수 있다고 설명했다. 사용자들은 해당 모드를 통해 회의 일정, 이메일, 관심 뉴스 등의 브리핑을 음성으로 받을 수 있다. 통근 중이나 운동, 집안일 도중에 클로드와 대화를 나누며 새로운 주제를 탐구하는 것도 가능하다. 타이핑이 사고 흐름을 방해할 때는 소리내어 생각하며 아이디어를 발전시키거나, 면접이나 토론 연습을 할 수도 있다. 아이디어가 떠오른 순간 즉시 음성으로 기록하고 확장해 나가는 것도 가능하다. 28일 정보통신기획평가원(IITP)이 공개한 '음성 대화형 인공지능 서비스 및 기술 동향' 보고서에 따르면 음성인식(ASR), 자연어 처리(NLP), 음성합성(TTS) 기술을 기반으로 작동하는 음성 AI는 최근 대규모 언어 모델(LLM)과 결합해 스마트 비서, 고객 상담, 자동 통역, 의료 및 헬스케어 등 다양한 산업 분야에 활용되며 진화를 거듭하고 있다. 보고서는 음성 AI가 단순한 질의응답을 탈피해 사람처럼 자연스러운 대화를 구사하는 방향으로 발전하고 있다고 진단했다. 구글의 '구글 어시스턴트', 아마존의 '알렉사', 애플의 '시리', 마이크로소프트의 '코타나' 등 글로벌 빅테크 기업들은 자사 기술 생태계에 음성 AI를 통합해 스마트홈 기기 제어, 차량 내비게이션, 고객 응대 등 생활 밀착형 서비스를 선보이고 있다. 김상훈 한국전자통신연구원(ETRI) 책임연구원은 보고서에서 "음성 대화형 AI는 인간과의 상호 작용을 더욱 자연스럽고 직관적으로 만든다"며 "AI는 단순한 보조 도구를 넘어 일상생활에서 필수적인 역할을 수행하는 방향으로 발전할 것"이라고 밝혔다.