[아이뉴스24 김문기 기자] 오직 한 사람에게만 반응하는 인공지능(AI).
KT가 내 목소리로 통하는 인공지능(AI) 시대를 열겠다는 포부를 밝혔다.
KT(회장 황창규)는 29일 서울 종로구 KT광화문빌딩 웨스트에서 기자설명회를 열고, 일체형 AI TV '기가지니 테이블TV'와 AI 사업전략을 발표했다.
이 자리에서 KT는 음성인식 사용자인터페이스(UI)의 부족함을 영상으로 전달할 수 있도록 디스플레이를 탑재한 AI 스피커인 '기가지니 테이블TV'를 선보였다. 현재 영상에 익숙한 사용자의 인터페이스를 한순간 음성으로 전환시키기 어렵다는 판단으로 추측된다.
김채희 KT AI사업단장(상무)는 "아직 사용자들이 오직 음성 UI로만은 익숙치 않기 때문에 화면과 함께 반응을 받아보려고 힌다"라며, "음성과 같이 화면과 상호작용하는 부분이 탁월해서 글로벌 시장에서도 화면을 장착한 AI 스피커가 다양화되고 있다"고 설명했다.
◆ 내 목소리에만 '반응', 내 목소리로 '발화'
KT는 음성의 부족한 부분을 영상으로 채우면서도 음성인식 기술 고도화를 병행하고 있다.
음성인식을 한단계 진화시킨 서비스가 이번에 출시될 예정인 '내 목소리 동화'다. KT는 지난해 개인화 음성합성(P-TTS) 기술을 개발하고 개그맨 박명수 목소리를 구현한 바 있다. 지난 3월에는 지상파 3.1절 특집 다큐멘터리에 독립운동가 고 정재용, 이갑성 선생의 목소리를 재현하기도 했다.
'내 목소리 동화'는 총 300문장을 녹음하면 P-TTS 기술을 통해 하나뿐인 오디오 동화책을 만들 수 있다. 한 번 녹음하면 추가로 녹음할 필요없이 동화책을 추가할 때마다 새로운 동화를 부모 목소리로 들려줄 수 있다.
특히 이 서비스는 녹음 스튜디오가 아닌 스마트폰으로 이용 가능하다. 해당 앱을 내려받아 안내에 따라 300문장을 절차에 맞게 녹음하면 끝이다. 이를 위해 KT 융합기술원은 딥러닝 음성합성 엔진과 관련한 기술을 확보하고 있다. 상당수는 특허를 출원했다.
음성인식과 함께 화자인식도 고도화시키고 있다. 조만간 관련 서비스를 내놓겠다는 포부다.
임미숙 KT 융합기술원 서비스연구소 AI기술&HCI담당 상무(보)는 "화자인식은 특정 사람이 부를 때만 반응하게 하는 것이 목표로 각각의 사람마다 반응할 수 있는 것을 조만간 선보일 수 있을 것"이라며, "목소리 녹음은 목소리 정보 수집이 무엇보다 중요하기 때문에 원하는 것을 구현할 수 있도록 하는데 집중하겠다"고 답했다.
'내 목소리 동화'는 아빠가 아이에게 동화책을 들려주는 형태지만, 가령 향후 목소리 수집에 따라 그리운 부모의 목소리를 AI 스피커를 통해 들을 수 있을 전망이다. 수집량이 적당한 수준이라면 복원까지도 가능한 셈이다.
최준기 KT AI기술담당 상무는 "목소리 녹음이 끝나면 동화책 주인공을 내 아이 이름으로 바꿀 수도 있고, 동화책을 읽어주기 전에 특별한 멘트가 나가기도 한다"라며, "내 목소리 동화는 밑단에서 GPU 등의 연산작업 등이 필요해 우선 5월 동안 300명을 대상으로 하고, 이후 서비스 안정화를 거쳐 전체적으로 열 계획"이라고 설명했다.
내 목소리로 통하는 AI 스피커는 개인화된 AI 서비스를 제공하기 위한 수순이다. 이를 위해서는 끊김없는 서비스 제공이 필요하다.
최 상무는 "뒷단에 있는 고객 체계를 하나로 묶어 플랫폼에 연결하는 작업을 하고 있다"라며, "내외부에서 쓰는 다양한 서비스를 묶기 위한 플랫폼이 필요하고 준비 중에 있다"고 말했다.
이 밖에도 AI 스피커가 가정 내 컨트롤타워 역할을 하기 위해 사물인터넷(IoT) 기능도 보다 고도화할 전망이다.
김 상무는 "아무래도 제조사에서 스마트홈의 주도권을 갖고자 해서 사용사례별로 해결해나가고 있다"고 말했다. 임 상무(보) 역시 "개인화를 위한 기초 요소 기술들을 개발하고 있고, 조만간 발표하는 자리가 있을 것"이라고 예고했다.
◆ 올해 AI 스피커 라인업 다변화…모듈로 반경 넓혀
KT는 우선 디스플레이를 장착한 '기가지니 테이블TV'를 시작으로 2분기내 차세대 '기가지니 LTE' 모델을 선보인다. 이후 3분기에는 기가지니 버디의 후속인 '기가지니 미니'를 내놓을 계획이다.
'기가지니 테이블TV'는 태블릿과 흡사한 11.6인치 디스플레이를 갖췄다. 와이파이 연결로 사용 가능하다. 올레tv의 모든 실시간 채널과 주문형 영상(VOD)를 즐길 수 있다. 하만카돈의 프리미엄 스피커를 탑재해 2채널 스테레오 사운드를 구현한다.
사실 KT는 이와 비슷한 단말을 상용화한 바 있다. 기가지니 호텔에 디스플레이를 장착한 AI 스피커를 배치한 바 있다.
김채희 상무는 "고객들이 호텔에서 이미 활용했던 단말로 경쟁력이 있을 것이라 생각한다"라며, "이런 단말을 집에도 가져가고 싶다는 반응이 많아 소비자시장(B2C)에서도 경쟁력을 갖췄다 해서 출시한 것"이라고 소개했다.
활용성을 높이기 위해 '만개의 레시피'와 협업해 음성으로 사용 가능하게 설계했다. 요리 영상부터 요리 재료까지 음성으로 검색할 수 있다. 필요하다면 연결된 스마트폰으로 관련 정보의 링크를 보낼 수도 있다.
키즈 콘텐츠로는 내달 출시 예정인 '핑크퐁 이야기극장'을 쓸 수 있다. 아이의 선택에 따라 각기 다른 이야기가 펼쳐지는 멀티엔딩 동화 서비스다. 기가지니 북클럽은 기존 구독 서비스와 함께 소리동화, 세이펜 등 AI 동화 서비스를 그대로 이용할 수 있다.
KT는 오는 5월 2일 기가지니 테이블TV를 출시한다. 가격은 39만6천원이다. 반값초이스와 결합할인 등 다양한 요금 정책을 적용해 소비자 부담을 크게 낮출 것이라 밝혔다. 주요 전국 100여개 대리점에서 시연단말로 체엄 가능하다. 초기 프로모션으로 하만과 협력해 50만원 상당의 블루투스 헤드셋을 추첨해서 무료로 주는 방안을 강구 중이다.
최준기 상무"는 가격표는 나중에 별도 공개하겠지만 부담을 최소로 낮출 수 있도록 정책부분을 더 생각하고 있다"라며, "복수단말로 이해해 하나의 회선을 더한다는 개념으로 접근해야 한다. 만약 KT 고객이 아니라면 IPTV에 가입한다고 봐야 한다"고 설명했다.
한편, KT는 기가지니 단말 없이 다른 제조사의 단말에서 기가지니 서비스를 이용할 수 있는 '기가지니 인사이드'도 공개했다. 냉장고와 안마의자, 에어컨과 같은 가전제품은 물론 차량, 스마트홈 단말에 삽입해 기가지니 호출어와 서비스 이용이 가능하다. 올해 상반기 중 모듈을 공개할 계획이다.
최 상무는 "집안에서 쓸 수 있는 가전뿐만 아니라 차량도 나중에는 협력 대상이 될 수 있을 것으로 기대하고 있다"라며, "음성 기반에서 영상으로도 업그레이드할 계획을 갖고 있다"고 말했다.
김문기 기자 [email protected]
--comment--
첫 번째 댓글을 작성해 보세요.
댓글 바로가기