[아이뉴스24 민혜정 기자] 카카오 인공지능(AI) 번역이 예사·높임말, 구어·문어체도 구분할 수 있을 정도로 고도화된다.
카카오는 이를 카카오톡, 카카오미니, 카카오TV, 다음 등 카카오 서비스 전반에 적용할 계획이다.
21일 카카오는 한남 오피스에서 AI 미디어 스터디를 열고 카카오 AI 번역 서비스 계획 및 기술을 발표했다.
카카오는 이달 중 카카오톡 플러스친구 형태로 카카오 I 번역 챗봇(채팅로봇)을 출시한다. 지원 언어도 영어에서 일본어, 중국어 등으로 확대한다.
카카오는 상반기 내 국내 번역기 중 처음으로 예사·높임말, 구어·문어체도 구분해 상황에 맞는 번역 결과를 제공할 계획이다.
연내 카카오는 번역 전용앱도 출시해 네이버 파파고, 구글 번역 등과 정면 대결도 펼칠 계획이다.
배재경 카카오 AI 부문 컨텍스트파트장은 "전용앱은 음성인식 뿐만 아니라 메뉴판까지 인식할 수 있는 이미지 인식 기능이 필요하다"며 "이를 적용한 전용 앱을 출시할 것"이라고 강조했다.
카카오는 카카오톡, 카카오미니, 미디어 다음(해외 컨텐츠 번역, 연예 컨텐츠 번역 등)에 번역 엔진을 탑재할 예정이다. 카카오TV 내 동영상 자막 번역 기능을 탑재하는 서비스도 준비 중이다.
이날 카카오는 자사 AI 번역의 진화 과정을 설명하기도 했다.
배재경 파트장은 "알고리즘의 성능이 번역의 정확도에 비례하지만 그 상한선은 데이터가 좌우한다"며 "번역에는 많은 학습 데이터가 필요하다"고 말했다.
이어 "일반적인 긴 글(Article) 형태의 번역쌍(데이터)이 문장 단위의 번역쌍보다 많으므로 신경망 기반 기계번역을 위해 문장 단위 학습 데이터로 가공하는 기술이 무엇보다 중요하다"고 덧붙였다.
데이터를 문장 단위로 정렬하는 기술이 얼마나 뛰어난지가 곧 양질의 학습 데이터 확보로 이어지기에 번역의 품질에 영향을 준다는 게 카카오 측 설명이다.
같은 양의 데이터를 확보했더라도 그 데이터를 얼마나 기계번역이 쉬운 문장 단위로 정렬(가공)할 수 있는지가 중요하다.
'BLEU'(블루, Bilingual Evaluation Understudy)는 번역이 필요한 원문을 사람이 번역한 결과와 번역기의 결과가 얼마나 유사한지를 수치화해 텍스트의 품질을 평가하는 알고리즘이다.
카카오는 딥러닝 기반으로 학습데이터를 문장 단위로 정렬해주는 툴의 일종인 'BLEU align'(블루 얼라인)을 직접 개선한 'Advanced BLEU align'(ABLEU align, 에이블루얼라인)'을 번역 서비스에 활용하고 있다.
ABLEU 얼라인은 기존 BLEU 얼라인이 다른 뜻으로 집계하는 유사어(이쁘다, 예쁘다)들도 학습할 수 있게 해주는 툴이다. 기존 ABLEU가 학습 데이터로 활용하지 못했던 글과 문장을 활용할 수 있어 번역의 정확도와 품질을 끌어올렸다.
배재경 파트장은 "카카오의 AI 번역 기술은 이를 통해 다의어 처리, 장문 번역, 문맥 파악에 강점을 가진다"며 "카카오 서비스에 적용해 편의성을 높일 계획"이라고 말했다.
민혜정기자 [email protected]
--comment--
첫 번째 댓글을 작성해 보세요.
댓글 바로가기