실시간 뉴스



[IT돋보기] KT 주축 AI원팀 '초거대AI' 본격화…가볍고 빠르게 산업 파고든다


2천억 파라미터 일차 목표…데이터 품질 고도화·영상데이터 확보 등으로 확대

[아이뉴스24 송혜리 기자] "AI(인공지능)원팀의 '초거대AI'는 기가지니와 AICC(AI콘택트센터) 이용자의 다양한 표현을 사람처럼 이해하고 대답한다. 생활 속 편의 증진부터, 의료 등 전문 분야, 제조·금융·물류·유통 시스템까지 여러 사람과 상황에 즉각 응용할 수 있도록 구현된다."

'AI원팀'이 '초거대AI 프로젝트'를 본격화한다. 목표는 내년 상반기 상용화다. AI원팀은 KT를 주축으로 국내 10개 기업·기관이 의기투합한 산·학·연 AI협의체로 꾸준히 AI 역량을 고도화해왔다.

초거대AI 협약식에 참여한 AI 원팀의 KT, ETRI, KAIST, 한양대학교 관계자들이 온라인으로 진행된 공동 연구협약식을 마치고 기념사진을 촬영하고 있다. [사진=KT]
초거대AI 협약식에 참여한 AI 원팀의 KT, ETRI, KAIST, 한양대학교 관계자들이 온라인으로 진행된 공동 연구협약식을 마치고 기념사진을 촬영하고 있다. [사진=KT]

AI원팀에 소속돼 있는 '초거대AI' 개발 연구진들은 지난 8월 31일 비대면 인터뷰를 통해 해당 프로젝트에 대한 설명과 개발 방향성, 목표 등을 공유했다. 인터뷰는 장두성 KT 융합기술원 상무, 서민준 KAIST 교수, 서지원 한양대 교수, 임준호 한국전자통신연구원(ETRI) 박사, 정경수 AI원팀 사무국 팀장 등이 참석했다.

앞서 KT는 지난 7월 18일 ETRI, KAIST, 한양대 등 'AI원팀'소속 기관들과 '초거대AI' 개발을 추진한다고 발표한 바 있다.

'초거대AI'란, 대용량의 연산이 가능한 인프라를 바탕으로 대규모 데이터를 학습해 사람처럼 스스로 사고할 수 있도록 설계된 AI를 의미한다. 데이터분석·학습·판단은 물론 기사 작성, 창작, 코딩 등 광범위한 작업을 인간의 뇌처럼 완성도 높게 수행한다. 즉 종합적·자율적으로 사고·학습·판단·행동하는 인간의 뇌 구조에 버금가는 AI다.

이번 사업 역시 기업의 대규모 투자를 통해 GPU 인프라를 구축하고, 학교와 연구기관은 최신의 연구 동향을 반영한 기술을 제공하는 이상적인 산·학·연 협력 구조로 형성됐다.

KT는 이 곳에서 다른 참여기관들과 힘을 모아 ▲대규모 GPU 인프라 구축 ▲데이터 수집·분석 ▲모델 학습 ▲응용태스크 적용 등 연구·개발 및 상용화 관련 업무를 총괄적으로 수행한다.

카이스트의 경우 머신러닝 알고리즘 최적화·애플리케이션 파트를 맡는다. 한양대는 데이터 정제·필터링 알고리즘 개발, 분산·병렬 알고리즘 및 모델 최적화 분야에서 힘을 보탠다. ETRI는 대형 모델학습 및 모델개발 분야에 참여한다.

이에 따라 연말까지 1차로 초거대 AI 학습을 완료한다. 내년 상반기 상용화를 목표로 한다.

정경수 AI원팀 사무국팀장은 "현재 대규모 고성능 GPU 인프라 구축을 진행 중이고 이른 시일 내에 완료가 될 것으로 본다"며 "AI원팀 초거대AI 프로젝트에는 수백억원이 투입될 예정으로, 향후 모델 규모가 확장되면 추가 투자도 검토 중"이라고 말했다.

◆ 경쟁은 시작됐다…경량화·생성·해석 강점으로 차별화

'초거대AI' 패권 경쟁은 구글, 화웨이 등 해외기업뿐만 아니라 국내에서도 점화됐다.

대표적으로 네이버는 지난 5월 초거대AI '하이퍼클로바'를 공개했다. 일론머스크 등이 주축으로 설립한 '오픈AI연구소'의GPT-3를 뛰어넘는 2천40억개 파라미터(매개변수) 규모로 개발했고, 일상언어인 '자연어' 데이터 학습량은 GPT-3의 6천500배 이상을 학습해 '세계에서 가장 큰 한국어 '초거대AI' 언어 모델'로 주목받았다.

LG는 AI연구원을 설립하고 '초거대AI' 개발 등에 3년간 1천200억원을 투자한다고 발표했다. 올 하반기까지 6천억개 파라미터, 2022년 상반기까지 1조개 이상 파라미터를 갖춘 '초거대AI'을 만들겠다는 계획이다.

SK텔레콤은 지난해 6월 첫 한국어 학습 오픈소스모델 'KoGPT-2' 개발 성공에 이어 올해 5월 성능을 개선한 'KoGPT-2' 모델2.0 버전을 공개했다. 또 올해 국립국어원과 협력해 1천500억 파라미터의 초거대AI 'GLM'개발을 추진 중이다.

KT는 AI원팀을 통해 '초거대AI' 모델 상용화와 더불어 대규모 AI 연산 인프라를 구축하고, 향후 2천억 파라미터 이상의 모델까지 가능하도록 인프라 규모를 점진적으로 확대할 예정이다.

장두성 KT 융합기술원 상무는 "초거대AI의 방향성은 현재 3가지로 지목된다"며 "첫 번째는 데이터를 무조건 많이 키우는 것, 그리고 이와 동시에 데이터를 잘 선별하고 고품질 데이터를 적용하는 것, 마지막으로 언어 데이터뿐만 아니라 음성 영상 데이터를 이용해 파라미터를 확대하는 것"이라고 설명했다.

이어 "AI원팀의 초거대AI의 2천억개 파라미터는 일차적인 목표라 할 수 있으며, 그다음 단계에서는 이의 세 가지 방향성을 동시에 고려해 목표를 확대할 계획"이라고 말했다.

'초거대AI'의 차별화는 ▲ 경량화 ▲생성·해석 등 강점을 바탕으로 즉시 상용화가 가능한 과제 지향적(Task-Oriented) 형태를 지향한다는데 있다.

장 상무는 "AI원팀의 '초거대AI'는 다양한 산업군에 빠르게 적용할 수 있도록 경량화하고, 문장의 생성과 해석 모두에 강점이 있도록 구현할 것"이라고 말했다.

'초거대AI'를 통해 향상된 STT, 대화, TTS, TA 등 요소기술은 먼저 KT 기가지니와 AICC 서비스 고도화를 위해 활용되며, 나아가 제조·금융·물류·유통 등 AI 원팀 참여기업들의 다양한 사업 분야에 적용할 예정이다. 또 영상·로봇 등의 복합인지, 이미지 기반 해석, 인간중심 AI(Humanistic AI) 등에서 초거대AI 모델로 영역을 확장해 나갈 예정이다.

◆ 부족한 데이터·인재…민·관 머리 맞대야

'초거대AI' 경쟁을 시작됐으나 데이터와 인재 부족은 고질적인 숙제다.

장 상무는 "여러 국책기관에서 공유해주는 데이터를 이용해 이런 '초거대AI' 등을 추진할 수 있게 됐다고 평가하나, 여전히 민간에 공개되는 데이터양이 적은 상황"이라며 "현재 공개된 데이터 이외에 추가 공개 논의도 있어, (AI원팀)같이 참여해 확대하려고 하고 있다"고 말했다.

임준호 ETRI 박사는 정부가 '초거대AI' 언어모델 개발에 효율을 높여줄 수 있는 알고리즘 개발로 민간을 지원해야 한다고 제언했다.

임 박사는 "현재 언어 모델 크기 경쟁이 커지고 있는 상황으로, 이렇게 되면 향후 수천억, 조 단위 투자도 필요할 수 있다"며 "이와 같은 방향으로 나아가는 것은 바람직하지 않다"고 말했다.

이어 "정부에서 지원하게 된다면 KT, 네이버 등 민간이 추진하는 개발 형태와는 달리, 동일한 모델의 성능을 항상 시켜주는 알고리즘 연구가 필요할 것으로 보인다"며 "혹은 언어 모델이 신뢰성 있게 현실서비스에 적용되도록 하는 방안에 대한 연구 등 민간에서 다루지 못하는 것들을 정부에서 지원하는 것이 맞는 방향이 아닐까 생각한다"고 강조했다.

아울러 AI분야에선 여전히 '사람이 없다'는 말이 나온다. 정부가 '디지털뉴딜'일환으로 오는 2025년까지 1만9천500명의 AI융합인력을 양성하겠다고 나섰지만, 기술과 시장은 정부의 인재양성 속도보다 빨리 앞서가고 있다.

정경수 AI원팀 사무국 팀장은 "AI원팀 참여 기업들이 공통으로 인재를 키우고 내부 직원들 역량을 향상하는 데에 대해 고민을 하고 있다"고 말했다.

정 팀장은 "이에 따라 AI원팀은 'AI워크숍' 교육 프로그램과 더불어 산·학 공동 프로그램을 운영하고 있다"며 "특히 AI워크숍은 AI데이터와 분석, 디지털혁신 등 AI역량 제고에 초점을 맞춘 다양한 학습패키지를 통해서 AI와 데이터 분석에 대한 기본원리와 개념을 학습한다"고 설명했다.

/송혜리 기자([email protected])




주요뉴스



alert

댓글 쓰기 제목 [IT돋보기] KT 주축 AI원팀 '초거대AI' 본격화…가볍고 빠르게 산업 파고든다

댓글-

첫 번째 댓글을 작성해 보세요.

로딩중

뉴스톡톡 인기 댓글을 확인해보세요.



포토뉴스