[아이뉴스24 김문기 기자] 국내 연구진이 인공지능 학습시간을 획기적으로 줄이는 컴퓨팅 기술을 개발했다.
한국전자통신연구원(ETRI)은 '딥러닝 분산 학습'에 최적화된 고속 처리 기술을 개발했다고 10일 발표했다.
이 기술을 적용하면 학습하는데 일주일이 걸리던 인공지능 모델을 같은 환경에서 단 1~2일 만에 학습할 수 있다는 게 ETRI의 설명이다.
딥러닝은 컴퓨터가 사람처럼 생각하고 배울 수 있도록 하는 기술이다. 하지만 컴퓨터 역시 대규모 영상, 이미지, 음성 등의 데이터나 모델을 학습하는 데는 많은 시간이 걸린다.
이때 대규모 데이터를 처리하려면 여러 대의 컴퓨터를 활용해 학습 시간을 줄이는 '분산 학습' 기술이 사용된다. 컴퓨터 하나로만 공부하지 않고 여러 대의 컴퓨터로 동시에 공부시켜 학습 분량을 분담해 시간을 단축시키는 기술이다.
하지만 분산 학습 기술도 대용량 모델을 여러 컴퓨터에서 동시에 실행하면 통신 병목 현상이 발생하는 한계가 있었다. 컴퓨터들 간 통신량이 많다 보니 특정 지점에서 성능이나 용량이 저하되는 현상이 나타난 것이다.
이를 해결하는 방법 중 하나는 컴퓨터의 계산 및 처리 능력을 담당하는 중앙처리장치(CPU) 혹은 그래픽처리장치(GPU)의 성능을 높이는 것이다. 그러나 이 방법은 장비를 계속 업그레이드해야 하는 비용 부담이 크다.
이에 비해 ETRI는 '메모리 박스(Memory BoxTM)'라 불리는 공유기억장치를 개발해 분산 학습시 발생하는 통신 병목현상을 해소함으로써 학습 시간을 단축시켰다.
메모리 박스는 컴퓨터들 중간에 위치해 각 컴퓨터들이 학습한 것을 서로 공유하도록 돕고 통신량을 줄여준다. 일종의 가상 공유 메모리 역할을 수행하는 것이다.
연구진의 기술을 이용하면 대대적인 장비 교체 없이 최소 투자로 동일한 환경에서 딥러닝 학습 시간을 대폭 줄일 수 있다. 특히, 하드웨어(HW)와 소프트웨어(SW) 형태를 모두 제공할 수 있어 수요자 맞춤형 기술 이전이 가능하다.
이를 통해 1천가지 종류의 이미지 128만 장을 분류하는 모델을 1만 번 반복 학습하는 실험을 진행한 결과, 기존 서버 방식이 16분 23초가 걸린 반면 이 기술을 이용한 방식은 7분 31초가 걸렸다.
아마존, 구글, MS 등 글로벌 IT 기업들은 자사 소스코드를 공개하거나 대규모 컴퓨팅 자원을 클라우드 형태로 제공하며 개발자들을 유인하고 인공지능 컴퓨팅 인프라 시장의 점유율을 높여왔다. 인공지능을 연구하는 국내 기업이나 기관들은 외국 기업들의 서비스에 의존하거나 많은 비용을 들여 자체 서버를 구축해야 했다.
이에 ETRI 연구진은 국내 개발자들이 손쉽게 딥러닝 연구를 진행할 인공지능 컴퓨팅 환경을 제공하기 위해 '딥러닝 대시보드'도 개발했다. 그래픽 기반 개발 환경을 제공해 개발자들이 코드를 하나하나 입력할 필요가 없다. 학습시간은 물론 모델 개발 시간을 단축시키는데도 도움을 준다.
현재 연구진의 기술은 세계 최대 가전 전시회인 독일 IFA 2019에도 참가해 관계자들로부터 큰 관심을 받고 있다. 관련된 논문 14편 및 13건의 특허도 출원된 바 있다.
연구진이 개발한 딥러닝 고속 처리 시스템 기술은 현재 두 개의 중소기업이 기술을 이전 받아 연구소기업 설립을 추진 중이다. 연구진은 해당 기업을 통해 내년 상용화를 목표로 하고 있다.
최완 ETRI 인공지능연구소 책임연구원은 "글로벌 기업이 독식하고 있는 인공지능 컴퓨팅 인프라 시장을 우리 기술로 대체하고 고난이도 딥러닝 기술과 독자적인 인공지능 슈퍼컴퓨팅 시스템을 개발하는데 도움이 되기를 바란다"고 말했다.
김문기 기자 [email protected]
--comment--
첫 번째 댓글을 작성해 보세요.
댓글 바로가기