[아이뉴스24 윤소진 기자] 중국 AI 스타트업 딥시크가 크라우드웍스와 R1의 한국어 특화 거대언어모델(LLM) 개발 착수한 가운데, 과다 정보 수집·데이터 유출 논란에 휩싸인 딥시크 모델에 대한 보안 우려가 커지고 있다.
크라우드웍스는 "기업용 서비스로 개발 중이며 온프레미스 환경에서 운영해 데이터 유출 위험을 최소화했다"고 강조했다.
![크라우드웍스 CI. [사진=크라우드웍스]](https://image.inews24.com/v1/babba2022a1d74.jpg)
21일 아이뉴스24 취재에 따르면 크라우드웍스는 딥시크의 AI 모델 'R1'의 한국어 특화 모델을 개발한다. 양사가 개발하는 한국어 모델은 일반 소비자(B2C) 대상이 아닌 기업용 서비스에 초점을 맞춘다.
크라우드웍스는 R1 한국어 모델의 데이터 유출 가능성을 차단하기 위해 온프레미스(내부 구축형) 환경에 활용할 목적으로 개발한다. AI 학습 과정에서 입력 데이터 보호를 위한 암호화 기법을 적용하면 보안을 강화할 수 있다. 온프레미스 환경에서 운영될 경우 외부 네트워크와 완전히 격리될 수 있어 데이터 이동이 제한된다. 기업 고객이 자체 서버에 모델을 설치하는 방식으로 제공되기 때문에 내부의 민감 데이터가 외부로 유출될 물리적 경로가 차단된다.
크라우드웍스 관계자는 "R1 한국어 모델은 일반 소비자간거래(B2C) 대상이 아닌 기업용 서비스로 개발할 예정"이라며 "온프레미스 환경에서 운영되기 때문에 개인정보나 내부 데이터 유출 가능성을 낮출 수 있다"고 설명했다.
해외 사업을 주 타깃으로 하고 있어 보안에 민감한 국내 산업에 영향을 미칠 우려도 없다는 설명이다. 이 관계자는 "딥시크와 개발하는 모델을 국내 금융, 공공, 국방 등의 산업에 공급할 계획은 없다"며 "K-커머스, K-팝 등 K-콘텐츠 관련 AI서비스 등을 위한 해외 사업을 타깃하고 있다"고 말했다.
양사의 협력 배경에는 비용 효성과 가격 대비 높은 성능이 주요인으로 작용했다. 딥시크 R1은 오픈AI, 앤트로픽 등 글로벌 AI의 모델 대비 '가성비'가 뛰어나다는 평가를 받고 있다. 업계에서는 이번 협력이 한국어에 최적화된 고성능 저비용 AI 서비스 개발에 기여할 것으로 기대하고 있다.
현재 딥시크는 개인정보 과다 수집과 중국 바이트댄스로의 데이터 유출 우려로 국내에서 B2C 서비스의 신규 다운로드가 중단된 상태다. 그러나 API와 오픈소스 활용은 계속되고 있으며, 국내 여러 기업이 이미 딥시크 모델을 사용 중이다.
업계 관계자는 "해외 모델에 의존하는 상황에서 가성비 높은 한국어 특화 모델 개발은 글로벌 사업 확장을 추진하는 국내 기업의 경쟁력 향상에 기여할 것"이라며 "보안 우려를 해소할 수 있는 온프레미스 방식은 합리적인 접근이다. 다만 데이터 유출을 원천 차단할 수는 없기 때문에 실제 구현 과정에서 검증이 필요할 것"이라고 말했다.
이번 사업의 주체는 크라우드웍스의 일본법인 'CWJ'가 맡는다. CWJ는 이미 R1의 일본어 버전을 개발한 AI CHO와 협력하고 있으며, 이를 바탕으로 R1의 한국어 모델을 상반기 내 출시한다.
/윤소진 기자(sojin@inews24.com)
--comment--
첫 번째 댓글을 작성해 보세요.
댓글 바로가기