[아이뉴스24 심지혜 기자] “파란불에 횡단보도 건너라는 걸 안 지켜서 교통사고가 난 것과 같은 상황이다.”
허성욱 과학기술방송통신위원회 네트워크정책실장은 29일 KT네트워크 장애 원인분석 결과 발표 브리핑에서 지난 최근 전국적으로 발생한 KT의 유무선 통신망 장애에 대해 이같이 비유했다.
과기정통부는 이번 사고에 대한 심각성을 인지하고 정보보호, 네트워크 전문가들로 구성된 사고조사반을 꾸려 원인을 분석했다.
상식적인 기본을 지키지 않아 KT고객들에게 피해를 입힌 것이다. 작업계획서상 야간에 진행해야 할 작업을 주간에 했고, 작업 관리자가 동행해야 함에도 협력업체 직원들끼리 작업을 수행하도록 했다. 또한 네트워크 연결을 끊고 작업을 해야했는데, 그렇지 않았다.
그 결과 지난 25일 낮 KT 부산국사에서 기업망 라우터(네트워크 장치간 통신을 위해 트래픽을 전달하는 장비) 교체작업을 하던 중 작업자가 잘못된 설정 명령을 입력하면서 오류가 발생, 전국적으로 장애가 발생한 것으로 파악됐다.
당초 계획으로는 야간(새벽 1시~6시)에 작업을 진행해야 했으나, 지난 25일 낮에 교체를 진행한 이유는 “야간작업을 좋아하는 사람이 없어서”라는 설명이 나왔다.
홍진배 과기정통부 정보보호네트워크정책관은 “과기정통부가 수사를 한 것은 아니지만 당사자에게 확인한 결과 주간작업을 선호했다”고 말했다.
‘KT가 야간작업을 하기 싫어 협력업체에 주간작업을 시킨 것이 아니냐’는 질문에는 “KT 관리자와 협력사 직원 양쪽의 합의하에 이뤄진 것으로 한 쪽의 단독 결정이 아니다”라고 답했다.
당일 오전 11시 16분에 트래픽이 급증하기 시작하면서 장애가 발생했고, 57분부터 복구가 진행됐다. 복구 완료는 12시45분에 완료됐다. 89분간 전국적으로 통신 장애가 발생한 것이다.
게다가 이 작업은 담당 KT 관리자가 동행했어야 함에도 그렇지 않았다. 최성준 과기정통부 네트워크정책과장은 "KT 관리자에게 확인한 결과 다른 업무가 있어서 자리를 비웠다고 했다"고 전했다.
결정적으로 사고 원인은 인재인 것으로 풀이된다. 협력업체 직원이 라우팅(네트워크 경로 설정) 작업을 하다가 정보를 입력하는 과정에서 특정 명령어(exit)를 빠뜨렸다. KT는 사전 검증하는 과정에서 이를 발생하지 못했다. 심지어 1~2차에 걸친 사전검증 단계가 존재했음에도 발견하지 못했다.
또한 네트워크가 차단된 가상 상태에서 오류 여부를 사전에 발견하기 위한 가상 테스트베드가 없었고, 지역에서 발생한 오류가 전국으로 확산하는 것을 차단할 수 있는 시스템도 부재하였다.
게다가 네트워크가 연결된 채로 작업이 이뤄지는 바람에 전국망 장애를 발생시켰다.
허 실장은 “네트워크 작업을 야간에 하는 것, 이런 작업은 1~2시간 테스트를 한 이후 오픈하는 등 10여년 전부터 기본 상식에 속해있었다”며 “그래서 이런게 정부가 제도적으로 규제 해야 할 대상인지 고민”이라고 말했다.
당연히 지켜야할 기본을 지키지 않으면서 사고가 발생했다는 것. 허 실장은 “파란불에 횡단보도 건너라는 걸 법으로 정해놔야 할지 당황스럽다”며 “대책을 볼 때 엄중하게 보고, 기본을 지키지 않은 부분들에 대해서는 어디까지 제도화해야 할지도 어려운 부분”이라고 덧붙였다.
/심지혜 기자([email protected])
--comment--
첫 번째 댓글을 작성해 보세요.
댓글 바로가기