독일과 브라질. 그리고 아르헨티나와 네덜란드. 전 세계 축구팬의 관심이 집중된 ‘월드컵 데스매치’에서 딱 네 팀이 살아남았다. 유럽과 남미 강호 두 팀씩이 준결승전에 진출해 그 어느 때보다 많은 관심이 쏠리고 있다.
물론 축구 얘길 하려는 건 아니다. 월드컵 기간 중 축구 기사를 간혹 쓰긴 했지만 내 본업은 어디까지나 IT 쪽이다. 남의 영역에 어설프게 숟가락 들이대는 건 도리가 아니란 것 쯤은 잘 알고 있다.
하지만 월드컵의 관심사가 어디 축구 뿐이랴? 요즘 월드컵은 매년 초 열리는 CES 못지 않게 첨단 IT기술이 총동원된다. 특히 올해 화두 중 하나는 빅데이터다.
이쯤 속내를 드러내면 무슨 얘길 하려는 건지 대충 짐작될 듯 하다. 그렇다. 바로 빅데이터 분석의 가능성과 한계를 한번 짚어보기 위해 어설픈 축구 얘길 꺼냈다.
◆구글, 8강 네 경기 중 독일-프랑스 결과 예측 실패
구글은 지난 달 열린 ‘I/O 2014’ 개발자회의에서 재미 있는 결과를 하나 발표했다. 빅데이터 분석을 통해 16강전 8경기를 예측한 것. 그런데 이 예측이 정확하게 맞아 떨어지면서 수 많은 팬들을 놀라게 만들었다.
구글은 선수들의 직전 게임 활동을 바탕으로 다음 게임에서 어느 정도 경기력을 보일지 분석하는 데 옵타의 데이터를 활용했다. 연속선상에서 선수들의 경기력을 분석한 셈이다. 여기에다 빅쿼리의 파워랭킹 시스템도 함께 적용했다.
여기까지는 객관적인 데이터 분석이다. 구글은 이런 분석 기법에다 주관적인 요소를 결합했다. 브라질 현지로 직접 응원온 관중들의 숫자와 그들의 응원 열광 정도를 또 다른 변수로 추가한 것. 이런 요소들은 ‘홈 어드밴티지’ 같은 현장 분위기를 고려하는 데 도움이 됐다고 구글 측이 설명했다.
구글은 여기서 머무르지 않고 8강전 네 경기 결과도 예측했다. 구글은 브라질과 아르헨티나, 네덜란드의 승리를 예측했다. 그리고 유럽의 전통 라이벌 독일과 프랑스 대결에선 프랑스가 승리할 것으로 예상했다.
결과는 우리가 다 아는 그대로다. ‘다행스럽게도’ 독일이 프랑스를 이기면서 구글의 빅데이터 분석은 8강전에서 탈락했다. 난 지난 주 구글의 월드컵 빅데이터 분석 결과를 전해주면서 이렇게 전망했다.
“가장 관심을 끄는 것은 유럽의 두 강호인 독일과 프랑스 경기다. 자국 IT기업인 SAP의 빅데이터 도움을 받은 독일과 ‘아트사커’ 부활을 선언한 프랑스 경기는 예측이 쉽지 않은 승부. 하지만 구글은 프랑스의 손을 들어줬다. 승리할 확률은 69%.”
저렇게 쓴 이유는 간단하다. 구글의 8강전 예측 중 가장 틀릴 가능성이 많은 게 독일과 프랑스 간 대결이라고 생각했기 때문이다.
왜 그런 생각을 했을까? 사실 난 축구 중계를 그렇게 즐기는 편은 아니다. 하지만 독일이 그 동안 프랑스와의 ‘단판승부’에서 보여준 강인한 정신력이 객관적인 전력보다 오히려 강하게 작용할 것이라고 생각했다. 그래서 독일이 이길 확률이 좀 더 높을 것으로 내다봤다.
그건 한국과 일본이 올림픽이나 월드컵 같은 무대에서 격돌하면 대부분 한국이 이기는 것과 마찬가지다. 객관적 전력만으로 분석 안 되는 '분위기'나 '기 싸움'이란 외생 변수가 더 강하게 작용하는 경우가 적지 않기 때문이다.
◆과거 데이터로 인간의 미래 행동 분석 가능할까?
난 구글의 이번 프로젝트를 보면서 ‘빅데이터 분석’의 가능성과 한계를 동시에 봤다. 이변이 없었던 16강전이라고는 하지만, 데이터 분석만으로 결과를 정확하게 예측해낸다는 건 쉬운 일은 아니다. 16강 경기 결과를 보면서 구글의 분석력에 살짝 전율했던 건 그 때문이었다.
빅데이터라는 건 ‘과거’의 데이터로 미래를 예측하는 기술이다. 날씨나 태풍의 진로 같은 정형화된 패턴을 연구하는 덴 빅데이터가 굉장히 유용하다. 구글 번역기 역시 빅데이터 기술의 산물이다. 그래서 영불 번역에 비해 영한 번역의 정확도가 떨어지는 건 두 언어의 패턴 차이 때문이 아니다. 구글이 활용할 수 있는 데이터 양이 엄청나게 차이가 있기 때문이다.
하지만 사람의 행동은 정형화된 분석으로 예측하기 힘든 부분이 많다. 특히 11명이 제한된 공간에서 경기를 하는 축구 경기의 결과를 과거 데이터 만으로 분석하는 건 불가능에 가까운 일이다. 브라질의 축구 스타 네이마르가 부상으로 4강전에 출전하지 못하게 된 ‘중요한 외생 변수’를 어찌 미리 예측할 수 있겠는가?
이번 월드컵에서 구글이 보여준 뛰어난 빅데이터 분석력의 가능성과 한계는 고스란히 인공 지능 컴퓨터의 가능성과 한계로 그대로 연결된다. 엄청난 기술 발전에도 불구하고 우리는 여전히 초보적인 ‘튜링 테스트’를 통과한 컴퓨터에 환호하는 수준에 머물러 있는 것도 그 때문이다.
자, 이제 글을 맺자. 이제 월드컵도 막바지로 치닫고 있다. 난 이번 월드컵 개막 때부터 줄곧 독일팀에 주목해 왔다. 자국 IT 기업인 SAP의 빅데이터 기술을 접목한 훈련 방법 때문이었다. 빅데이터는 분명 만능이 아니다. 하지만 인간의 경험에 빅데이터를 곁들일 경우엔 생각보다 강력한 힘을 발휘할 수 있다.
난 구글의 빅데이터 분석이 8강전에서 빗나간 걸 굉장히 기쁘게 받아들이는 편이다. 그래야 축구 보는 맛이 제대로 살아나기 때문이다.
◆또 다른 빅데이터 팀 독일은 어떤 경기력 보여줄까?
독일과 브라질. 아르헨티나와 네덜란드. 이번 월드컵 4강전은 올라올 팀들이 제대로 올라온 것 같다. 어느 팀이 우승컵을 들어올려도 전혀 이상하지 않을 정도다. 구글 빅데이터 분석의 가능성과 한계를 함께 본 것만으로도 이번 월드컵 시청은 본전을 뽑은 느낌이다.
서두에서도 얘기했지만 난 이번 월드컵에선 축구보다는 IT기술과 빅데이터에 더 관심이 많다. 이쯤에서 솔직한 속내를 드러내보자. 난 또 다른 빅데이터팀인독일이 남미의 심장부에서 어느 정도 능력을 보일 지에 관심을 가질 생각이다.
과연 또 다른 빅데이터가 얼마나 위력을 발휘할까? IT 쪽에 관심 있는 축구팬들은 그 부분에 초점을 맞춰서 남은 월드컵 경기를 시청하는 것도 쏠쏠한 재미가 있을 것 같다.
/김익현 글로벌리서치센터장 [email protected]
--comment--
첫 번째 댓글을 작성해 보세요.
댓글 바로가기