시사·사회-생각해보기

<서적> 내 돈 모두하고 내 손모가지 건다..."빅데이터는 거품이다" - 김동환 지음

irene777 2016. 10. 26. 15:52



“내 돈 모두하고 내 손모가지 건다”

‘빅데이터는 거품이다’ - 김동환 지음 / 페이퍼로드 펴냄


김홍열  성공회대 겸임교수 (정보사회학)


- 진실의길  2016년 10월 20일 -




‘빅데이터가 거품이다’ 라는 주장에 자신의 모든 것을 건 학자가 나타났다. 영화 타자의 명 장면, 전설의 타자 아귀와 젊은 타자 고니가 돈과 손모가지를 걸고 비장하게 결투하는 마지막 장면이 연상될 정도로 저자의 주장은 비장하게 들리고 또 그만큼 확신에 차있다.





아마도 이 책 ( =빅데이터는 거품이다) 을 쓰지 않았더라면, 평생을 그렇게 (= 선진국 지식인들을 그대로 모방하는 한국 교수들 사이에 묻혀서 생각없이) 살다가 학자의 길을 마감하였으리라. p 24


이 정도면 저자의 결기가 결코 일시적 과장이 아님이 분명해 보인다. 도대체 왜 이토록 분노했을까. 우선 저자의 말을 들어 보자


빅데이터라는 말을 듣는 순간 필자의 머리에는 이런 생각이 스쳐 지나갔다. ‘ (그동안 데이터가) 수십 년 동안 학계를 지배하고도 아무런 성과를 내지 못하자 빅 big 이라는 괴물 같은 용어를 붙여서 또 해먹으려는 구나’. P 11


학자들이 ‘호구’를‘꼬시기’ 위해서 그림이 필요했고, 그 적당한 그림이 빅데이터라는 것이다. 실체도 없는 환상을 갖고 정부의 지원을 받기 위해 빅데이터를 이용했다는 것이다. 이런 주장에 이어 ‘빅데이터의 대표적 성공 사례’를 하나하나 비판하기 시작한다. 첫 번째가 가장 많이 인용되는 구글의 독감 예측이다. 우선 구글은빅데이터와 독감 발병과의 상관관계를 분석한 논문에서 결코 미래를 예측할 수 있다고 말한 적이 없고 단지 일정한 상관관계를 언급했을 뿐이라고 주장한다. 그나마 그 분석도 의미있는 정도가 아니라서 구글은 계속 알고리즘을 수정해야 했다. 그러나 이 논문이 어느 순간 빅데이터의 경전이 되어 전 세계로 수출되었고 가장 열렬하게 수용한 곳이 한국사회고 자발적 맹신자가 한국사회의 지식인들이라고 언급한다.


이런 비판은 국가 주도 빅데이터 관련 정책에도 적용된다. 정부에서 추진하는 주요 과제 중


* 범죄발생 장소 및 시간 예측을 통한 범죄발생 최소화 

* 예측 기반의 자연재해 조기 감지 대응 

* 주민 참여형 교통사고 감소체계 구축


등은 현실성이 전혀 없다고 주장한다. 위에 언급된 첫 과제 관련, SNS에 나와 있는 이런저런 내용들을 분석해서 미래의 잠재적 범죄자를 상정한 다음 미리 주변에 잠복하고 있거나 경고를 보낸다는 것이 현실적으로 가능하지도 않고 그럴 경찰 인력도 없는 것이 현실이라고 주장한다. 두 번째 과제에 대한 비판은 누구라도 쉽게 동의할 수 있다. 눈사태나 지진 등을 조기 감지하는 것은 첨단 기술이나 오랜 기간 연구한 전문가들이지 결코 빅데이터가 아니다. SNS의 속성상 공중파보다 빨리 소식이 전달될 수는 있지만 조기 감지와는 전혀 다른 문제다. 세 번째 정부 과제는 코미디에 가깝다. SNS 빅데이터를 이용해 신호등과 과속방지턱을 개선하고 교통신호를 줄인다는 발상은 사실상 난센스에 가깝다. 지역 주민 의견, 교통경찰의 경험 등만 있어도 충분히 개선 가능한데 왜 굳이 빅데이터를 활용해야 하는지 납득하기 어렵다.


또 하나 재미있는 저자의 비판은 빅데이터 옹호론자들의 이중 행태다. 데이터가 많으니 활용하기위해빅데이터 시스템을 구축하자고 해서 많은 돈을 들여 구축해 놨더니 실제 별 효용성이 없다. 현실에 적용했는데 도움이 안된다. 사정이 이러면 반성해야 되는데 그 이유를 데이터의 부족에서 찾는다. 코미디다. 기존 데이터로는 부족해서 안된다. 더 많은 데이터가 필요하다. 그러니 정부가 갖고 있는 개인 데이터를 내어놓아라, 라고 주장한다는 것이다. 거의 목불인견 수준이라고 저자는 통탄한다. 계속 읽다 보면 저자 주장에 대부분 동의하게 된다.


그러나 저자가 빅 데이터 자체를 부정하는 것은 아니다. 저자는 SNS을 통한 데이터의 수집 및 활용이 결코 미래를 합리적으로 예측할 수 없다고 주장하는 것이지 빅데이터의 합리적 활용 가능성을 부정하는 것은 아니다. 예를 들어, 서울시 심야 버스 도입시에 활용된 빅데이터의 경우에는 성공적이라고 평가하고 있다. 예측이 아니라 상관관계 분석 도구로 사용할 수 있다는 것이다. 또 빅데이터가유비쿼터스나 사물인터넷과 연결되어 공공목적에 실용적으로 활용될 수 있다고 주장한다.


저자의 결론은 이렇다. 데이터는 데이터일뿐이다. 과거의 기록이다. 과거로 미래를 말해서는 안된다. 그건 사이비다. 과거의 기록들 즉, 데이터, 보도자료, 논문, 영상 들을 잘 이해하고 분석해서 합리적 이론이나 분석 틀을 만들고 그 바탕 위에서 미래를 준비해야 된다. 그래도 미래 준비는 쉽지 않지만 그나마 이런 노력이 인간이 할 수 있는 최선의 방법이다. 이런 저자의 주장에 동의한다.


빅데이터 옹호론자들의 수준이 거의 사이비에 가깝다 보니 이를 반박하는 저자의 주장 역시 과격할 수밖에 없다. 그러다 보니 중간중간 흥분한 모습도 보이고 비논리적 전개도 일부 눈에 띈다. 그러나 이런 것들이 독해에 방해가 되지 않는다. 부정의한 세상에 대해 욕 몇 마디 하는 것은 오히려 애교에 가깝다. 타자 아귀와 고니는 손모가지를 걸고 도박을 하는데 빅데이터 옹호론자들은 부귀 영화 다 누리면서 뻔뻔하게 사기치고 다니는 현실이 많이 답답했을 저자에게 충분히 공감할 수 있다.



<출처 : http://poweroftruth.net/column/mainView.php?kcat=&table=hy_kim&uid=34>