본문 바로가기

블로그 공학/단기 컨텐츠

빅데이터에 대한 오해들


Big Myths About Big Data - Daniel Solove




빅데이터에 대한 오해들: Big Myths About Big Data

이번 수요일에 미국 연방 통상 위원회(Federal Trade Commission)에서 빅데이터 관련 워크샵을 열었다. 빅데이터란 용어는 최근에 다양한 분야에서 사용되고 있는데 말하는 사람에 따라서 때로는 인류에게 도움을 줄 놀라운 결과들을 생산할 수 있는 것으로, 때로는 자유와 민주주의를 억압하는 골칫거리로 표현되기도 한다. 나는 개인적으로 이 두가지 설명이 모두 틀렸다고 생각하며 이번 글에서 빅데이터에 관한 잘못된 믿음들을 언급 하고자 한다.


빅데이터에 대한 오해: 빅데이터는 새로운 현상이다. 빅데이터는 새로운 것이 아니다. 빅데이터라는 용어만 새로운 것이다. 우리는 오랫동안 빅데이터와함께 해왔다. 신용조사대행업체(Credit Reporting Agency)들은 오랫동안 많은 양의 개인 프로필을 축적해왔다. 기업들과 정부는 개인 정보에 대한 막대한 양의 데이터 베이스를 구축해왔다. 그들은 이러한 자료들을 분석하고 특정 패턴 또는 규칙을 찾는데 이용했다. 지난 15년 동안 우리는 데이터 베이스, 데이터 마이닝, 퓨전센터(fusion center)와 같은 용어들을 들어왔다. 이 모든 것들이 빅데이터이다. 빅데이터에 대한 새로운 것은 단지 새롭게 만들어진 멋진 이름 뿐이다. 


빅데이터에 대한 오해: 빅데이터는 인류를 구원할 놀라울 만한 이득을 가져다 줄 것이기 때문에, 빅데이터를 규제하는 것을 피해야 한다. 나는 계속해서 빅데이터가 인류를 구하고 세계를 혁신시킬 놀라운 결과들을 생산할 것이라는 과장된 주장들을 들어왔다. 빅데이터는 분명히 많은 이득을 가져다 줄 수 있다. 나는 그런 빅데이터의 이로운 점이 데이터를 조합하고 분석함으로써 얻을 수 있다고 생각한다. 그러나 우리는 빅데이터가 사용자와 사회에 가져다주는 이득들과, 기업과 기관들에 가져다 주는 이득을 구별할 필요가 있다. 때때로 여러 기관들은 빅데이터를 정당화 하기위해 빅데이터가 가져다주는 이득들을 멋지게 포장하는데, 결국 그들이 빅데이터를 이용하는 주된 목적은 개인 정보 수집 뿐이다. 단지 빅데이터를 사용하는 일부 경우가 우리에게 큰 이득을 가져다 준다고 하더라도 빅데이터를 사용하는 모든 경우가 이로운 것이라고 말할 수는 없다.   

빅데이터에 대한 오해: 빅데이터는 현재 규제되지 않고 있으며, 빅데이터의 특성을 완벽히 이해하기 전에 새로운 규제들을 만드는 것에 신중해야 한다. 일부는 빅데이터는 전례가 없는 것이며 따라서 이것을 규제하는데 신중해져야 한다고 주장한다. 그러나 신용조사대행업체가 바로 빅데이터였고 1970년도에 공정신용보고법(Fair Credit Reporting Act)이라는 이름으로 그것을 규제한 바 있다. 그 당시 분명히 규제는 필요했고, 공정신용보고법 관련 입법들을 살펴보면 신용조사대행업체의 잘못된 행위들에 대한 예제로 가득하다는걸 알 수 있다. 공정신용보고법은 사용자들에게 그들의 데이터에 관한 기본 권리를 제공하기 위해 제정되었다. 그러나 오늘날에는 많은 기관이나 업체들이 공정신용보고법의 규제없이 개인 데이터를 축적하거나 이용하고 있다. 이 문제에 대한 해답으로 모두를 공정신용보고법으로 규제하자는 것은 아니다. 공정신용보고법에서 배운 교훈을 바탕으로 빅데이터를 어떻게 규제할지 생각해 봐야 한다는 것이다.

빅데이터를 다루는 최선의 방법은 사람들이 자신의 데이터가 어떻게 수집되고 사용되는지에 대해 투명성을 제공하는 것이다. 언뜻 보기에 이것은 그럴듯한 이야기처럼 들린다. 더 많은 투명성. 누구도 이것에 반박하지 못할 것이다. 나 또한 이것에 전적으로 찬성한다. 하지만 투명성 제공이 빅데이터 문제점들의 해결책이 될수는 없다. 투명성을 제공한다 하더라도, 일반적인 사람들은 그들의 데이터가 어떻게 사용될지 그 결과를 예상할 수 없고 그들의 특정 데이터가 사용되는 것에 대해 비용 편익적인 결정을 내릴 수가 없기 때문이다.

만약 빅데이터가 태생적으로 악한것이라면 대답은 쉬워진다. 빅데이터를 멈추면 된다. 만약 빅데이터가 태생적으로 선한 것이라면 대답은 빅데이터를 널리 즐기면 된다. 하지만 빅데이터는 좋은 측면과 나쁜 측면을 모두 가지고 있다는 것이 문제이다. 빅데이터는 정형화된 관념들을 강화시킬 수 있다. 빅데이터는 소수의 약자들이나 수익이 적은 사람들에게 불리한 방향으로 사용될 가능성이 있다. 빅데이터는 사람들에게 기회를 박탈하거나 특정 아이디어, 상품들에 노출시키는데 사용될 수도 있다. 그리고 빅데이터는 비밀을 파헤치거나 개인정보를 침해하는 등으로 악용될 수도 있다.

위에서 말했듯이 빅데이터는 장점과 단점을 모두 가지고 있기에 우리는 비용 편익적인 결론을 내려야만 한다. 하지만 그런 장단점을 미리 측정하거나 알아내는 것은 어려운 일이다. 예를 들어 개인정보 피해 같은 경우는 개개인의 정보가 축적되어 발생하는 것이기 때문에 각각의 개인정보가 전송될 때마다 모두 평가하고 감독하는 것이 쉽지 않다. 또한 이러한 정보를 모으고, 사용하고, 제공하는 단체, 기업들이 너무 많아 그것을 사람들이 감독할 수 없다는 것도 큰 어려움 중 하나이다. 사람의 능력으로 빅데이터의 이득과 손해를 가늠할 수 있는가에 대한 나의 비관적인 의견은 나의 다른 글, Privacy Self-Management and the Consent Dilemma, 126 Harvard Law Review 1880 (2013)에 자세히 기술되어 있다. 정리하자면 투명성이 중요하기는 하지만 이것은 빅데이터 문제 해결책의 단지 작은 부분일 뿐이라는 것이다.