‘페이스북 선거’ 시대 열렸다

가짜뉴스, 빅데이터 등을 마케팅 도구로 이용…유권자 성격·라이프스타일·가치관 분석해 맞춤 공략

01
사진 : LEE JIN-MAN-AP-NEWSIS

지난해 가을 미국 대선 몇 주 전 말쑥하게 차려 입은 영국 남자가 무대로 걸어 올라가는 동안 록그룹 ‘크리던스 클리어워터 리바이벌’의 ‘Bad Moon Rising’ 도입부 화음이 뉴욕시 한 호텔 연회장을 뒤흔들었다.

불길한 달이 뜨네
위기가 닥쳐오네

영국 명문 이튼 스쿨 출신의 연사 알렉산더 닉스는 버크셔 해서웨이 회장 워런 버핏, 억만장자 투자자 조지 소로스, 톰 브로코 NBC TV 전 앵커, 티 분 피켄스 BP 캐피털 매니지먼트 회장, 데이비드 페트레이어스 전 중앙정보국(CIA) 국장, 토니 블레어 전 영국 총리 같은 이름의 비슷한 글로벌 엘리트끼리 어울리는 자리였다. 정책입안자와 자선사업가들로 이뤄진 그 연례 모임 참석자 중 일부에겐 실제로 위기가 닥쳐오고 있었다. 미국 대선의 영향으로 그들의 세계 질서가 붕괴되려는 참이었다. 그러나 트럼프 선거진영 일을 맡은 업체의 최고경영자인 닉스에겐 그런 혼란이 큰 호재였다.

그날 언급하지는 않았지만 그의 회사 케임브리지 어낼리티카(CA)는 트럼프 선거진영에 서비스를 제공하고 있었다. 트럼프 진영은 미국 유권자 관련 정보의 대규모 데이터베이스를 구축하는 중이었다. 그 회사의 기술로는 무엇보다도 유권자의 ‘사이코그래픽 프로파일링(psychographic profiling, 주민의 행동·가치관·흥미 등에 관한 분석조사)’이 첫 번째로 꼽혔다. 그날 오후 트럼프가 승리할지 전혀 불확실한 상황이었지만 닉슨 CEO는 회사의 기막힌 신제품 홍보 목적으로 그 자리에 참석했다.

그는 “오늘 선거과정에서 빅데이터와 사이코그래픽의 위력에 관해 논할 기회를 얻게 돼 영광”이라고 입을 열었다. 그는 슬라이드를 넘기며 CA가 사람들의 감정에 어떻게 어필할 수 있는지 설명하면서 미국인 남녀에 관한 방대한 데이터 덕분이라고 설명했다.

닉스 CEO는 빅데이터에 관해 훑은 뒤 CA가 그것을 어떻게 정치적 용도로 추출하는지에 관해 설명했다. ‘평균적인 성격’을 찾아낸 뒤 다른 변수들을 토대로 성격 유형을 더 구체적인 하위 그룹으로 분류해 세밀하게 조율된 메시지에 끌릴 만한 더 작은 소그룹을 형성하는 방식이다.

그는 CA의 미국 유권자 관련 데이터에서 추린 이른바 ‘실생활 사례’ 속으로 청중을 인도했다. 보편적인 성격 유형을 가진 익명의 대그룹에서 출발해 한 명의 특정인으로 좁혀 내려갔다. 설명을 듣고 보니 쉽게 알아볼 수 있는 인물이었다.

닉스 CEO는 공화당 아이오와 주 코커스(당원집회) 참석이 유력한 4만5000명 그룹에서 출발했다. 약간만 등을 떠밀면(그의 표현을 빌리자면 ‘설득 메시지’) 투표에 참석해 테드 크루즈 후보(2016년 예비선거 초반 CA 서비스를 이용했다)에 표를 던질 만한 사람들이었다. 그들의 생활과 관련된 수많은 디지털 데이터 자료를 정밀 분석하는 알고리즘의 데이터 흐름 속에서 이들 집단의 세부정보를 건져 올렸다. 닉스 CEO는 자사 알고리즘에서 ‘정서적 안정성(neuroticism)이 대단히 높고, 개방성이 꽤 낮으며 다소 성실하다’는 판정을 받은 하위그룹에 초점을 맞추고 있었다.

찰칵. 그래프와 원형 도표 스크린으로 넘어간다.

“그러나 우리는 더 세분화할 수 있다. 그들이 어떤 이슈에 관심을 갖는지 볼 수 있다. 우리는 총기 소유할 권리를 선택했다. 그에 따라 범위가 약간 더 좁아진다.”

찰칵. 또 다른 그래프와 원형 도표 스크린이지만 몇몇 세부 항목에 동그라미가 쳐져 있다.

“이제 총기소유권리에 관한 메시지의 필요성은 안다. 우리가 관심을 가진 성격 유형에 따라 뉘앙스를 달리 한 설득 메시지가 돼야 한다.”

찰칵. 또 다른 스크린. 아이오와 주 지도에 작은 적색·청색 점들(개별 유권자들)이 점점이 수놓아졌다.

“더 파고들기를 원한다면 그 데이터를 개인 차원까지 세분화할 수 있다. 우리는 미국 내 성인 개개인에 관해 4000~5000건에 가까운 데이터를 보유한다.”

찰칵. 제프리 제이 루스트라는 단 한 사람의 이름에 동그라미가 쳐진 또 다른 화면. 성별(남성)과 그의 위성위치확인시스템(GPS) 좌표.

방금 글로벌 엘리트들 앞에서 닉스 CEO가 마치 동물원의 동물처럼 심리적 성향을 열거한 미국 유권자는 찾아내기 어렵지 않았다. CA 조사팀은 그의 주소뿐 아니라 그에 관해 훨씬 더 많은 정보를 알았을 것이다. 필시 페이스북 ‘좋아요’를 들여다본 듯했다. 예를 들어 헤비메탈 그룹 아이언 메이든, ‘e핫 로즈 앤 건즈’라는 뉴스 사이트, ‘마이 데일리 캐리 건’과 ‘모파 드래그 레이싱’이라는 페이스북 그룹 가입 기록 등이다.

02
미국 대선 전 닉스 CEO는 CA가 ‘인지적 장애물’ 즉 팩트를 뛰어넘어 유권자의 감정에 직접 호소할 수 있다고 자랑했다. / 사진 : YOUTUBE.COM

이 같은 ‘좋아요’는 사이코그래픽 프로필의 필수조건이다.

루스트는 자신만을 위해 맞춤 작성된 메시지를 트럼프 후보로부터 받을 수 있도록 아주 사적인 데이터 대다수를 보여줄 의향이 있는지 질문 받은 적이 없었다. 현재 케임브리지의 분석 알고리즘에 포착된 다른 미국인 수억 명도 마찬가지였다.

빅데이터·인공지능(AI) 그리고 CA 관계자 같은 전략가들이 설계·운영하는 알고리즘은 우리가 사는 세계를 팬옵티콘(Panopticon)으로 탈바꿈시켰다. 간수들이 꼼짝하지 않고도 모든 수감자들을 하루 24시간 매일 감시할 수 있도록 설계된 19세기 원형 감옥 말이다.

우리의 21세기 감시자들은 우리가 구글에서 이탈리아를 검색하거나 아마존에서 피렌체 관련 서적을 구입한 사실을 토대로 토스카나 휴가여행 상품만 팔려 하는 건 아니다. 그들은 인간의 불완전하고 종종 비이성적인 의사결정 방식에 대한 수십 년 간의 행동과학 연구를 토대로 우리 자신도 모르는 새 우리를 특정 후보 쪽으로 은근히 ‘떠민다’.

살인 테러를 저지르는 종교 전사들로부터 북극 빙하의 해빙, 전 세계에서 부상하는 작은 히틀러들에 이르기까지 요즘 현실세계 속의 온갖 공포 영화 같은 반전과 무시무시한 괴물의 등장 중에서도 무엇보다 가장 섬뜩한 것이 있다. 기계가 우리보다 우리 자신에 관해 더 많이 알고, 그들이 가까운 장래에 우리에게 최초의 AI 대통령을 안겨줄 수 있다는(만일 아직 그러지 않았다면) 확실성이다.

1948년 미 중앙정보국(CIA) 프랭크 위즈너 요원이 모킹버드 작전(CIA 최초의 언론조작 시도)을 수립했을 때 자신의 네트워크가 국내뿐 아니라 전 세계의 팩트와 여론을 조작할 수 있는 ‘막강한 월리처 오르간(a mighty Wurlitzer)’이었다고 자랑했다. 그런 가상 머신의 관리에 수반되는 파워와 스트레스를 이기지 못하고 위즈너는 곧 머리가 돌아 목숨을 끊고 말았다.

그러나 오늘날 가공되지 않은 온라인 개인 정보를 기반으로 훨씬 더 강력한 버전의 프로파간다 ‘월리처’가 존재한다. 끊임없이 공급되는 이들 개인정보는 머신에 입력된 뒤 알고리즘에 의해 분석된다. 비슷한 사고를 가진 사람들의 더 소규모 집단에 맞춰 정치적 메시지를 개인화하는 알고리즘이다. 상업용과 치안 용으로 방대한 데이터베이스가 구축되고 있다.

그 데이터베이스는 정치인과 그 전략가에게도 판매된다. 그들은 이제 우리에 관해 우리 배우자나 부모보다 더 많이 알 수 있다. 정보원·전화도청·훔쳐보기가 전부였던 옛 소련 KGB와 동독 정보기관 슈타지는 그런 슈퍼 스파이 기능은 꿈도 꾸지 못했을 것이다.

누구나 시도해 볼 수 있다. CA의 조사기법이 개발된 케임브리지대학은 그 회사와 상업적 관련성은 없지만 그들의 웹사이트에 들어가면 페이스북 기반의 온라인 사이코그래피가 어떻게 기능하는지 볼 수 있다. ApplyMagicSauce.com의 알고리즘은 (페이스북 이용자의 동의를 받은 뒤) 미국의 지난 대선 기간 전 CA가 1차적으로 저임 기술 근로자를 고용해 그들의 페이스북 프로필을 넘겨받아 ‘친구’가 수천만 명에 달했을 때 한 일을 재현한다.

페이스북 포스트·친구·좋아요를 샅샅이 훑은 뒤 몇 초만에 성격 프로필을 토해 낸다. 이른바 OCEAN 심리성향 테스트 점수(개방성·성실성·외향성·친화성·정서적 안정성)가 대표적이다.

대규모 사이코그래픽 프로파일링 기능을 가진 CA는 국가주의자 스티브 배넌 백악관 수석 전략가와 공화당의 오랜 비밀 공작 전문가 로저스톤 정치 전략가 등 트럼프 선거진영의 다른 여러 운동원과 마찬가지로 음지의 장인 장르에 속한다. 배넌은 CA 이사였으며 그의 후원자인 로버트 머서가 CA의 90% 지분을 소유한 것으로 알려졌다. 머서는 이름 곁에 거의 예외 없이 ‘베일에 가려진(shadowy)’이라는 형용사가 따르는 보수파 억만장자다.

03
마크 저커버그 CEO는 페이스북의 광고 도구가 트럼프의 당선에 도움을 줬다는 주장을 강력히 부인한다. / 사진 : ERIC RISBERG-AP-NEWSIS

그러나 CA는 트럼프 선거진영의 커다란 데이터 추출 머신에서 하나의 톱니에 불과했다. 전 세계 거의 20억 명에 관한 온라인 행태 데이터를 보유한 페이스북이 트럼프에게 훨씬 더 유용했다. 정보 열람 비용을 지불할 능력이 있는 전략가와 마케터는 그 개개인의 정보를 들여다볼 수 있다.

트럼프 선거진영은 2억2000만 명의 데이터베이스를 구축하고 프로젝트 알라모라는 닉네임을 붙였다. 유권자 등록 기록, 총기 소유 기록, 신용카드 구매기록, 그리고 거대한 데이터 금고인 엑스페리안사(Experian PLC), 데이터로직스, 엡실론, 그리고 액시옴(Acxiom Corporation)을 이용했다.

맏사위 재러드 쿠슈너는 트럼프가 공화당 대선 후보로 지명되기 오래 전에 페이스북의 위력을 간파했다. 지난해 대선 캠페인이 끝날 무렵 페이스북은 트럼프의 선거운동에서 필수불가결한 요소로 자리 잡았다. 트럼프의 데이터팀이 제임스 반즈라는 페이스북 직원을 선거 캠프의 MVP로 선정할 정도였다.

그들이 그런 방식을 도입한 최초의 전국적 선거 캠프는 아니었다. 민주당 전국위원회는 유권자 2억4000만 명의 데이터가 저장된 데이터베이스 캐털리스트(Catalist)를 이용했다. 상용·공공 기록에서 추출한 데이터가 1인당 수백 건씩 저장돼 있었다.

그러나 그것은 페이스북에 ‘유사 타깃(Lookalike Audiences)’ 기능이 생기기 전, AI와 알고리즘이 유권자를 분석해 25인 이익집단으로 세분화할 수 있게 되기 오래 전의 일이었다. 그리고 2020년이 되면 분명 2016년의 디지털 발전은 정치전략의 골동품처럼 보이게 될 것이다.

페이스북이 광고주들에게 제공하는 많은 서비스 중에 ‘유사 타깃’ 프로그램이 있다. 광고주(또는 정치 캠페인 관리자)가 소그룹의 알려진 고객이나 지지자 정보를 들고 페이스북을 찾아가 규모를 키워 달라고 요청할 수 있다. 페이스북은 수십억 건의 포스트·사진·좋아요·연락처 열람권한을 이용해 원래 그룹과 유사한 사람들의 그룹을 형성한 뒤 그 집단에 영향을 미치도록 제작된 표적 광고를 내보낼 수 있다.

사이코그래픽 마이크로타게팅(microtargeting, 유권자 맞춤 전략)과 페이스북의 유사 타깃 프로그램의 결합은 적어도 2004년까지 거슬러 올라가는 전술에서 논리적으로 이론의 여지가 없는 다음 수순이었다. 당시 칼 로브는 오하이오 주의 아미시 교파를 찾아낸 뒤 동성결혼 문제로 그들을 자극하는 등의 방법으로 유권자 마이크로타게팅에 착수했다. 결과적으로 아미시 교도들은 사상 처음으로 투표에 참여했다.

그 뒤로 미국인 유권자를 분석하고 분류하는 머신과 알고리즘의 능력이 크게 향상됐다. 요즘 정치전략가들은 빅데이터의 도움으로 마우스나 키보드를 한 번만 움직이면 개인의 OCEAN 상대 점수를 요청해 입수할 수 있다. 사이코그래픽 분석에는 페이스북조차 필요 없다. 상업적으로 제공되는 수천 건의 데이터를 이용해 컴퓨터가 사람들을 심리적으로 분류한 뒤 실제로 테스트 받은 사람들과 그들의 프로필을 대조하면 된다.

04
데이터 수집 기술의 발전 그리고 미국이 프라이버시 문제에서 비교적 무법 상태였던 탓에 정치사상 가장 공격적인 마이크로타게팅이 가능해졌다. / 사진 : TED S. WARREN-AP-NEWSIS

2008년 버락 오바마가 대선에 출마했을 때 그의 캠프는 소셜미디어와 데이터 추출에 정통하다는 평가를 받았다. 4년 뒤인 2012년 오바마 선거진영은 새로운 가능성을 테스트했다. 특정 그룹의 ‘설득가능성’ 순위를 매기고 메시지가 그들에게 얼마나 주효했는지에 관한 인구통계 분석과 전화조사를 결합하는 실험을 실시했다.

2012년에 접어들면서 빅데이터·소셜미디어 그리고 AI를 결합해 할 수 있는 일에 큰 발전이 있었다. 그해 페이스북은 행복·슬픔 같은 감정 조작 실험을 실시했다. 100만 명을 두 그룹으로 나눠 포스트 메시지를 조작했다. 한 그룹은 친구들로부터 행복한 업데이트 소식을 받고 또 한 그룹은 슬픈 소식을 받도록 했다. 그 뒤 그 영향에 대한 알고리즘 분석을 통해 그들이 뜻밖에도 사람들의 기분에 영향을 미칠 수 있음을 입증했다(사상 최대 규모의 개인 행동 데이터를 축적한 페이스북은 지금도 행태 조사를 실시한다. 여전히 광고와 수익사업 목적이다. 지난 5월 초 페이스북의 호주 지사에서 유출된 문서에선 페이스북이 ‘불안정한 십대’를 포함한 사람들의 감정상태를 파악해 제품 표적 광고를 향상시킬 수 있다고 광고주들에게 홍보하고 있었다).

2013년 케임브리지대학 연구팀은 사이코그래픽 프로파일링에 페이스북을 어떻게 이용할 수 있을지 실험했다(이 방식은 훗날 CA에서 상용화했다). 미국인 연구원 알렉산더 코건도 리서치의 상업화에 참여한 과학자 중 한 명이었다. 그는 결국 3000만 건의 페이스북 프로필을 확보해 CA의 전신에 넘겨줬다. 그는 회사를 떠난 뒤 캘리포니아 주로 건너가 알렉산더 스펙터로 정식 개명했다. 델라웨어에서 자신의 온라인 설문과 서베이 데이터를 판매하는 회사를 세웠다. 온라인에서 개인 정보를 빨아들이는 또 하나의 약간 더 투명한 방법이다.

지금은 때때로 ‘페이스북 선거’로 불리는 2016년 대선에서 페이스북은 CA의 실험을 뛰어넘어 완전히 새로운 기술을 적용했다. 소셜미디어가 존재하기 전에도 트럼프의 당선 가능성이 컸지만 데이터 수집 기술의 발전 그리고 미국이 프라이버시 문제에서 비교적 무법 상태였던 탓에 정치사상 가장 공격적인 마이크로타게팅이 가능해졌다. ‘정보가 적은’ 새 유권자들을 정치집단으로 끌어들이고 인종주의적·반유대주의적·여성혐오적 정치연설의 경계를 확대했다.

독일 IT 컨설턴트 크리스토프 보른셰인은 온라인 프라이버시와 기타 인터넷 현안에 관해 앙겔라 메르켈 독일 총리의 고문 역할을 한다. 그는 오바마와 트럼프 대선 전략의 차이는 알고리즘과 오늘날의 발전된 AI에 있다고 말한다. 마케터들은 ‘통계적 쌍둥이’ 즉 비슷한 사고를 가진 사람들을 찾아내 그룹을 형성한 뒤 그들에게 신발·여행상품·세탁기를 판매하기 위한 표적 광고를 내보내는 데 몇몇 도구를 사용한다. 정치 전략가들도 똑같은 도구를 이용해 사람들이 듣고 싶어 하는 슬로건과 스토리, 일명 가짜 뉴스로 가득한 ‘에코방(echo chambers, 자신들의 메아리만 울리는 방)’을 만들 수 있다.

05
CA는 공화당 예비선거 중 테드 크루즈 후보(사진) 선거운동에도 참여했다. 그들의 기법이 모든 후보의 승리를 보장하지 못한다는 증거다. / 사진 : CAROLYN KASTER-AP-NEWSIS

페이스북은 함께 묶기 어려운 사람들을 광고 도구들을 이용해 비슷한 사고방식의 아주 작은 소그룹으로 분류했다. 이는 이른바 오버튼 윈도(Overton window, 미국의 공적 토론에서 허용되는 연설의 한계)를 깨는 데 도움이 됐다. 예컨대 (페이스북에서) 비공개로 인종차별이나 반유대주의 사고를 선호하는 것으로 알려진 유권자들로 그룹을 만들어 출처가 공개되지 않은 이른바 암흑 광고(dark ad)를 그들에게 전달할 수 있다. 지난해 미국 대선에서 인종주의적 정서, 백인 우월주의, 난민에 대한 반감, 반유대주의, 악의적인 여성혐오가 소셜미디어에서 넘쳐나 대학 캠퍼스 포스터와 대중 집회로 퍼져나갔다.

전략가들은 사이코그래픽 알고리즘을 이용해 성난 인종주의자뿐 아니라 지적으로 현혹되기 쉬운 개인들을 표적으로 삼을 수 있다. 이성적이기보다 감정적으로 결정을 내리는 사람들이다. 트럼프에게 그런 유권자들은 어두운 탄광 속의 다이아몬드나 다름없었다. CA도 일익을 담당한 듯했다. 대선 몇 주 전 CA에 관한 스카이 뉴스 보도에서 실제로 한 직원이 ‘인지 척도의 필요성’에 관한 논문을 살펴보는 모습이 카메라에 잡혔다. 인지 척도는 OCEAN 테스트와 마찬가지로 개인 데이터에 적용될 수 있으며 개인의 의사결정에서 ‘사고 vs 감정’의 상대적인 비중을 측정한다.

트럼프 선거진영은 페이스북의 표적 광고기법을 이용해 극히 정밀하게 조준된 메시지에 민감하게 반응하는 소집단을 찾아냈다. 그렇게 찾아내는 집단의 규모가 갈수록 작아졌다. 이 같은 타게팅의 바탕을 이루는 행동과학에선 사람들이 자신의 관점과 다른 정보는 거부하지만 친밀하거나 사고방식이 비슷한 사람들이 전할 때는 더 잘 받아들이는 것으로 나타났다.

페이스북의 각종 도구를 이용해 이민·여성·흑인·유대인 혐오자들을 찾아내고 자극하는 것은 어렵지 않다. 그리고 페이스북은 그런 위험을 알면서도 지금껏 그것을 저지하기 위한 방벽을 세우지 않았다. 그러나 그런 가능성은 인정했다. 페이스북은 지난 4월 보고서에서 “우리는 보안의 초점을 계정 해킹, 멀웨어(악성코드), 스팸, 금융 사기 같은 전통적인 불법 행위에 한정하지 않고 공개토론을 조작하고 사람들을 기만하려는 시도 등 더 미묘하고 교활하게 퍼져나가는 부정 행위까지 포함하도록 확대해야 했다”고 밝혔다.

06
2020년 미국 대선에는 훨씬 더 많은 온라인 도구가 등장해 수천~수만 개의 맞춤 광고를 뿌릴 것이라고 전문가들은 예상한다. / 사진 : DAVID DERMER-AP-NEWSIS

트럼프 진영은 하루 최대 7만 개의 변종 광고를 내보냈다. 그리고 힐러리 클린턴과의 제3차 토론을 전후해 17만5000건의 변종 광고를 쏟아냈다. 트럼프 진영의 게리 코비 디지털 광고 팀장은 변종 광고가 구체적으로 가령 ‘오하이오 주의 밥 스미스’를 표적으로 하기보다는 다양한 소규모 유권자 집단의 기부 확대를 겨냥한 것이라고 말했다. 그는 그 과정을 조금씩 자주 수익을 실현하는 ‘초단기 주식 거래’에 비유하며 트럼프가 “정계의 다른 어느 누구도 하지 못한” 방식으로 페이스북을 이용했다고 말했다.

그는 트럼프 진영이 CA의 사이코그래픽스를 이용한 적이 없다고 주장했다. 하지만 닉스 CEO가 뉴욕 강연에서 밝힌 바에 따르면 분명 CA는 트럼프 유권자들에게 그 기법을 적용했다.

코비 팀장은 동유럽과 미국에서 이뤄진 반(反) 클린턴 광고와 프로파간다 공세의 배후가 트럼프 진영이라는 주장도 부인했다. 그 공세는 페이스북의 도구를 통해 기존에 알려진 트럼프 유권자들과 비슷한 성향으로 확인된 불만분자들을 정확히 겨냥했다. 소수인종과 여성들의 투표를 억제하려는 시도였다. 조사에 따르면 그런 억제 광고와 가짜 뉴스가 트럼프의 투표 독려 광고보다 대선 결과에 더 결정적인 역할을 했다.

인종과 성별에 따른 페이스북의 표적 광고와 관련된 스캔들이 일어나긴 했지만 새롭지도 않고 합법적이다. 저술가이자 언론인 줄리아 앙윈은 저서 ‘집요한 감시의 세계에서 프라이버시·보안·자유를 찾아(Dragnet Nation: A Quest for Privacy, Security, and Freedom in a World of Relentless Surveillance)’에서 주택분양 광고주들이 페이스북의 ‘인종 친화성(ethnic affinity)’ 마케팅 도구를 이용해 광고에서 흑인들을 배척했다고 밝혔다. 페이스북은 그것을 예방하는 도구를 마련하겠다고 약속했지만 인종 타깃의 정치적 메시지에 그 도구를 이용하는 문제에 관해서는 일절 함구했다.

페이스북의 한 대변인은 각종 혐의에 관해 공식 인터뷰를 거부하며 마크 저커버그 창업자 겸 CEO는 이 기사를 위해 논평하지 않을 것이라고 말했다. 대변인은 이메일에서 “사람들을 오도하거나 그들의 정보를 오용하는 행위는 우리 정책에 직접적으로 저촉되며 그런 기업에 대해서는 페이스북 이용을 금지하고 부적절하게 수집된 데이터를 모두 파기하는 등 신속히 조치를 취할 것”이라고 밝혔다. 데이터 오용에 관한 페이스북의 정의는 약관에 설명돼 있다고 대변인은 밝혔다. 장문의 약관은 안전과 신원정보 문제 등 개괄적으로 분할돼 있다. 약관에는 CA가 서비스하는 것과 같은 사이코프래픽 분석을 명확하게 금지하는 조항은 없는 듯하다.

‘페이스북 선거’에 관한 페이스북의 마지막 공개 발언은 지난 3월 노스 캐롤라이나 농업·기술 주립대학에서였다. “우리가 사람들이 클릭하기를 바라고 우리 서비스에 실제로 이런 콘텐트를 원한다는 비난이 있었지만 얼토당토않은 소리다. 우리 커뮤니티에서 가짜 정보를 원하는 사람은 아무도 없다.” 그는 사이코그래픽 마이크로타게팅에 관해서는 공개적으로 언급하지 않았지만 선거 후 비판이 거세지자 페이스북에 3000명을 새로 고용해 신고된 증오 발언을 모니터하도록 했다.

07
로버트 머서는 스티브 배넌 백악관 수석 전략가의 후원자이며 CA의 90% 지분을 소유한 것으로 알려졌다. / 사진 : YOUTUBE

뉴스위크가 만난 민주당 캠페인 전략가들은 트럼프의 디지털 전략이 효과적이었다고 인정하면서도 그것을 대선 승리 요인으로는 보지 않았다. 2012년 오바마 대선 캠프 디지털 전략 부책임자였던 마리 댄지그는 “궁극적으로 트럼프의 전반적인 전략이 과거보다 세련미가 떨어졌다”고 말했다. 현재 진보주의 성향 정치전략 기업 블루 스테이트 디지털에서 일하는 그녀는 이렇게 덧붙였다. “그는 대규모의 대중적인 공포 유발 전략에 초점을 맞췄다. 강력한 정치적 플랫폼으로 자리 잡은 소셜미디어가 지지난 대선에는 존재하지 않았다는 점을 간과해선 안 된다. 소셜 미디어는 튀는 발언으로 지지기반을 규합하거나 가짜 뉴스를 퍼뜨리기에 완벽한 수단이다.
통용되는 사이코그래픽 또는 행위 데이터를 이용하고 그것으로 사람들을 오도하거나 두려움을 유발하는 것은 위험한 결과를 초래하는 위험한 게임이다.”

페이스북의 마이크로타게팅 능력, 행동과학, 그리고 트위터나 스냅챗 같은 다른 소셜미디어 플랫폼이 보유한 다량의 데이터 같은 도구는 판도라의 상자 안에 다시 집어넣을 수 없는 도구들이라고 댄지그를 비롯한 민주당 전략가들은 말한다. 그들은 물론 공포 기반 메시지에 넘어가기 쉬운, 정서적 안정성과 성실성이 낮은 유권자를 찾지는 않을 것이라고 주장한다. 그러나 빅데이터·행동과학·페이스북·마이크로 타게팅의 결합은 더 바랄 게 없는 정치 공식이다. 그들도 그것을 이용하면서 그것을 어떻게 가다듬고 개선해 나갈지는 입에 올리지 않을 것이다.

코비 팀장은 2020년에는 구글과 페이스북 같은 플랫폼이 더 많이 등장하고 수만 또는 수십 만 건의 변종 광고 제작이 더 프로그램화·기계화될 것이라고 예측했다. 끝으로 ‘메신저 봇’이 더 보편화하고 개인화돼 가령 오하이오 주의 유권자들이 자신과 자신들의 공동체만의 문제에 관해 트럼프 봇으로부터 답변을 들을 수 있게 된다고 내다봤다.

저커버그, CA 심지어 민주당 컨설턴트들까지 그 문제와 관련해 너무 깊이 파고들려 하지 않는 데는 이유가 있다고 ‘인터넷이 우리에게 숨기는 것(The Filter Bubble: What the Internet Is Hiding From You)’의 저자 엘리 패리서는 말한다. “여기에는 여러 가지 위험이 따른다. 하나는 어떤 정치적 주장이 누구에게 향하는지 듣지 않으면 대화가 전혀 이뤄지지 않는다는 점이다. 우리는 그런 마이크로타깃 세계에 이미 상당히 근접했기 때문이다. 또 하나는 특정 사이코그래픽 하위 그룹에 특정한 메시지를 전달하는 단계를 뛰어넘는 상황을 상상하기 어렵지 않다는 점이다. 그런 세상에선 정치 캠페인에서 기계가 만들어낸 100만 가지 메시지를 통계적으로 유의미한 100만 개 그룹에 전달하게 된다. 그리고 무엇이 효과적인지 또는 심지어 어떤 주장인지 이해하는 과정도 없이 후보 지지가 눈에 띄게 증가하는 메시지만 증폭하게 된다.”

구글 임원 출신의 트래비스 재레이는 “사람들은 데이터를 이해하지 못한다”고 말했다. 온라인 신원정보 보안을 전문으로 하며 주로 해커와 절도범으로부터 대기업을 보호하는 일을 하는 그는 이렇게 덧붙인다. “사람들은 자신들이 인터넷 주변에 어떤 빵 부스러기를 남기는지 알지 못한다. 그리고 정부 당국자들은 데이터 분석기술이 어떻게 작동하지는 모른다.” 재레이가 창업한 컨설팅 업체는 온라인 신원정보와 보안에 관해 기업에 컨설팅한다. 그는 수조 달러를 다루는 금융기업 관리자들도 모르는 건 마찬가지라고 말한다. “그들이 이해하지 못하는데 정부와 일반 시민이 이해할까?”

그러나 데이터 기술은 지금껏 법률·규제 프레임워크를 앞서 나갔다. 그것을 정치 캠페인에 사용하는 데 따르는 윤리문제에 관한 토론은 아직 거의 없다. 어떤 중진 국회의원이나 워싱턴 정부 관료도 사이코그래픽 데이터 마이닝이 프라이버시에 무엇을 의미하는지, 그리고 인지나 합리적 사고의 회피에 기초한 정치 메시지의 윤리성 또는 인종주의와 기타 지금껏 금지됐던 발언의 주류화에서 AI의 역할과 관련된 문제에 큰 비중을 두지 않았다.

08
트럼프 맏사위 재러드 쿠슈너(오른쪽)는 선거운동에 페이스북의 광고 도구를 도입해 이성보다 감정으로 움직이는 유권자들을 공략했다. / 사진 : PABLO MARTINEZ MONSIVAIS-AP-NEWSIS

유럽의 운동가들은 그와 관련된 질문을 던지고 있다. 스위스 수학자이자 데이터 보호 운동가 폴-올리비어 데하예는 사람들이 자신에 관한 데이터에 접근하도록 돕는 퍼스널데이터.IO의 창업자다. 페이스북이 자신을 비롯한 다른 사람들에 관해 수집하는 정보에 대해 열 번 중재에 나섰다. 그는 페이스북과 케임브리지가 수집하는 데이터를 요청하는 법의 설명을 포함해 두 회사에 관해 폭넓게 저술했다. 그는 “두더쥐 잡기와 비슷하다”고 말했다. “이들 플랫폼이 별개라고 생각하면 오산이다. 모든 플랫폼 전반에 걸쳐 이용자를 연결하는 역할을 담당하는 기업이 있으며 그런 것들을 상호 연결시키는 제품들도 있다.”

업계 관계자들도 데이터 기반 사이코그래픽스가 미치는 영향이 등골을 오싹하게 만든다는 점을 인정한다. 최대 데이터 수집업체 중 하나인 에퀴팩스의 그레그 존스 부사장은 “그 가능성은 무시무시하다”고 말했다. 최근 워싱턴 D.C.에서 열린 빅데이터 규제 관련 패널 토론에 참여했던 그는 이렇게 덧붙였다.

“CA가 마이크로타게팅 기법으로 이룬 성과를 보면 그것은 마케터의 꿈인 셈이다. 완벽한 시점에 완벽한 제안을 할 수 있을 만큼 고객을 속속들이 아는 것이다. 그런 정보의 활용은 합법이지만 윤리적인지는 모르겠다. 시장을 세분화해 그것을 바탕으로 사람들에게 신용카드든 최고의 정당이든 가장 좋은 제안을 하지 못하게끔 정치적 목적에 일부 규제를 적용해야 할까? 이 중 일부는 현재 상태로는 곤란하다고 생각하며 앞으로 사람들이 결정해야 할 문제다.”

하지만 그게 언제쯤일까? 대선 후 미국 프라이버시 법과 정책에 변화는 없었다. 오히려 트럼프 대통령은 지난 4월 프라이버시를 제한하고 상업적 데이터를 확대하는 방향으로 분명한 조치를 취했다. 광대역·무선통신사들이 민감한 정보를 공유하려면 허가를 받도록 하는 오바마 시대 프라이버시 규정을 폐기했다. 지금은 버라이즌과 AT&T 같은 기업들이 사람들의 집안 활동 그리고 그들의 전화 상 온라인 활동에 관한 데이터를 이용해 수익 사업을 시작할 수 있게 됐다.

대선 후 CA의 모 기업인 방위산업체 SCL(Strategic Communications Laboratories)은 곧바로 백악관으로부터 수 블록 거리에 사무실을 마련하고 미국 국무부가 제시한 50만 달러짜리 계약을 마무리지었다. 워싱턴 포스트에 따르면 해외 프로파간다가 미치는 영향의 평가를 돕는 계약이었다.

그러나 그들이 돈을 쓸어 담을 동안 작지만 집요하고 강렬한 분노에 밀려 이제껏 자기 홍보에 여념이 없던 닉스와 그의 회사가 소극적이고 겸손해졌다. CA는 페이스북의 데이터를 사용하지 않으며 페이스북 정보를 추출할 때는 “참여하기 원하는 개인의 명백한 동의를 받아” 설문을 통한다고 홍보책임자 닉 피버트가 뉴스위크에 말했다. 또한 CA는 트럼프 선거 운동에 사이코그래픽스를 적용할 시간이 없었다고 말했다.

영국 언론에서 수개월 전부터 이 문제를 취재하면서 갈수록 비판적인 기사가 많아졌다(특히 영국 가디언의 캐롤 캐드왈라드르는 CA의 작업을 가리켜 권위주의적인 감시국가를 위한 프레임워크라고 불렀고, CA는 그 뒤 그의 보도에 법적으로 이의를 제기했다). 마침내 사생활 보호권과 영국의 엄격한 관련법 준수를 모니터하는 독립기구인 영국 정보커미셔너사무국(ICO)은 지난 5월 17일 브렉시트(영국 EU 탈퇴)와 기타 국민투표에서 CA와 SCL의 역할을 조사 중이라고 발표했다.

그 밖에도 런던의 변호사들은 CA와 SCL을 상대로 집단소송을 준비 중이다. 이 문제와 관련된 데이터 수집의 막대한 규모 때문에 손해배상 평가액이 천문학적인 규모에 이를 수도 있다.

미국에선 의회 의원들이 우익 성향의 동유럽 웹 봇과 CA의 관련성을 조사 중이라고 전해진다. 그 웹봇들은 대선 기간 중 여론조사에서 트럼프의 지지도가 떨어질 때마다 클린턴에 관해 부정적인 때로는 사실과 다른 스토리를 인터넷에 쏟아냈다.

미국 벤처자본가와 기업가들은 가짜 뉴스의 흐름을 막을 수 있는 웹사이트와 앱 개발에 열을 올린다. ‘나이트 오보 방지 시제품 펀드(Knight Prototype Fund on Misinformation)’와 소규모 벤처 자본가 그룹이 관련 아이디어를 가진 사업가들을 위한 종자돈을 모으고 있다. 올해 초 매사추세츠공대(MIT)에서 개최된 제1회 미스인포콘(Misinfocon)에 수백 명의 개발자가 참석했으며 그런 컨퍼런스가 앞으로 더 많이 계획돼 있다. 페이스북과 구글은 지난해 11월 이후 쏟아지는 가짜뉴스를 걸러내는 방안 개발에 고심해 왔다.

미국 대선 이후 마이크로타게팅과 가짜 뉴스 공작의 규모가 명확하게 드러나면서 CA와 페이스북은 방어태세로 전환했다. CA 창업자 중 한 명은 사이코그래픽스의 정확도가 1% 선에 그친다며 자신들의 방식이 효과적이 아니라고 주장하기도 했다. 닉스 CEO가 가짜 약 장수라고 말하는 셈이다.

과거 CA는 미국 대선 레이스에 자신들의 사이코그래픽 기술이 어떻게 적용되는지 공개적으로 자랑하고 다녔다. 기자들이 여기저기 쑤시고 다니고, 유럽의 프라이버시 운동가들이 소송을 준비하고, 영국 ICO가 조사에 착수하고, 미국 상원 위원회가 대선 기간 중 러시아의 트럼프 밀어주기 공작에 대한 CA의 연루 가능성 조사에 착수하기 전까지는 그랬다. SCL은 아직도 자신들의 작업이 개도국 선거에 미치는 영향을 광고하며 웹사이트에서 ‘샌디아 내셔널 래버러터리즈’ 같은 미국 방위산업체와의 관련성를 언급한다. 안전하다고 알려진 애플 제품의 해킹이 가능한지 알려지기 오래 전에 이미 그 방법을 알아낸 업체다.

뉴욕시 뉴스쿨의 뉴미디어 학과 데이비드 캐롤 교수는 CA의 과거 선전이 사실이며 지금은 거짓말을 한다고 본다. “그들이 엄청나게 많은 데이터를 보유한다는 말은 허튼소리가 아니다.”

지난 5월 15일 워싱턴 D.C.에서 열린 빅데이터 업계 컨퍼런스 강연에서 현재 러시아에 망명 중인 미국 국가안보국(NSA) 내부고발자 에드워드 스노든은 온라인의 모든 상호작용과 활동 기록의 대규모 수집과 보존이 우리 사회를 얼마나 위협하는지 고려해야 한다고 위성 중계를 통해 방청객에게 호소했다. 그는 “사람들의 활동이 추적당할 수 있고 이 기록의 사슬을 벗어날 길이 없어질 때 우리가 사는 세상은 계수화된 거미줄이 되고 만다”며 “그것은 자유롭고 개방된 사회에는 극히 부정적인 결과”라고 말했다.

페이스북은 갈수록 거세지는 비판에 직면하고도 수익성 높은 데이터 분석과 세분화 광고 도구를 폐기하겠다는 계획은 발표하지 않았다. 그러나 지난 몇 주 사이 그들의 광고 도구 때문에 IT 전문 매체 엔가젯(Engadget) 소속 바이올렛 블루의 표현을 빌리자면 ‘증오단체 인큐베이터’이자 ‘깔끔하고 조명 밝은 파시즘 공간’으로 변했다는 비난을 받아 왔다. 블루 기자는 ‘페이스북과 저커버그의 인종주의적인 규정집’이라는 제목의 기사에서 페이스북은 사회적 책임보다 돈을 더 중시하기 때문에 대표적으로 홀로코스트(유대인 대학살) 부정 등을 조장한다고 비난했다.

가디언은 페이스북이 ‘영국 브렉시트 대강도(The Great British Brexit Robbery) 배후의 은밀한 글로벌 공작’에 참여했다고 비난하고 최근 ‘페이스북 파일들’이라며 그들에게 불리한 문건을 대량으로 공개했다. 최근 선거에서 페이스북의 도구들이 어떻게 사용됐는지를 극히 비판적으로 다룬 책도 최근 2종 출판됐다. 대니얼 크라이스의 ‘신기술 집약적 선거 운동과 민주주의의 데이터(Prototype Politics: Technology-Intensive Campaigning and the Data of Democracy)’와 아이턴 허시의 ‘선거 캠프는 유권자를 어떻게 인식하나(Hacking the Electorate: How Campaigns Perceive Voters)’다.

최초의 진정한 소셜 미디어 대통령인 트럼프가 맏사위 재러드 쿠슈너를 비공식 선거운동 보좌관으로 임명했을 때 쿠슈너는 실리콘밸리를 찾아가 페이스북의 광고 도구에 관한 집중강좌를 들은 뒤 선거 캠페의 페이스북 전략을 수립했다. 그 뒤 그를 비롯한 디지털 팀은 2억2000만 유권자의 쇼핑·신용·운전·사고 습관에 관한 트럼프 캠프 데이터베이스 구축작업을 지휘 감독했다. 이제 백악관에 한 자리를 차지한 그는 정부의 기술혁신국을 맡아 정부 발표에 따르면 ‘기술과 데이터’에 초점을 맞추게 된다. 쿠슈너는 그것을 이용해 정부를 기업체처럼 운영하고 미국인을 ‘고객처럼’ 대하도록 이끌 계획이라고 말했다.

고객이라는 단어가 저급하긴 해도 키포인트다. 백악관과 공화·민주 양 진영의 정치 전략가들은 마케터들이 제품 홍보에 사용하는 도구들을 똑같이 사용할 수 있다. 2020년에는 행동과학, 첨단 알고리즘 그리고 AI가 어느 때보다 많은 개인 데이터에 적용되면서 정치인들도 어느 때보다 더 섬세하고 정확한 공약을 내걸 수 있게 될 것이다.

독일 IT 컨설턴트 보른셰인은 사회와 입법가들이 규제를 요구하지 않는 한 인간 행동의 정확한 예측을 위해 더 많은 데이터를 활용하는 기술은 계속 진화할 것이라고 말했다. “우리는 유권자에게 영향을 미치기 위해 정말로 우리가 가진 모든 역량을 동원하기 원하는가? 아니면 어느 시점엔가는 그 모든 데이터 마법을 투명하게 공개하도록 규칙을 정할 것인가? 이것이 유토피아 또는 반유토피아의 미래로 발전할지는 이제부터 데이터·민주주의 테마의 논의에서 우리가 검토해야 할 문제다.

제프리 제이 루스트는 CA의 사이코그래픽스에 따르면 ‘정서적 안정성이 대단히 높고, 개방성이 꽤 낮고, 다소 성실한’ 트럼프 지지자였다. 그리고 실제로 총기 소유권리를 대단히 중시하는 남자다. 그는 지난 미국 대선 기간과 그 뒤까지 알렉산더 닉스 CA CEO가 연회장을 가득 메운 글로벌 엘리트의 관심을 끌기 위해 자신의 GPS 좌표와 정치적·감정적 성향을 스크린에 띄웠다는 사실을 모른 채 평소처럼 생활해 왔다.

닉스는 지난해 9월의 행사에서 루스트의 풀네임과 좌표를 표시했다(유튜브 동영상에선 가려졌다). 나는 지난 5월 스위스 프라이버시 운동가 데하예의 도움을 받고, 그의 몇몇 페이스북 친구를 통해 루스트를 찾아냈다. 이메일로 닉스 강연의 유튜브 동영상을 링크해 그에게 보냈다. 해군 퇴역군인으로 할아버지가 된 그는 단지 손자들 사진을 보려고 페이스북에 가입했다며 닉스 CEO가 자신에 관해 그렇게 많은 정보를 알고 있는 데 충격을 받았다고 말했다. 미국 남부에 거주하는 그는 “그들은 내 집의 경도와 위도를 알고 있었다”며 “그것이 좀 신경에 거슬린다”고 말했다. “세상에 온갖 미치광이가 다 있는데 나에 관한 정보가 온 세상에 공개됐다. GPS에 띄워 보니 실제로 우리 집 옆을 지나가는 작은 개울까지 표시됐다. 그 데이터만 있으면 우리 집 앞까지 찾아올 수 있다.”

전력회사 시설 담당자로 일하는 루스트는 내 전화를 받을 때까지 사이코그래픽 정치 마이크로타게팅에 관해 들어보지 못했다. 그는 “어떻게 받아들여야 할지 잘 모르겠다”고 말했다. “그 정보를 광고에 사용해 필요하지 않거나 원치 않는 물건을 구입하도록 설득할 수 있다. 또는 나를 타깃으로 삼는 데 사용할 수도 있다. 나는 보수 성향이지만 사물에 대해 대단히 외교적인 관점을 갖고 있다. 그리고 분명 다른 이미지로 비치기를 원치 않는다. 누구에게나 자신의 의견을 말할 권리가 있다.” 그는 이미 설문에 답하거나 익명의 메일에는 응하지 않으려 조심한다며 이렇게 덧붙였다. “지금보다 좀 더 조심해야 할지 모르겠다. 그들이 나에 관한 그런 데이터를 공개하는 건 정말 마음이 편치 않다.”

너무 늦었다. 거의 다른 모든 사람들과 마찬가지로 루스트가 흘려 놓은 수많은 데이터 부스러기를 기계가 집어삼키고 전략가들이 분석할 수 있었다. 그가 숨을 곳은 이제 없다. 당신도 마찬가지다.

– 니나 벌리 뉴스위크 기자