인공지능으로 ‘극단적 선택’ 막을 수 있다

2017년 4월 17일 2017.04.17 [1269]

인구통계적 특성, 복용약, 과거의 진단 이력, 체질량지수(BMI) 등의 데이터를 기계학습 알고리즘으로 분석해

01

매년 4만 명이 넘는 미국인이 자살한다. 1999년과 2014년 사이 미국의 자살률은 24%나 늘었다. 우리는 사람들이 자살을 기도하는 이유에 관해 수 세대에 걸쳐 이론을 세우고 데이터를 분석했다. 따라서 이제는 자살을 어떻게 예방할지, 아니면 적어도 어떻게 예측할 수 있을지 상당히 잘 안다고 생각할지 모른다.

그러나 새 연구는 자살 예측의 과학이 너무도 형편없는 수준이라는 사실을 명확히 보여준다. 널리 잘 알려진 경고의 징후도 실제 예측에선 정확성이 너무 떨어져 사람들이 운세를 점치는 것과 다를 바 없어 보인다. 그러나 희망이 전혀 없지는 않다. 기계학습 알고리즘이 자살 예측 능력을 크게 개선할 수 있다.

미국 심리학회보 2월 호에 실린 논문은 지난 50년 동안 발표된 자살 원인 관련 논문 365편을 분석한 결과를 담았다. 유전자, 정신질환, 학대 등의 자살 위험인자를 측정한 3428건의 데이터가 거기에 포함됐다. 그 데이터를 종합하는 메타 분석을 통해 연구팀은 자살(상상, 기도, 실행)을 예측하는 면에서 개별적인 위험인자는 임상적인 의미가 없다는 점을 확인했다.

뜻밖이라는 생각이 들 수 있다. 물론 우울증을 앓는 사람은 다른 사람보다 자살할 확률이 높다. 그건 분명한 사실이다. 하지만 두 가지 명심해야 할 사항이 있다. 첫째, 분석된 이전의 연구는 대부분 평균 약 10년에 걸친 예측 연구다. 따라서 지금 우울증을 앓는다는 것이 다음 10년 동안 자살할 확률이 더 높다는 의미인지가 문제다.

둘째, 임상적 의미는 통계적 의미와 다르다. 상관관계가 수학적으로는 믿을 만하지만 실질적인 조치를 취하기엔 너무 미약하다는 뜻이다. 매년 자살하는 미국인은 10만 명 중 13명 꼴이다. 자살을 기도하는 사람이 나중에 실제 자살로 삶을 마감할 가능성은 그렇지 않은 사람의 2배나 된다. 그래도 확률은 10만 명 중 23명에 불과하다. 따라서 이전의 자살 기도에 근거해 올해 자살로 사망할 것이라고 예측한다면 틀릴 확률이 99.9% 이상이다.

이번 논문의 주 저자인 플로리다주립대학 심리학자 조셉 프랭클린 교수는 “누군가가 이전에 자살을 기도했다는 사실을 안다고 해서 그가 실제 자살로 생을 마칠지 여부를 예측하는 데는 별 도움이 되진 않는다”며 “복권을 한꺼번에 두 장 산다고 당첨 확률이 크게 높아지지 않는 것과 마찬가지”라고 말했다. 확률은 약간 높아지겠지만 그렇다고 비용이 많이 드는 조치를 취할 정도는 아니라는 뜻이다.

평균적인 미국인의 자살 리스크가 지금의 0.013%에서 10%로 높아지려면 뭔가가 그들의 리스크를 750배 늘려야 한다. 그러나 메타 분석에선 자살 확률을 3.6% 이상 높인 단일 위험인자가 없었다. 가장 강한 위험인자라고 해도 자살 기도 확률은 4.2%, 자살 상상 확률은 3.6% 높였다. 더구나 미미한 연구 결과는 아예 논문으로 발표되지 않아 메타 분석에 포함되지 않았을 가능성이 크다는 점을 감안하면 그 정도조차 과대평가일 수 있다. 확실히 해두자면 자살에서 위험인자가 반드시 원인은 아니다. 예를 들어 수면 문제가 실제 자살 행위에 직접 영향을 미칠 수도 있지만, 그보다 더 심각한 다른 문제를 시사함으로써 단지 자살 행위를 예측하는 데 그칠 수도 있다.

정신과 의사는 자살 상상과 실제 자살 행위를 단기적(예를 들어 일주일 정도)으로 예측하는 데 몰입하는 경향이 있다. 그러나 아직 그처럼 단기적인 예측 문제를 다룬 연구는 없다. 그 문제를 연구하려면 자살 리스크가 아주 큰 사람의 대규모 표본이 필요하다. 그래서 실직 같은 잠재적 위험인자를 측정한 뒤 그중 다수가 일주일 안에 자살을 기도했는지 파악할 수 있어야 한다. 그래야 자살을 기도한 사람이 그렇지 않은 사람보다 그 주에 실직했을 가능성이 크다는 것을 알 수 있다.

02
자살 가능성을 예측하는 것은 운세를 점치는 것처럼 정확하지 못한 경우가 많다.

그런 연구에서 문제는 특정 일주일 안에 자살을 기도하는 사람이 극소수라는 점이다. 이번 논문의 공동 저자인 플로리다주립대학 심리학자 제시카 리베이로 교수는 “우리를 포함해 현장의 연구자 다수는 메타 분석을 하기 전에는 그런 연구가 아예 없다는 사실을 모른다”고 설명했다.

이번 메타 분석 논문의 저자들은 자살의 상상이나 실제 자살 행위를 예측할 수 있는 인자를 찾는 연구자들의 능력이 지난 50년 동안 전혀 나아지지 않았으며, 가장 주목 받는 인자 중 일부(기분 장애, 약물 남용, 인구통계적 특성)도 믿을 만한 자살 예측 수단이 아니라는 점도 발견했다.

단기적인 여러 인자들을 무시하고 우울증 같은 단일 인자를 한 번에 하나씩 연구한 것이 이 분야의 발전을 지연시켰다. 자살은 상호작용하는 변수가 아주 많은 복잡한 현상이다. 연구팀은 “절망 같은 단일 인자를 다른 것과 분리된 특성으로 측정한 것이 10년에 걸쳐 자살을 정확히 예측할 수 있다는 가설은 신빙성이 떨어진다”고 말했다. “하지만 총을 소유하고 자해 전력이 있으며 사회적 지지를 거의 받지 못하는 남성 고령자 중에서 배우자가 예상치 않게 사망한 뒤 급속히 절망하면서 몇 시간 또는 며칠 동안 자살 위험이 크게 높아질 것으로 예상하는 사람은 많다. 하지만 발표된 연구의 대부분은 후자보다는 전자의 가설에만 초점을 맞췄다.”

연구자들은 위험인자 수십 또는 수백 가지에서 유용한 패턴을 찾으려면 기계학습 알고리즘이 도움이 된다고 지적한다. 최근 학술지 임상심리학에 발표된 논문은 기계학습 알고리즘의 잠재력을 잘 보여준다.

미국 밴더빌트대학 메디컬 센터의 인턴이자 데이터 과학자인 콜린 월시는 플로리다주립대학의 프랭클린·리베이로 교수와 함께 익명으로 처리된 건강 기록 수백만 건 중에서 치명적이지 않은 자살 기도 3250건을 임의의 환자 집단과 비교했다. 그들은 예측 방법이 널리 사용될 수 있도록 인구통계적 특성, 복용약, 과거의 진단 이력, 체질량지수(BMI) 등 일상적인 임상 과정에서 기록되는 인자에만 초점을 맞췄다. 그 다음 그들은 컴퓨터를 사용해 출력한 데이터에서 일주일∼2년에 이르는 다양한 기간에 자살 기도를 예측할 수 있는 패턴을 찾았다.

알고리즘의 정확도는 0.5에서 1 사이로 측정할 수 있다. 0.5는 운에 맡기는 것과 다름없는 수준, 1은 정확한 예측을 의미한다. 예를 들어 메타 분석에서 추출한 단일 인자들은 정확도가 약 0.58이었다. 동전 던지기보다 별로 낫지 않다는 뜻이다. 그러나 컴퓨터 알고리즘의 정확도는 2년 안에 누군가가 자살을 기도할지를 예측할 때는 0.86, 일주일 뒤의 자살 기도를 예측할 때는 0.92로 나왔다.

03
연구자들은 알고리즘이 그보다 더 정확해질 수 있는 여지가 있다고 생각한다. 우선 지금의 알고리즘 모델에는 실직이나 이혼 같은 중대한 인생 사건, 기분이나 행동의 급작스런 변화 같은 것이 포함되지 않는다. 리베이로 교수는 단기 예측에서 이런 요인의 유용성을 평가할 수 있는 데이터를 수집한다. 그런 데이터는 자살을 누가 기도할지 만이 아니라 언제 기도할지도 예측하는 데 도움이 될 것이다(그녀는 충분한 표본을 얻기 위해 온라인 포럼을 이용한다). 또 연구자들은 소셜미디어에서 보이는 행동을 통합하는 알고리즘도 유용할 것으로 내다본다. 펜실베이니아대학에서 실시한 최근 연구에서 페이스북과 트위터 사용자의 71%가 의학 연구자들에게 자신의 온라인 피드 접근을 허용했다.

미국 군인자살연구컨소시엄의 공동대표 토머스 조이너는 기계학습에 큰 기대를 건다. 그는 플로리다주립대학의 프랭클린·리베이로 교수와 긴밀하게 협력한다. 그는 “선입견일지 모르지만 난 기계학습이 우리의 미래라고 확신한다”고 말했다.

사실 기술은 어렵지는 않다고 연구자들은 생각한다. 문제는 기술을 효과적으로 사용하는 것이다. 그들은 기계학습이 환자 치료에서 활용될 수 있는 방법을 모색하기 위해 밴더빌트대학 메디컬 센터의 의사, 행정 관리자, 환자와 계속 상의한다. 의학 데이터가 어떻게 공유돼야 할까? 의사의 개입이 필요한 기준은 무엇인가? 위기 상황이 확인되면 누구에게 알려야 할까? 의도치 않은 부작용은 없을까?

의사에게 직감 대신 컴퓨터를 믿으라고 설득하기란 쉬운 일이 아니다. 직무 수행, 학업 성적, 정신질환을 예측하는 문제에서 인간은 편견이 많아 단순한 통계적 모델이 직감보다 더 낫다는 사실을 보여주는 수십 년에 걸친 연구가 있지만 의사들은 여전히 직감을 더 믿는다. 임상의를 겸하는 리베이로 교수는 “임상적 예측은 아주 부정확하다”고 말했다. “우리도 그런 사실을 알지만 자신의 예측이 형편없다는 사실을 인정하기는 어렵다.” 데이터 과학자인 월시는 의사가 자신의 판단에서 컴퓨터의 권고를 반영하는 ‘하이브리드’식 접근법이 바람직하다고 생각한다. 조이너 대표는 거꾸로 의사의 판단이 컴퓨터의 예측에 반영되는 것이 이상적이라고 본다.

어느 경우든 궁극적으로 의료진은 환자에게 최선의 방식을 택할 것으로 연구자들은 기대한다. 프랭클린 교수는 “임상의가 매일 하는 일은 아주 어렵다”고 말했다. “그들은 용감하고 근면하다. 하지만 크게 보면 정신병리학, 좁게 보면 자살은 줄어들지 않을 것이다. 지금의 수준에서 내가 생각하는 이상적인 수준으로 옮겨가는 것은 결코 쉬운 일이 아니다.”

조이너 대표는 의사들의 그런 어려움도 자살 예측의 중요성도 절대 무시할 수 없다고 지적했다. “자살은 엄청난 비극을 몰고온다. 때론 몇 세대 동안 개인과 가족의 삶을 파괴한다. 메타 분석 결과가 주는 메시지와 자살률 증가가 주는 메시지는 ‘지금 상태로는 안 된다. 더 나은 방법을 찾아야 한다’는 것이다.”

– 매튜 헛슨 뉴스위크 기자