얼굴표정-감정 관련성 과학적 근거없어
美 심리과학 협회, 2년간 1000여건 분석

동서양의 오래된 미신인 골상학, 관상처럼 시중에 판매중인 얼굴 인식 기반 사람의 감정 인식, 추론을 주장하는 AI알고리즘은 믿을 수 없는 것으로 나타났다.

얼굴 생김새로 타고난 성격부터 미래 범죄성, 성공여부까지 점치는 골상학, 관상의 연장선에서 감정인식 AI는 눈에 띄는 몇 가지 특징을 추출, 알고리즘에 따라 사람의 감정을 해석하고 판단할 수 있다고 주장한다.

MS, IBM 등 대기업부터 스타트업까지 개발에 뛰어들어 시제 판매중인 이 기술은 취업 인터뷰 소프트웨어부터 감시 시스템 자동화까지 마케팅, 자율주행, 보안 등 여러 분야에서 사용되고 있다.

오늘날 비과학으로 분류되는 골상학과 관상처럼 터무니없는 수준은 아니더라도 몇몇 특징으로 사람 감정을 추론한다는 것도 결과에 대한 믿음을 요구한다.

감정인식 AI알고리즘을 평가하기 위해 미국 심리 과학 협회 (Association for Psychological Science) 5명의 과학자가 증거를 면밀히 검토하도록 요청 받았다. 각 평가자는 감정 과학계 다른 이론 진영를 대표했다.

노스웨스턴대(Northeastern University) 심리학교수 리사 펠드만 베럿 (Lisa Feldman Barrett) 등이 참여한 관련 리뷰는 이들 AI알고리즘 분석이 과학적 타당성이 없다고 평가했다.

25일(현지시각) 미국 온라인매체 버지(verge) 인터뷰에서 베럿은 “회사들은 그들의 원하는 대로 말하지만 데이터는 분명하다. 인상을 찌푸리는 것은 확인할 수 있겠지만 그것이 화냄과 같은 것은 아니다”라고 말했다.

5명의 과학자들은 이 자료를 검토하는 데 2년이 걸렸다. 검토에는 1000여건이 넘는 다른 연구가 포함됐다. 그들의 발견에 따르면 감정이 엄청나게 다양한 방식으로 표현된다. 이는 단순한 안면 움직임의 집합에서 누군가가 어떻게 느끼는지를 확실하게 추론하기 어렵게 한다.

버렛은 “데이터는 사람들이 화를 낼 때 평균 30 % 미만이 인상을 쓴다는 것을 보여준다. 따라서 인상씀(scowls)은 분노의 표현이 아니다. 많은 표현중 하나에 불과하다. 70 %가 넘는 사람들은 화를 낼 때 인상을 쓰지 않는다. 더구다나 화 나지 않을때 종종 인상을 쏜다”고 설명했다.

이는 시각기반 AI로 사람들의 감정을 평가한다고 주장하는 기업이 소비자를 기만했다는 의미다. 버렛은 30%에 불과한 정확도로 법원이나 채용과정, 의료진단, 공항 등에서 이를 적용할 수 있을지 의문했다.

이 리뷰는 단순한 얼굴 분석보다 감정 맥락, 컨텍스트에 대한 정보가 훨씬 많다는 것을 제시한다. 다만 공통적 원형 표정과 표정을 통한 의사소통가능성 자체를 부정하지는 않았다.

이 리뷰는 감정 연구 분야에서 엄청나게 다양한 신념이 있음을 보여준다. 이는 특정 표현과 감정 사이 강한 상관관계를 주장한 1960 년대 심리학자 폴 에크만(Paul Ekman)의 연구에 대한 반박으로 연구 방법론적으로 결함이 있다고 평가했다.

사람들은 감정이 표정보다 더 복잡하다는 것을 직관적으로 이해하지만 감정인식 AI 업체들은 아니다. 미묘함은 감정 분석 도구를 판매하는 회사에서는 거의 인정되지 않는다. 예를 들어, 마이크로소프트 알고리즘 마케팅에서 AI소프트웨어는 ‘감정을 반영하는 보편적 얼굴 표정에 기반한 8개의 핵심 정서적 상태를 인식 할 수 있다’고 주장한다.

이같은 비판이 새로운 것은 아니다. 버렛과 연구자들은 우리의 감정 인식 모델이 너무 단순하다는 것을 수년간 경고해 왔다. 이에 대응, 관련 AI 판매업체들은 그들의 분석이 더 많은 신호에 근거를 둔다고 말한다. 문제는 신호가 어떤 것인지 모른다는 점이다.

기계 학습(machine learning) 메트릭스는 신뢰성보다 측정 가능성을 이유로 측정에 사용하는 것으로 보인다. 연결을 찾는 데 유용한 기술이지만 자칫 가짜 분석으로 이어질 수 있다. 200억 달러 규모의 감정 인식 시장에서 선두 기업 중 한곳인 어펙티바(Affectiva)는 운전자 음성과 감정인식 기술을 결합하는 추가적인 메트릭스를 도입, 테스트 중 이다.

어펙티바 CEO겸 공동 설립자 라나 칼리우비(Rana el Kaliouby)는 이 리뷰가 회사 조사와 많은 부분이 일치했다고 말했다. 그는 “논문 저자들과 마찬가지로, 우리는 6가지 기본 감정과 정서적 상태에 대한 표정의 일대일 매핑에 고정된 업계의 순진함을 좋아하지 않는다. 감정과 표현의 관계는 매우 미묘하고 복잡하다”고 말했다.

버렛에 따르면 정교한 측정 항목을 사용해 앞으로 더 정확하게 감정을 측정 하는 것이 가능하지만 감정 표현은 다양하고 복잡하며 상황에 따라 다르다. 찰스 다윈 (Charles Darwin) ‘종의 기원’ 연구에서 종의 생물학적 분류가 가변적이었듯이 정서적 범주도 그러하다는 지적이다.