게리 마커스’Rebooting AI’, 아서 밀러 ‘The Artist in the Machine’ 신간주장

딥마인드, 인공신경망에 상징추론 AI 보완 ‘하이브리드 AI’ 개발

범용 인공지능(AGI) 구현은 인공신경망 심층학습(Deep Learning) 만으로는 불충분하며 클래식 AI 보완이 필요하다는 지적이 나온다.

업계에도 변화가 감지된다. 구글 딥마인드는 고전 기계학습 모델을 융합한 새로운 하이브리드 인공신경망 개발에 착수한 것으로 알려졌다.

심층학습 모델의 한계를 지적, 상징추론 등 고전적 AI(classical AI) 필요성을 주장해온 뉴욕대(NYU) 교수 게리 마커스(Gary Marcus)는 딥러닝이 오늘날 인공지능 발전에 중요한 역할을 했지만 지나친 강조는 경계했다.

인공지능 연구자이자 신경과학자인 마커스는 기술적 문제와 윤리적 문제를 모두 언급한다. 기술적 관점에서 딥러닝은 이미지나 음성 인식과 같은 인간 두뇌의 지각적 측면을 흉내내는 데 효과적이지만 대화나 인과관계 이해 등 다른 작업에는 부족하다는 지적이다.

그는 보다 유능하고 포괄적인 지능(general AI) 을 가진 기계를 만들려면 심층학습을 다른 방법과 결합해야한며 딥러닝 커뮤니티에 목소리를 내왔다(아래 관련기사).

AI 시스템이 자신의 작업이나 주변 세계를 진정으로 이해하지 못하면 위험한 결과를 초래할 수도 있다. 시스템 환경에서 예상치 못한 작은 변화조차도 시스템을 손상시킬 수 있다. 차별을 지속시키는 비즈니스 응용 시스템, 자율주행 자동차 사고로 운전자 또는 보행자 사망 등 사례가 이미 있다.

AGI에 대한 접근은 실제 세계에 영향을 미친다. 마커스와 그의 동료 어니스트 데이비스 (Ernest Davis)는 새 책 ‘ 리부팅 AI(Rebooting AI)’에서 AGI를 달성 할 수있는 다른 접근 방법이 있다고 말한다. 고전적 AI와 딥러닝 두 가지 접근 방식이 모두 필요하다는 것.

마커스는 인공신경망의 의사결정 규칙을 찾기 힘든 ‘블랙박스’ 문제를 지적하며 “클래식 AI는 실제로 당신이 추론할 수있는 세계 인지 모델을 구축하기위한 프레임 워크다. 클래식 AI는 규칙에 완벽하게 익숙하다”고 말한다.

그는 “기계학습은 데이터 학습에는 능숙하지만 컴퓨터 프로그램상 추상화를 나타내는 데는 매우 부족하다. 클래식 AI는 추상화에 능숙하지만 모두 수동으로 코딩해야하며 모든 것을 수동으로 입력하기에는 너무 많은 지식이 있다. 따라서 필요한 것은 이러한 접근법을 혼합한 일종의 합성모델”이라고 MIT리뷰에서 밝혔다.

심층학습 만으로는 부족하다는 한계와 새로운 접근법의 필요성 인식은 업계 변화에서도 찾아볼 수 있다. 런던 딥마인드(Deep Mind) 는 기계학습 딥러닝과 상징적 AI 추론을 융합한 하이브리드 인공신경망을 개발 중이다.

영국 UCL(University College London) 과학 역사 및 철학 명예 교수 아서 밀러(Arthur I. Miller)도 같은 주장을 한다.

그는 1일(현지시각) 미국 과학저널 사이언티픽아메리칸에 ‘창의성과 AI: 다음 단계(Creativity and AI: The Next Step)’를 주제 기고에서 AGI 실현을 위해 학습과 추론 모두 뛰어난 심볼릭 머신( Symbolic machines)과 인공신경망의 최상의 기능을 모두 갖춘 기계를 개발하는 것이 필요하다고 강조했다.

아서 밀러는 이달 새책 ‘기계 속의 예술가(The Artist in the Machine : The World of AI-Powered Creativity)’을 출간했다.

이하 아서 밀러 기고문.

1997년 IBM 딥블루(Deep Blue)는 체스 그랜드 마스터 개리 카스파로프(Garry Kasparov)를 물리쳤다. 딥블루는 시작 단계에서 중간 게임과 최종 게임 단계의 광범위한 플레이 북을 포함해 복잡한 소프트웨어로 사전 프로그래밍 됐다.

20년 후인 2017년 구글(Google)은 딥블루와 달리 독학에 기밪한 알파고 제로(AlphaGo Zero)를 출시했다. 공부할 샘플 게임없이 훨씬 더 어려운 바둑 게임의 기본 규칙만을 부여 받았으며, 모든 전략을 처음부터 수백만 번 플레이해 스스로 해결했다. 이로 인해 독자적인 방식으로 생각할 수있었다.이들은 현재 주변에있는 두 가지 주요 AI 유형이다.

딥블루 같은 상징적 기계(Symbolic machines)는 특정 문제를 해결하기 위해 일련의 논리적 단계를 거쳐 인간과 마찬가지로 추론하도록 프로그래밍 됐다. 예를 들어 기계가 가능성의 의사결정 트리를 통해 데이터에서 환자의 질병을 추론하는 의료 진단 시스템이 있다.

알파고 같은 인공신경망(Artificial neural networks)은 인간 두뇌의 뉴런 배열에서 느슨하게 영감을 얻었으며 훨씬 적은 인간 입력이 요구된다. 그들의 장점은 학습, 체스 또는 바둑과 같은 대량의 입력 데이터 또는 규칙을 분석해 작업을 수행하는 것이다. 그들은 데이터의 얼굴과 패턴을 인식하고 자율주행 자동차 개발에서 큰 성공을 거두었다. 가장 큰 문제는 과학자들이 왜 그것이 작동을 하는지 아직 모른다는 것이다.

두 시스템이 만들어내는 예술, 문학 및 음악은 실제로 이들의 차이를 보여준다. 상징적 기계는 엄청난 양의 데이터를 공급하고 프로그래밍을 통해 흥미로운 작업을 할 수 있다. 인공신경망은 훨씬 더 흥미롭다. 인공신경망은 비지도 학습을 통해 자가 학습, 더 창의적이라고 할 수 있다.

상징적 인공지능(AI)은 인간의 눈으로 인식 할 수 있는 예술을 예술로 만들어 내지만 사전 프로그래밍 된 예술이다. 놀라운 것은 없다. 헤롤드 코엔(Harold Cohen)의 ‘AARON’ 알고리즘(1973년 ~)은 프로그래밍 된 템플릿을 사용해 그림을 만든다. 코엔과 마찬가지로 런던대(University of London) 골드 스미스 칼리지의 시몬 콜튼(Simon Colton)은 ‘The Painting Fool’을 프로그램 해 특정 스타일을 만든다. 그러나 이것들 중 어느 것도 그것의 프로그램을 뛰어 넘지 않는다.

인공 신경망은 훨씬 더 실험적이고 예측할 수 없다. 작업은 사람의 개입 없이 기계 자체에서 시작된다. 알렉산더 모디빈세프(Alexander Mordvintsev)는 딥드림(Deep Dream)과 합성곱신경망(Convolutional Neural Networks, CNN)에서 악몽같은 이미지를 만들어냈다. 자체 생산한 이미지를 판단하는 기계가 판단하는 이안 굿펠로우(Ian Goodfellow)의 GAN(Generative Adversarial Network), 이전에는 볼 수 없었던 예술 스타일을 만들어내는 아메드 엘가멜(Ahmed Elgammal)의 CAN(Creative Adversarial Network)이 있다. 이 들은 기계의 예술적 아이디어를 훨씬 더 도전적이고 어려운 작품으로 만들어낸다. 도구라기보다 기계는 창조에 참여한다.

인공 지능으로 만든 음악도 있다. 잘 검토된 앨범을 포함해 화려한 독창적 멜로디를 생성하는 소프트웨어가 탑재된 프랑소와 페쳇(François Pachet)의 플로우 머신(Flow Machines) 등이 있다.

인공 지능으로 작성된 문헌은 두 가지 유형의 기계로 만들 수 있는 것의 모든 차이점을 가장 잘 보여준다. 상징적 AI에는 소프트웨어와 관련 규칙이 탑재돼 있으며 로이터(Reuters) 뉴스 및 날씨 보도와 같은 특정 종류의 자료를 생성하도록 훈련됐다. 말장난과 농담 데이터베이스가 장착 된 상징적 AI는 예를 들어 기계로 생성된 조크와 농담을 만들어낸다. 예술과 마찬가지로 그들의 문학적 산출물은 우리가 기대하는 것과 일치한다.

인공 신경망에는 그러한 제한이 없다. 그러한 제약이 없기 때문에 인공 신경망은 모호한 것처럼 보이는 작업을 하는 경향성, ‘실험적’ 단계라고 할 수 있다.

이런 종류의 기계는 우리가 언어에 대해 현재 이해하는 것 이상을 보여줄 수도 있다. 컴퓨터로 시를 창작하는 뉴욕대(NYU) 앨리슨 패리쉬 (Allison Parrish)는 센스와 넌센스의 경계를 탐구한다. 따라서 인공 신경망은 인간의 독창성을 촉발시킬 수 있다. 그들은 우리에게 새로운 아이디어를 소개하고 우리의 창의력을 향상시킬 수 있다. 상징적 기계의 지지자들은 인간의 두뇌에도 소프트웨어가 탑재되어 있다고 주장한다.

상징적 기계의 지지자들은 인간의 두뇌에도 우리가 태어나는 순간부터 축적 된 소프트웨어가 탑재되어 있다고 주장한다. 이는 상징적 기계가 또한 뇌의 구조를 모방한다고 주장 할 수 있음을 의미한다. 그러나 상징적 인 기계는 처음부터 추론하도록 프로그래밍 돼 있다.

반대로 인공 신경망의 지지자들은 아이들처럼 기계가 추론하기 전에 먼저 배워야한다고 주장한다. 인공신경망은 학습한 데이터를 통해 학습하지만 자신이 보유한 데이터로만 작업 할 수 있다는 점에서 융통성이 없다.

간단히 말해서 인공 신경망은 학습하고 상징적 기계는 추론하기 위해 구축됐지만 적절한 소프트웨어를 사용하면 학습과 추론 동시 수행이 가능하다. 예를 들어, 자율주행 자동차 인공신경망은 가능한 모든 우발 상황에 대한 데이터를 프로그래밍 해야 한다. 그러면 전방의 밝은 빛을 볼 때 치명적인 사고를 피하기 위해 밝은 하늘인지 흰색 차량인지를 인식 할 수 있다.

상징적 기계와 인공신경망의 최상의 기능을 모두 갖춘 기계를 개발하는 것이 필요하다. 일부 컴퓨터 과학자들은 현재 그 방향으로 나아가고 있으며 신경망보다 더 광범위하고 유연한 지능을 상징적 AI의 주요 기능과 결합하는 옵션을 찾고 있다.

런던 딥마인드(Deep Mind)는 원시 입력 데이터에서 관계를 형성하고 이를 상징적 AI에서와 같이 의사결정 트리로 논리적 형태로 표현하는 방법을 배울 수 있는 새로운 종류의 인공신경망을 개발하고 있다. 다시 말해, 그들은 유연한 추론을 구축하려 한다.

기존 상징적 기계에서는 이 모든 것이 수동으로 프로그래밍 한 반면, 하이브리드 인공 신경망은 스스로 그것을 수행한다. 이러한 방식으로 두 시스템을 결합하면보다 지능적인 솔루션으로 이어질 수 있으며 실험, 도전, 예측 불가능하고 재미있으면서도 사람들이 보다 쉽게 이용할 수 있는 예술, 문학 및 음악 형식이 될 수 있다.

*기고문 원문