20년간 인공지능 및 빅데이터 기술 개발에 주력해온 솔트룩스가 17일 서울 논현동 르메르디앙 호텔에서  미래 인공지능 ‘에바(EVA)’ 시스템을 공개했다.

에바는 아담(ADAMS) 플랫폼 등 그동안의 개발 역량을 종합한 결과다. 솔트룩스는 이날 생활환경지능(Ambient AI), 블록체인 융합과 함께 AI 빅데이터 전문기업으로 기업공개(IPO), 가상화폐 공개(ICO) 계획도 제시했다.

에바는 한 사람 한 사람을 위한 고유한 인공지능 서비스다. 인간에게 친구가 그러하듯이 인공지능도 인간에게 고유한 존재여야 하며, 이를 위해 유일한 개성을 가져야 한다는 생각에서 고안했다.

AI 인지발달론 측면에서 접근한 에바는 인간과 협력해서 지식을 개발해나가는 인공지능으로 탄생부터 성장을 함께하는 친구가 될 수 있다. 인간-기계, 기계-기계간 상호 작용 속에서 인공지능 커뮤니티도 가능하다.

모바일 애플리케이션에서 사용자를 모사한 자율 캐릭터로 구동되는 에바의 영상과 음성에는 딥러닝 기반 전이학습이 적용됐다. 1시간 정도 사용하면 사용자의 목소리와 억양을 유사하게 재현하는 스타일 임베딩이 가능하다. 사진을 기반으로 만들어지는 캐릭터는 심층신경망(DNN)을 통해 입모양도 비슷하게 모사한다.

이경일 대표는 “에바 서비스 플랫폼은 영화 허(her) 속의 AI 사만다 처럼 인공지능이 인간 주인과 대화를 하면서 학습, 진화가 가능하다”고 말했다.

내년 클로즈드베타 서비스 공개 등 단계적으로 상용화를 준비 중인 EVA 서비스는 클라우드 기반으로 작동한다. 모바일 앱에서 구동이 가능하다.

에바는 지난 10개월 동안 책 60만권, 일일 문서 500만건을 수집·학습했다. 다양한 데이터 분석 알고리즘을 내장, 심층 질의응답과 이미지 인식도 가능하다. 관광·쇼핑, 가상 비서와 지능형 홈 로봇 등 다양한 분야에서 활용이 예상된다.

인공지능 인지발달론 적용 EVA, 인간-인공지능이 서로를 닮아가고 알아가는 과정 채택

EVA는 개개인의 생활 속에서 친숙해지는 방법으로 오리새끼가 엄마를 각인하듯, 첫 대면에서  각인 효과를 염두에 두고 개발했다.

첫 대면 이후 상호 길들여지는 과정은 놀이처럼 구성했다. 에바는 학습과 구성에 따라 스티브잡스 등 작고한 셀럽이나 스타의 개성을 재현할 수 있다. 친구, 셀럽, 전문가, 코치, 비즈니스 등 분야로 확장이 가능하다.

사람마다 관심분야가 다르듯이 사용자의 특성에 따라 에바의 지식도 달라진다. 자신의 에바에게 영화를 물어봤는데 에바가 영화전문가가 아니라면 영화정보를 잘 알고 있는 EVA를 팔로우해 친구관계를 맺고 정보를 찾아준다. 상호간 도움을 주고 받는 커뮤니티가 가능한 구조다.

개인이 훈련한 에바가 가지는 지적재산권은 지식 축적에 도움을 준 사람에게 간다. 컨텐츠를 생성, 생산한 사람들에게 그 댓가가 주어져야 한다는 생각을 반영했다. AI와 블록체인이 만나는 지점이다.

이 대표는 “인간을 닮은 AI는 윤리 문제와 함께 개인정보 보호와 활용 등 문제가 중요하다. 블록체인과 연동해 암호화되고 개인 자산화 돼야 한다고 생각한다”고 말했다.

블록체인은 코인 기반 경제활동에도 활용된다. 이 대표는 “지식을 교환, 질문과 응답을 통해 코인을 축적한다. 코인은 일상생활이나 관련 응용 프로그램 레시피 구매에 활용이 가능하다”고 설명했다.

미래 인공지능 EVA 시스템은 인공지능 플랫폼 아담(ADAM)을 포괄한 메타 서비스다. 아담은 일상 속 인공지능 비서 서비스는 물론 전문 분야인 금융 상담을 시작으로 법률, 특허 등 전문 서비스에도 도입되고 있다.

2년 전 심층질의 응답 시스템을 상용화한 아담(ADAM)은 지식베이스(Knowledge Base, KB), 식그래프(Knowledge Graph,KG)기반 서비스다.

지식 그래프는 검색어를 입력하면 그 단어와 연관성이 있는 정보를 같이 보여주기 때문에 사용자의 검색 의도에 가장 근접한 검색 결과를 제시해 주는 것이 특징이다.

앞서 AI 플랫폼 기반 스피커로 음성비서 서비스를 하고 있는 기존 업체들과의 차별성은 무엇일까.

솔트룩스는 지식그래프와 딥러닝을 통합한 기술로 서비스 정확도를 크게 제고했다고 말한다. 향후 전문 분야 서비스 등 응답의 정확도를 90%이상으로 높이는 게 목표다.

이 대표는 “아담은 아시아 최대규모 지식베이스를 내장하고 지식, 언어, 시각 인지 등 60여 API를 제공한다”며 “지식 학습과 복합 추론에 강점이 있으며 생활응답 정확도는 94% 정도”라고 말했다.

에바는 데이터 수집 엔진(Tonado)를 통해 딥러닝(Deep Learning)과 지식그래프를 융합한 기계독해 기술을 통해 딥웹(Deep Web) 등에서 매년 책 50만권 분량 문서를 학습 중이다. 에바는 책을 0.1~1초 이내에 학습하고 학습한 내용에 대해 인간과 대화가 가능하다.

‘캔트(KENT)’ 지식학습 기능은 60~80% 정확도를 갖는다. 에바 플랫폼에서 사람과 상호작용 등 크라우드 소싱을 통해 검증과정을 거쳐 정확도를 높인다는 구상이다.

확장성 위한 생태계 구축…AI X 블록체인

문제는 수익화다. 솔트룩스는 AI에 블록체인을 연계한 사업모델로 협력 체계를 구축하고 자체 생태계를 만든다는 구상이다.

AI 서비스는 경쟁력을 확보하기 위해 서비스의 확장성이 필수다. 검색 포탈이나 SNS 등을 가진 구글, 마이크로소프트, 페이스북, 애플 등 글로벌 기업과 삼성, SK텔레콤 등도 오픈소스로 AI 프로젝트를 진행하고 있다. 지식베이스 기반 솔트룩스 또한 생태계를 확대를 위해서 아담 AI 오픈 플랫폼, 지식베이스, 지식그래프 등 현재 50% 정도 개방하고 있다. 향후 개방을 확대할 계획도 있다.

에바 데이터 소스는 100% 자체 KB 기반이다. 교통정보, 영상 등은 오픈API, 협력사들과 협력을 통해 제공하고 있다.

솔트룩스는 검색영역이 겹치는 포탈 업체 보다는 통신 회사들과 협력을 추구한다.  2차년도 오픈베타 서비스는 시작부터 영어 서비스를 목표로 한다. 생태계 확보, 전문가 영입 등 전문성 확보해 3차년도에 본격적인 글로벌 비즈니스화 할 예정이다.

” AI 부문 매출 100억을 달성, 내년 상장(IPO)을 준비 중입니다. 2차년도 독립법인으로 영어서비스를 시작하는 과정에서 ICO도 진행할 예정입니다.”

이 대표는 가트너의 기술 하이프 사이클의 정점에 달한 것으로 평가되는 인공지능(AI) 시장은 어느정도 무르익었다고 판단했다.

내년을 목표로 하는 IPO단계 이후에 ICO도 계획중인 솔트룩스는 2~3년간의 기간 동안 기존업체와 호환성이 유지되는 것이 중요하다고 강조했다. ICO 코인 발행은 유력한 블록체인 진영 파트너와 함께 할 계획이다. 내부에서 블록체인 표준문제도 관심을 갖고 잇다.

생할활경지능…B2B, B2C공존 플랫폼 지향

솔트룩스는 엠비언트 AI(Ambient AI)*로 자율주행과 연계한 서비스도 제시했다.  AI와 VR을 결합, 에바가 탑재된 커넥티드카와 자율주행 서비스는 톡봇과 연동, 질의 응답이 가능하다. 위치 정보와 연계하면 주변 상점에 대한 정보도 얻을 수 있다.

에바는 국내외 소셜 로봇에도 탑재할 계획이다. 가정용 로봇, 가사, 요리법, 책 일기 등 활용이 가능하다. 이밖에 B2B 서비스인 EVA 비즈니스는 국내 각 기업 홈페이지에 무료로 탑재, 홈페이지 음성 안내 등이 가능하다.

향후 계획에 대해 솔트룩스 이 대표는 “내년 여름부터 클로즈드 베타 서비스 계획 중이다. 솔트룩스는 20년간 인공지능을 연구, 특허만 130여건을 보유했다. 기술을 통해 사람들의 마음을 터치할 수 있는 회사를 만들어가고 싶다”며 “상용화를 위한 에바 프로젝트는 2년이 넘었다. B2C 서비스는 내년 여름을 목표로 한다. 블록체인 융합, 엠비언트 AI는 더 많은 시간이 걸릴 것”이라고 밝혔다.

기술적 도전

지식베이스 접근의 구조적 문제점은 저장이 안된 지식을 추출할 수 없다는 점이다. 오픈 도메인으로 질문을 처리해야 하는데 응답 정확도가 문제다. 이를 개선하기 위한 노력을 진행 중이다.

곽수정 연구원은 오픈도메인 질문 처리에 대해 ” MRC(Machine Reading Comprehension, 기계독해이해)는 정답에 해당하는 문서를 찾아야 한다. 유사한 문서를 찾는 기술을 통해 MRC연구를 진행하고 있다”고 말했다.

한편, 서비스 상용화를 위한 지식그래프 구축에는 어느 정도의 노력이 필요한가에 대해 김태현 연구원은 “지난해 농협은행 금융 콜센터 지식베이스 구축에는 고객사 20명 정도와 함께 작업했다. 일반 서비스를 목표로하고 금융 전 분야에 걸쳐 지식베이스를 구축했다. 톡봇 분야에만 참여한 인원은 3명정도”라고 말했다.

검색 품질 보증에 대해 심홍매 연구원은 “지식 베이스는 오류가 있을 수 있다. 현재 지식베이스를 DNN에 등록, 오류를 통해 지식완성 기술을 도입하고 있다. 누락된 지식은 90%, 오류 지식은 70%이상 확인 및 검출을 할 수 있다”고 설명했다.

*Ambient AI(생활환경지능)는 네이버랩스유럽 등 세계 AI 연구소에서도 주도적인 연구를 진행해왔다.