구글(Google) 인공지능(AI) 자회사 딥마인드(DeepMind)가 자율주행 스타트업 웨이모(Waymo)와 협력한다.

구글 모회사 알파벳(Alphabet) 소유 웨이모(Waymo) 엔지니어는 자율주행 알고리즘을 훈련하는 효율적인 프로세스를 찾기 위해 AI 스타트업 딥마인드(DeepMind) 연구원들과 협력하고 있다.

그들은 비디오 게임 알고리즘을 개선하기 위해 딥마인드가 개발한 PBT (population-based training)라는 기술을 사용했다. 생물학적 진화에서 영감을 얻은 PBT는 알고리즘 모집단에서 최적표본 (주어진 작업을 가장 효율적으로 수행하는 표본)에서 후보 코드를 채택, 특정 작업에 대한 기계 학습 알고리즘 및 매개 변수 선택 속도를 높인다.

구글 첨단 AI 기술력 융합, AI알고리즘 강화는 웨이모가 자율주행분야 경쟁자들을 능가하는 데 도움이 될 수 있다.

자율주행 차량을 안내하는 알고리즘은 차량이 더 많은 데이터를 수집하고 새로운 위치에 배치 될 때 재훈련 및 재조정해야한다. 수십 개의 회사가 실제 도로에서 최고 자율주행 기술을 시연하기 위해 경쟁하고 있다. 웨이모는 기계 학습(machine-learning, ML) 알고리즘 개발을 자동화하고 가속화하는 다양한 방법을 모색하고 있다.

기계 학습 코드를 재 훈련하는 보다 효율적인 방법은 AI가 다른 상황에서 유연하고 유용 할 수 있어야한다.

웨이모 ML인프라 디렉터 메튜 데빈(Matthieu Devin)은 “산업 시스템에서 기계 학습을 하는 사람들의 핵심 과제 중 하나는 새로운 코드를 활용하기 위해 시스템을 재구성 할 수 있어야한다는 것”이라며 “우리는 끊임없이 웨이모 망을 재훈련하고 코드를 다시 작성해야한다. 그리고 재훈련 하면 매개 변수를 조정해야 할 수도 있다 “고 말했다.

25일(현지시각)MIT테크놀로지리뷰에 따르면 자율주행 차량은 거의 루베 골드버그(Rube Goldberg)알고리즘 및 관련 기술 조합으로 제어된다. 센서 데이터의 도로선, 표지판, 다른 차량 및 보행자를 탐지하기 위해 수많은 ML알고리즘이 사용된다. 이들은 차량을 제어하고 다른 우발적 상황에 대처하기 위해 재래식 또는 수작업으로 작성된 코드와 함께 작동한다.

자율주행시스템의 새로운 반복은 시뮬레이션을 통해 엄격하게 테스트되어야한다. 오늘날 자율주행 차량은 특히 심화 학습(deep learning, DL)에 크게 의존한다. 그러나 적절한 속성과 매개 변수(시작 부분에 하드 코딩 된 값)로 심층 신경망(deep neural network)을 구성하는 것은 까다로운 기술이다. 후보 네트워크 및 매개 변수는 수동으로 선택되며 대개 처리 시간이 많이 소요된다. 컴퓨터에 의한 무작위 조정은 많은 프로세싱 파워가 필요하다.

웨이모 ML인프라 엔지니어 유신 첸(Yu-hsin Chen)은 팀이 차선 표시, 차량 및 보행자를 감지하고 다른 ML 알고리즘에 제공되는 레이블이 지정된 데이터의 정확성을 확인하는 데 사용되는 DL코드 개발을 개선하기 위해 PBT를 사용 중이라고 밝혔다. 팀은 PBT가 신경망 재훈련에 필요한 컴퓨터 출력을 약 절반으로 줄였으며 개발주기의 속도를 2배 또는 3배로 개선했다.

구글은 ML모델 훈련 과정을 자동화하는 데 도움이 되는 다양한 기술을 개발하고 있다. 이미 클라우드 오토 ML(Cloud Auto-ML)이라는 프로젝트를 통해 고객에게 제공하고 있다. AI 훈련을 보다 효율적이고 자동화하는 것은 이 기술의 상업화에 결정적이다.

딥마인드 연구원이자 PBT 발명가 중 한 명인 오리올 빈냘스(Oriol Vinyals)는 웨이모 데빈과 만나 PBT 활용 아이디어를 제안했다. 비냘스와 동료들은 강화 학습(reinforcement learning)을 통해 특히 컴퓨터 게임 스타크래프트II(StarCraft II)를 플레이하도록 AI훈련을 가속화하는 방법으로 이 기술을 개발했다.

PBT에서 사용된 진화 유사 프로세스는 또한 DL알고리즘이 계통 트리(genealogical tree)와 비슷하게 조정되고 최적화 되는 방법을 더 쉽게 이해할 수 있게 한다. 매개 변수의 진화를 시각화, 어떤 일이 실제로 발생하는지 확인이 가능하다.