중국 과학자들이 자체 개발한 인공지능(AI) 칩과 자율주행자전거를 공개했다.

AI칩으로 작동하는 자율주행 자전거는 스스로 균형을 잡을 뿐만 아니라 장애물을 회피하고 단순한 음성 명령에도 반응한다.

자율주행 자전거에는 중국 칭화대(Tsinghua University)의 루핑시(Luping Shi) 교수와 연구진들이 개발한 뉴로모픽 칩(neuromorphic chip) 텐직(Tianjic)이 적용됐다.

범용 인공지능(artificial general intelligence, AGI)을 목표로 개발한 텐직칩은 기존의 컴퓨터공학 기반 폰 노이만 디자인과 신경과학 기반 두뇌에서 영감을 얻은 뉴로모픽 아키텍처 두 접근 방식을 하나로 결합한 하이브리드 디자인을 특징으로 한다.

텐직을 통해 중국 과학자들은 AI 알고리즘 실행에 최적화한 새로운 칩 디자인 설계를 제시했다. 이 칩은 중국의 자체 칩 개발과 설계 능력을 암시한다. 중국은 미국과의 무역 전쟁에서 불리하게 작용한 기술력 약점인 자체 반도체 산업 육성에 노력해왔다.

31일 네이처에 발표한 논문에서 칭화대 연구팀은 컴퓨터과학과 신경과학 하이브리드 아키텍처가 AI 미래에 결정적인 역할을 할 수 있으며 AGI 개발을 이끌수 있다고 제안했다.

논문에 따르면 AGI 개발에는 컴퓨터과학 지향(computer-science-oriented)과 신경과학 지향(neuroscience-oriented) 두 가지 일반적인 접근 방식이 있다. 코딩 체계의 근본적인 차이로 이 두 가지 접근법은 구별되고 호환되지 않는 플랫폼에 의존, AGI 개발을 지연시킨다는 문제 인식에서 신경과학에서 영감을 얻은 모델 및 알고리즘과 컴퓨터 과학 기반 인공신경망을 지원할 수 있는 일반적인 플랫폼을 개발했다.

범용 인공지능(AGI) 구현을 위한뉴로모픽 칩 모식도. credit:nature.
텐직(Tianjic)은 신경과학과 컴퓨터과학기반 최신 신경망모델 대부분을 동시에 지원할 수있는 전문 플랫폼이라고 소개됐다. credit:nature.

두 가지 접근 방식을 통합, 시너지를 위한 하이브리드 플랫폼인 텐직(Tianjic) 칩은 다중 코어 아키텍처, 재구성 가능한 빌딩 블록 및 하이브리드 코딩 방식으로 간소화 된 데이터 흐름을 채택하고 컴퓨터 과학 기반 기계학습(machine-learning) 알고리즘을 활용한 코딩 체계를 쉽게 구현한다.

뉴로모픽 칩은 복잡한 작업을 보다 효율적으로 학습하고 실행할 수 있다.

영국 구글 자회사 딥마인드의 스타트래프트2 AI 게임 알고리즘에 이어,미국 샌프란시스코 인공지능연구소 오픈AI(OpenAI)는 최근 ‘Dota 2’라는 게임 AI시스템을 구축했다. 이들 AI시스템은 수개월 만에 수백만 달러의 컴퓨팅 파워를 소모했다.

이에 하드웨어 AI칩 개발사들은 사람 두뇌와 비슷한 방식으로 저전력 고효율 시스템을 구축하는 것을 목표로 한다.

텐직칩은 수십만 개의 인공 뉴런을 포함, 입력 신호가 임계값에 도달 할 때만 발화하는 전기 신호 파열을 전송한다. 수요가 있을 때만 발화하기 때문에 텐직은 전통적인 프로세서보다 에너지를 적게 소비한다. 연구원들은 보다 적은 데이터를 처리 빠르게 학습하는 시스템이 가능하다고 말한다.

연구팀은 디지털 디자인을 채택했다. 축삭(axon) 모듈은 입력과 출력을 저장하는 데이터 버퍼 역할을 한다. 시넵스(Synapses)는 온 – 칩 가중치를 저장하도록 설계됐다. 더 나은 메모리 지역을 위해 수상 돌기 근처에 고정됐다. 수상돌기(dendrite)는 승수와 누산기를 포함하는 통합 엔진이다. 세포체(soma)는 연결 변환을위한 계산 단위다. IntraCore와 Inter-Focal 통신은 임의 토폴로지를 지원하는 라우터에 의해 연결된다. credit:nature.

단일 칩을 사용해 무인 자전거 시스템에서 다양한 알고리즘과 모델을 동시에 처리함으로써 실시간 물체 탐지, 추적, 음성 제어, 장애물 회피 및 균형 제어를 실현한다.

연구팀은 좀 더 일반화 된 하드웨어 플랫폼을 통한 AGI 개발을 촉진 할 것으로 기대한다. AGI에 대한 신경과학 지향 접근법은 메모리와 컴퓨팅 간의 긴밀한 상호 작용, 풍부한 시공간적 역동성의 관측에 기반하는 대뇌 피질을 모방하려고 시도했다.

발화 기반 코딩 및 다양한 학습규칙들은 일반적으로 발화 신경 네트워크(spiking neural network, SNN)로 표현된다. 컴퓨터 과학 지향 접근법 중 공간적 복잡성으로 피질에서 영감을 받은 우세한 비-스파이킹 인공신경망( non-spiking artificial neural networks, ANNs) 은 이미지 분류(image classification), 음성 인식(speech recognition), 언어처리(language processing), 게임 플레잉 등 특정한 임무를 처리하는데 기여했다. 두 가지 방법 모두 데이터가 많은 전문 분야의 하위 문제를 해결할 수 있지만 시스템과 관련된 불확실하거나 불완전한 정보로 인해 복잡한 동적 문제를 해결하는 것은 여전히 어려운 상황이다.

연구팀은 AGI를 달성하는 데 필요한 인텔리전스 능력치를 더 향상 시키기 위해 더 많은 생물학적으로 영감을 얻은 모델 또는 알고리즘을 우세한 ANN에 통합하는 경향이 증가, 두 가지 접근 방식사이에 보다 분명한 대화가 가능하다고 지적했다.

논문에 따르면 기계 학습 및 신경과학의 현재 발전 상황을 감안할 때 AGI시스템은 적어도 다음과 같은 기능을 갖추고 있어야한다. 첫째, 풍부한 공간적, 시간적 및 시공간적 관계를 나타낼 수있는 광대하고 복잡한 신경 네트워크 지원이다. 둘째, 전문화된 네트워크 구조에 국한되지는 않는 계층적, 다각적 및 다중 도메인 네트워크 토폴로지 지원이다. 셋째, 광범위한 모델, 알고리즘 및 코딩 체계 지원과 넷째, 병렬 처리에서 서로 다른 작업을 위해 설계된 여러 개의 병렬 신경망의 상호 얽힌 협력(intertwined cooperation)도 필요하다.

이를 위해서는 통용되는 ANN과 신경 과학 모델 및 알고리즘을 구현할 수 있는 통일된 아키텍처 기반 플랫폼이 필요하다. 이러한 기능을 지원하기 위해 연구팀은 컴퓨터과학 과학 지향과 신경과학 지향 신경 네트워크를 수용 할 수 있는 교차 패러다임 컴퓨팅 칩을 개발했다.

벡터 / 행렬 연산과 변환은 축삭(axon), 시냅스(synapse), 축삭돌기(dendrite), 세포체(soma) 및 라우터(router)를 포함한 여러 구획에 할당된다. 각 구획은 표시된 기능을 지원한다. 이들을 조합함으로써 다양한 신경 과학 중심의 컴퓨터 과학 지향 모델을 실현할 수 있다. credit:nature.

다양한 신경 모델 및 알고리즘과 호환되는 일반적인 플랫폼을 설계하는 것은 근본적인 과제다. 일반적으로 ANN과 SNN은 정보 표현, 계산 및 기억 조직화 측면에서 서로 다른 모델링 패러다임을 가지고 있다. 가장 큰 차이점은 ANN이 정확한 다중 비트 값으로 정보를 처리하는 반면 SNN은 바이너리 스파이크 열(binary spike trains)을 사용한다는 것이다. 하나의 플랫폼에서 두 모델을 구현하려면 스파이크를 ANN 코드 번호 형식의 디지털 번호와 호환되도록 디지털 시퀀스 (1 또는 0)로 다시 표시해야 한다.

연구팀은 이밖에 신중히 고려해야할 부분을 추가로 설명했다. 첫째, SNN은 과거 막 전위(historical membrane-potential) 및 스파이크 패턴을 특정 기간 동안 암기해야하는 시공간 영역(spatiotemporal domains)에서 작동하며 ANN은 가중치 부여 된 활성화를 중간에 축적하고 매주기마다 정보를 새로 고친다. 둘째, SNN의 계산에는 막 전위 통합, 임계값 교차 및 스파이크 이벤트에 의해 유발되는 잠재적 리셋이 포함된다. 대조적으로, ANN은 주로 밀도가 높은 MAC(multiply-and-accumulate) 작업 및 활성화 변환과 관련된다. 셋째, SNNs의 스파이크 패턴 처리에는 멤브레인 전위, 점화 임계값 및 불응 기간을 저장하기 위한 비트 프로그래머블 메모리와 추가 고정밀 메모리가 필요하지만 ANN은 활성화 저장 및 변환에 바이트 메모리만 있으면 된다.

ANN 뉴런과 SNN 뉴런 사이의 구현 비교. credit:nature.

반면에, ANN과 SNN 뉴런 사이에는 몇 가지 유사점이 있어 모델 구현을 융합 할 여지가 있다. 두 도메인에서 다양한 신경 네트워크 모델을 컴파일해 상세한 비교를 통해 모델 데이터 흐름을 축삭(axon), 시냅스(synapse), 축삭돌기(dendrite), 세포체(soma) 및 라우터(router)와 관련된 빌딩블록에 일대일로 대응하는 과정을 통해 크로스 패러다임 뉴런 체계를 구축했다. 전반적으로 시냅스와 수상돌기는 독립적으로 재구성 될 수 있지만 시냅스와 수상 돌기는 공유하도록 설계됐다.

*네이처 논문

Towards artificial general intelligence with hybrid Tianjic chip architecture