인텔(Intel)이 인공지능(AI) 기계 학습 훈련에서 엔비디아(Nvidia) GPU와 경쟁할 3가지 AI 프로세서를 선보였다.

12일(현지시각) 미국 샌프란시스코에서 열린  2019 AI Summit에서 공개된 이 칩은 인텔이 2016년 인수한 기계 학습(machine learning) 업체 두 곳, 너바나 시스템스(Nervana Systems)와 모비디우스(Movidius)에서 개발됐다. 인텔 주력 제품인 제온(Xeon)과 코어(Core) 칩 제품군을 넘어서는 전 AI칩에 대한 인텔 첫 발표다.

인텔 부사장으로 인공지능 제품 그룹 총책임자인 너바나 창업자 메이븐 라오(Naven Rao)에 따르면, 기계 학습 연산 하드웨어와 소프트웨어의 핵심은 AI 프로세서다.

이스라엘의 하바나랩(habana labs), 미국 실리콘벨리의 삼바노바(sambanova), 영국 런던의 그래프코어(Graphcore), 블레이즈(Blaize Inc) 등 새 AI칩 스타트업이 두각을 보이고 있다.

GPU를 겨냥한 제품은 너바나 ‘NNP-T1000’ 신경망 프로세서다. 샘플 데이터로 AI 모델을 훈련하는 하드웨어 집약적인 작업에 최적화된 집적 회로다. 모델이 정확한 결과를 낼 수 있도록 하기 위해 필요한 이 과정은 오늘날 대부분의 AI 프로젝트에서 엔비디아 칩으로 수행된다.

Nervana NNP-T1000. credit: intel.

인텔은 8월 NNP-T1000이 초당 119조 대의 작업을 수행할 수 있다고 밝혔다. 프로세서는 기업들이 서버에 연결할 수 있는 가속기 카드에 탑재할 예정이다. 다수의 카드가 비교적 쉽게 서로 연결될 수 있도록 설계돼 슈퍼컴퓨터 규모의 AI 훈련 워크로드도 지원할 수 있다.

성공을 거둔 NNP-T1000는 대만 반도체 제조업체 TSMC에서 위탁 생산했다. NNP-T1000을 구성하는 270억 개의 트랜지스터는 16나노미터 제조 공정을 이용해 제작, 24개의 가공 코어로 구성됐다.

확장 가능한 추론

인텔 너바나 NNP-I 추론 카드(m.2 card). Credit: Intel.

AI 칩 라인에 두 번째로 추가된 것은 추론에 최적화된 너바나 NNP-I1000 칩이다.

NNP-I1000은 인텔의 최신 10나노미터 칩 아키텍처를 기반으로 한다. 이 회사는 기본적으로 10나노미터 중앙처리장치(CPU)를 2개의 코어로 AI 소프트웨어에 특화한 12개의 ‘추론 엔진’에 추가했다. 인텔은 초당 3,600회 추론을 수행할 수 있다고 말한다.

인텔은 프로세서 성능평가 AI 모델 ‘ResNet50’ 벤치마크 결과 와트당 4조8000억 회 가동률을 기록, NNP-I1000이 전력 효율이 가장 높다고 주장했다.

인텔에 따르면 페이스북과 바이두 등에서 너바나 칩에 관심을 보이고 있다. 페이스북 AI 담당 디렉터 미샤 스믈리안스키(Misha Smelyanskiy)는 이 칩이 하루 60억 통역을 처리하는 SNS AI 작업 가속화에 열쇠라고 말했다.

한편, 암호명 키엠베이(Keem Bay)라는 인텔 모비디우스 미리어드(Movidius Myriad) 비전 처리 장치(VPU) 새 버전도 공개했다. 이 칩은 기계학습에 의존하는 드론 처럼 저전력 기기 안에서 AI 이미지와 영상처리 시스템에 전력을 공급해 장애물 사이를 조종할 수 있도록 설계됐다.

인텔은 최신 모비디우스 VPU가 이전 세대의 칩보다 10배 이상의 추론 성능을 제공한다고 말했다. 동시에, 그것은 엔비디아 TX2칩 등 경쟁제품보다 최대 6배 더 전력 효율적이다.

라오는 “AI에서 놀라운 발전을 계속하려면 인텔 네르바나 NNP나 모비디우스 미리아드 VPU와 같은 목적에 맞게 구축된 하드웨어가 필요하다”고 말했다.

그는 칩과 함께 관련 소프트웨어의 중요성도 강조했다. 병렬 컴퓨팅과 신경 망을 위한 SW 플랫폼이자 응용프로그램 프로그래밍 인터페이스로 엔비디아 ‘CUDA’는 AI 핵심이었다.

한편 인텔은 개발자들이 인텔 하드웨어에 대한 알고리즘을 구입하기 전에 테스트할 수 있도록 하는 에지(Edge)를 위한 데브 클라우드(Dev Cloud)를 발표했다.