인공지능(AI) 기계학습(ML) 주도적 아키텍처 개발에 국내외 70여곳 이상의 AI칩 업체들이 주력하고 있다.

모바일 스마트 기기와 사물인터넷(IoT), 에지(edge) AI/ML 칩은 FPGA, SoC모듈, ASIC(Application Specific Integrated Circuit) 등 이다. 온디바이스(On-Device) AI칩은 제품 자체에서 클라우드 연결 없이 학습과 추론을 구현할 수 있다.

2025년까지 클라우드 기반 인공지능 칩셋 시장은 146억 달러, 반면 에지기반 인공 지능 칩셋은 데이터 센터보다 3.5 배 큰 516억 달러에 이를 전망이다

휴대전화, 스마트 스피커, 무인 항공기, AR/ VR 헤드셋 등 모든 장치에 AI 처리가 필요하다. 엔비디아(NVIDIA)와 인텔(Intel)이 현재 데이터센터 기반의 기계학습 애플리케이션 시장을 장악하고 있다. 누가 데이터 센터와는 거리가 있는 에지 컴퓨팅을 위한 AI 시장을 차지할지, 그리고 그 칩들은 어떤 설계에 기반할지는 아직 알 수 없다.

AI ML 칩의 관건은 전력소모와 성능비율이다. 데이타세트 훈련에 효율적인 GPU는 전력 소모가 크고 발열이 심해 디바이스에 탑재하기에는 비효율적이다.

ASIC 일종인 구글 TPU(Tensor Processing Unit)는 2016년 5월에 발표한 하드웨어로 벡터/행렬연산의 병렬처리에 특화됐다. TPU는 8비트 정수 연산을 활용전력소모 대비 성능비가 뛰어나다는 평가다.

AI칩 시장전망은 2025년 700억달러에 달할 전망이다. credit: NVIDIA.

최근 발표된 구글 뉴럴 기계번역 논문은 CPU와 데이터를 주고 받는 특정 조건하에서, TPU의 속도가 GPU의 10배 이상 빠르다고 말한다.

ASIC 설계 및 테스트 등에 사용하는 FPGA(field-programmable gate array)는 신뢰성이 높은 프로그래밍 가능한 집적회로 반도체다. 모든 신호가 하드웨어 레벨에서 실시간 처리된다.

FPGA는 프로세서 내부 회로를 프로그램에 맞게 직접 설계해 곧바로 병렬실행, CPU보다 계산 속도가 빠르다. 자일링스(Xilinx)사와 인텔 자회사인 알테라(Altera)사가 각각 시장점유율 1, 2위다.

팹리스 제조사 자일링스는 지난해 말 데이터 센터, AI 칩 시장을 위해 수십 년간 판매해 온 FPGA에 이어 새로운 가속 플랫폼 SoC ‘Versal’을 출시했다. 인텔은 x86 프로세서와 FPGA를 탑재한 서버용 SoC를 출시, 최근 아마존 AWS도 FPGA 호스팅을 지원하고 있다.

AI 추론 가속

스마트폰, 드론 등이 처리하는 대부분의 데이터는 용량이 큰 이미지, 비디오 또는 오디오 데이터다.

에지 디바이스 AI/ML 애플리케이션은 데이터 비공개 등 보안과 클라우드 이용에 따른 지연 등을 줄여야 할 필요성에서 비롯된다. 에지 컴퓨팅에는 수십억 개의 산업 및 소비자 장치가 포함된다. 단일 아키텍처가 다양한 요구를 충족하기는 어렵다.

최근 AI칩은 중간단계 신경망 처리뿐만 아니라 전후 처리 부분도 가속화하는 양상이다. 이는 신경망 처리를 포함한 전체 응용 프로세스 개선을 위한 것이다. 기존 모델은 훈련이 아닌 예측을 위해 추론 작업을 수행한다. 일 예로 운전자보조시스템(ADAS)와 같은 자율주행차량 기술에 적용하는 ML 등이다.

credit:synced.

업계에서는 구글 TPU에 이어 애플, 페이스북 뿐만 아니라 테슬라 등 자율주행자동차 제조업체들도 자체 AI/ML 칩을 개발 중이다. 중국업체 화웨이도 AI칩과 디바이스 및 클라우드 기술을 유기적으로 개발하는 종합개발 체제를 구축했다.

국내 팹리스 개발사

국내에는 아직 세계적으로 두각을 보이는 업체들이 없다. AI칩은 새로운 영역으로 선도 기업과 차이가 2년 정도에 불과해 아직 글로벌 도전의 기회가 열려있다.

팹리스 AI칩 스타트업 퓨리오사AI(FuriosaAI)는 데이터센터용 ML 딥러닝에 최적화된 하드웨어 NPU를 개발한다. 에지 컴퓨테이션과 인퍼런스에 특화된 AI칩은 고밀도 시스템 소프트웨어, 인공지능형 미들웨어로 구성된다.

팀은 초기에 삼성전자, 퀄컴 (Qualcomm), AMD 등 주요 반도체 업체 10년이상 경력자들을 중심으로 구성했다. 최근까지 100억 규모 시리즈 A펀딩을 마무리하고, AI기반 설계 솔루션으로 FPGA 데모칩을 개발 중이다.

퓨리오사ai 백준호 대표는 “기존 국내 대기업들은 설계영역에서 취약한 구조적 약점이 있다”며 “글로벌 차원에서 시작단계인 AI전용 칩은 소프트웨어 설계가 중요해 스타트업이 경쟁력을 가질 수 있는 분야”라고 설명했다.

한편, 5G는 클라우드와 엣지 디바이스간 초저지연 데이터 전송을 가능하게 한다. AI/ML 칩을 활용한 추론은 대부분 온 디바이스에서 이뤄지게 된다. 데이터 센터는 인텔(Intel) CPU, 엔디비아(Nvidia) GPU 등 기존 데이터센터 칩을 활용해 데이터 훈련 등 처리 성능을 높일수 있다. 5G망은 온 디바이스 AI 칩과 클라우드간 협업 과정에서 막대한 양의 데이터 전송에 따른 속도 지연을 줄이게된다.