퀄컴(Qualcomm)은 내년 중 ‘Cloud AI100’ 칩으로 데이터 센터 시장에 진출을 예고했다.

무어 인사이트&스트레티지(Moor Insights & Strategy) 창립자겸 수석 분석가 패트릭 무어 헤드(Patrick Moorhead)는 엔비디아( NVIDIA)가 아닌 퀄컴이 스마트폰 기기 리더십 덕분에 AI칩 시장에서 가장 큰 시장 점유율을 차지할 것이라고 지적했다.

모바일 및 임베디드 공간에서 퀄컴은 AI를 실행하는 수백 개의 소비자 및 임베디드 장치에 전력을 공급한다. 현재 10억 개가 넘는 스넵드레곤(Snapdragons)을 출시했으며 현재 일부 수준의 AI를 지원한다.

데이터 센터에서 NVIDIA는 훈련 시장의 90% 이상을 차지할 전망이다. 인텔(Intel)은 세계 최대 데이터 센터에서 추론처리를 위한 칩이 가장 큰 비중을 차지한다고 주장했다.

분산지능

오늘날 스마트폰은 약 30억 명의 사람들이 의사소통하고, 사진과 비디오를 찍고, 개인 데이터와 응용 프로그램에 액세스 할 수 있는 광범위한 인터페이스다. 스마트폰 데이터는 많은 부분 AI를 통해 처리된다. 안드로이드 폰을 사용해 사진을 찍은 적이 있다면 아마도 퀄컴의 AI를 사용했을 것이다.

무어 인사이트&스트레티지 포브스 블로그에 따르면 퀄컴은 전력 효율적인 모바일 처리 분야의 리더십을 통해 휴대기기를 넘어 확장된 AI 분산 처리를 위해 클라우드로 오프로드 할 수있는 “분산 인텔리전스”를 만들려한다. 따라서 처리, 사전 처리는 전력, 데이터 및 대기시간 요구 사항에 따라 장치, 클라우드 에지 또는 데이터 센터에서 발생할 수 있다.

5G 네트워킹을 통해 이 세 가지 처리 계층을 상호 연결함으로써 각 계층은 협력해 이해를 향상시키고 사용자에게 고급 기능을 제공 할 수 있다.

퀄컴 AI엔진

퀄컴은 이기종 컴퓨팅 방식을 사용해 저전력 및 비용으로 AI 및 애플리케이션 성능을 제공한다. 헥사곤 프로세서(Hexagon Processor), 아르레노 GPU(Adreno GPU) 및 ‘Kryo CPU’와 모뎀, 보안 프로세서 및 기타 로직을 동일한 다이에 배치한다.

헥사곤(Hexagon)의 최신 업데이트에는 NVIDIA의 최신 GPU에있는 텐서코어(TensorCore)와 유사한 전용 텐서(Tensor) 가속기가 포함돼 있다. 이러한 코어를 사용하는 퀄컴이 장착 된 휴대 전화의 AI 지원 응용 프로그램에는 듀얼 및 단일 카메라 ‘Bokeh’, 보안 3D 얼굴 인증, 장면 탐지, 초 고해상도 및 무수히 많은 사진 향상 연산 기능이 포함된다.

블로그에 따르면 에이넨드테크(Anandtech)와 ‘PCMag’ 벤치마크는 초당 7조 개 이상의 작업(TOPS)을 제공 할 수 있는 스넵드레곤855(Snapdragon 855)가 화웨이 기린(Huawei Kirin) 및 삼성 엑시노트(Samsung Exynos) 모바일 프로세서보다 성능이 뛰어남을 확인했다.

물론, 모든 칩에는 유용한 소프트웨어가 필요하며 퀄컴은 AI 애플리케이션을 위한 강력한 스택을 구축했다. 여기에는 ‘PyTorch’ 및 TensorFlow와 같은 신경망 프레임 워크와 마이크로소프트, 아마존, 페이스북 및 바이두에서 개발한 프레임 워크가 포함된다.

퀄컴은 신경망을 도입하기 위한 일반적인 데이터 형식 ONNX(Open Neural Network Exchange)를 지원하며 스넵드레곤 프로세서에서 실행한다. 이는 퀄컴의 중요한 전략적 추진력을 보여준다. 회사는 스넵드레곤에서 실질적으로 모든 스타일의 AI를 직접 지원하고 다양한 개발 커뮤니티의 요구를 충족시키는 소프트웨어를 보유하고 있다.

5G AI

5G는 빠른 프로세서와 기술적 1ms 이하의 지연 시간, 1Gbps의 높은 대역폭 및 대규모 연결 덕분에 네트워크 최적화를 위해 AI 처리를 활용하고 새로운 AI 지원 애플리케이션을 구현할 것이다. 퀄컴은 는 5G 미래가 “분산 인텔리전스”를 요구하고 가능하게 할 것이라고 믿는다.

5G 무선 전송 및 관리의 AI 응용 프로그램은 초기 단계이지만 이러한 네트워크를 최적화하는 데 필수적이다. AI는 무선 네트워크 관리를 인간 중심 모델에서 자동 모델로 전환, 신호 품질 및 서비스 수준을 개선하는 데 도움을 줄 것이다.

기지국에서 특정 응용 분야는 다음과 같다.

기지국의 스위칭 핸드 오프 예측으로 품질 저하 및 통화 끊김 최소화

신호 강도 및 서비스 품질을 최적화하기 위해 자주 이동하는 경로에 대한 빔 계획 및 프로비저닝

대규모 MIMO 어레이 및 밀리미터 파 안테나에서 빔 포밍을 활성화해 특정 사용자에게 가장 효율적인 데이터 전송 경로를 식별해 전송 품질을 최적화한다. 이로 인해 낮은 전력 및 대역폭 소비로 더 높은 서비스 품질 제공이 가능하다.

블로그는 결론에서 AI를 모바일, 엣지 및 클라우드 컴퓨팅 리소스에 널리 보급하는 퀄컴의 “분산 인텔리전스(Distributed Intelligence)” 전략은 모바일 및 임베디드 장치를 넘어 기술 확장을 위한 새로운 제품이 필요하다는 것을 인식하고 있다고 말한다.

이어 블로그는 퀄컴에 ‘모바일 장치 AI 가속, SW혁신’, ‘스마트 IoT 및 자율주행차, 드론 등 에지 장치 기술 확장’, ‘에지 및 클라우드 컴퓨팅 서비스 제공 업체를 위한 플랫폼을 개발해 장치의 더 많은 처리 성능과 인텔리전스를 보완하고 확장’ 등을 제안했다.

퀄컴은 지능형 에지 클라우드 및 데이터 센터 환경으로 더욱 확장 할 수 있는 기술 및 시장 개발 프로그램에 투자하고 있다. 2020년 ‘AI Cloud 100’은 350 TOPS에 도달한다는 목표다.

물론 퀄컴은 인텔, 엔비디아, 자일링스와 같은 기존 기업뿐만 아니라 다양한 신생 기업의 데이터 센터 및 클라우드 에지로의 시장 확장 문제에 직면 할 것이다. 실제로 엔비디아는 추론 훈련에서 리드를 확장하는 데 상당한 진전을 이뤘다. 퀄컴이 클라우드 및 차세대 5G 제품을 출시하면 AI 컴퓨팅 혁명에서 중요한 역할을 할 것으로 생각한다.