셀레브라 시스템(Cerebras Systems) ‘CS-1’은 구글(Google) ‘TPU2’의 3배 성능을 제공한다. 크기는 29배 작으며 차세대 엑사 스케일 슈퍼컴퓨터 구축에 도입될 예정이다.

최근 미국 콜로라도 주 덴버에서 개최된 슈퍼컴퓨팅2019(Supercomputing 2019)에서 셀레브라(Cerebras Systems)는 세계 최대크기 칩으로 구동되는 컴퓨터를 공개했다.

회사에 따르면 높이 67센티미터 ‘CS-1’ 클러스터(15 rack units)는 수백 킬로와트를 소비하는 GPU 기반 컴퓨터와 동등한 기계학습(ML) 기능을 갖추고 있지만 공간은 1/3 수준을 차지하고 전력은 약 17~ 20kW를 소모한다.

미국 최초의 엑사스케일(exascale) 슈퍼 컴퓨터가 들어설 예정인 미국 아르곤 국립연구소(Argonne National Labs, ANL)는 이미 CS-1을 배치했다고 밝혔다. ANL외에도 셀레브라는 로렌스 리버모어 국립연구서(Lawrence Livermore National Laboratory)에도 칩을 공급할 계획이다.

CEO이자 공동설립자 엔드류 필드먼(Andrew Feldman)은 이 시스템을 가장 빠른 AI 컴퓨터라고 주장한다. 구글 TPU 클러스터 2세대는 단일 ‘CS-1’ 성능의 3분 1 수준이며, 29배 공간과 5배 이상 전력을 사용한다는 점을 지적했다.

CS-1은 몇 주 또는 그 이상 소요될 수 있는 새로운 대형 신경망 교육을 가속화하도록 설계됐다. 40만 코어, 1조개 트랜지스터 웨이퍼 규모 프로세서 칩으로 구동되는 CS-1은 이 작업을 몇 분 또는 몇 초로 축소할 수 있다. 새로운 MLPerf 표준과 같은 표준 AI 벤치마크 측면에서 성능을 제시하는 데이터는 공개하지 않았다. 분석가들에 따르면 이 접근법은 드문 일이 아니며, 업체들은 비즈니스에 특화된 자체 모델을 운영한다.

CS-1 시스템은 소프트웨어 측면에서 ‘ Pytorch’ 및 ‘Tensorflow’와 같은 표준 프레임 워크를 사용해 ML 모델을 작성할 수 있다. 그런 다음 웨이퍼 스케일 엔진 신경망 레이어 할당을 설정한다.

레이어가 모두 거의 같은 속도로 작업을 완료하고 근접 연결로 최적화 문제를 해결해 정보가 중단 없이 네트워크를 통해 흐를 수 있다. 소프트웨어는 여러 컴퓨터에서 해당 최적화 문제를 수행해 컴퓨터 클러스터가 하나의 큰 컴퓨터로 작동 할 수 있다.

셀레브라에 따르면 CS-1은 15개의 랙 유닛에서 최대 시스템 전력 20kW를 사용, 표준보다 12배 빠른 1.2 Terabits / sec 시스템이다. 방 하나 크키 서버 공간의 성능을 기숙사 형 미니 냉장고만한 단일 장치로 수행 가능하다.

셀레브라는 최대 32개의 CS-1을 연결했다. 2년 간 협력해온 ANL은 CS-1을 통해 신경망 전체의 훈련 시간이 크게 단축했다. 심층학습(deep learning)을 통한 암, 외상성 뇌 손상 연구의 생산성도 크게 향상됐다.

CS-1의 첫 응용 프로그램은 미국 에너지부(DoD)와 국립 암 연구소 협력의 일환으로 암 약물 반응을 예측하는 것이다. 또한 블랙홀 충돌과 이들이 생성하는 중력파를 이해하는 데 활용될 계획이다. 이 문제에는 기존에 세타(Theta) 슈퍼 컴퓨터 4392개 노드 중 1024개가 필요했다.