3만명 계약직 네트워크, 자율주행차 수집 이미지 라벨링

아직 초기 단계인 인공지능(AI) 기술은 사람의 도움을 필요로 한다. 자율주행 자동차 등 고도의 정확성을 요구하는 분야는 AI 기계학습(machine learning, ML) 훈련을 개선하기 위해 사람의 확인과 추가 입력이 필요하다.

형식에 맞게 데이터를 정제하고 가공, 분류하는 라벨링(labeling)은 사람 손이 많이 가는 작업이다.

구글(Google)이나 페이스북(Facebook) 등 큰 규모의 IT기술업체도 이 노동집약적 업무는 자체 계약직이나 스타트업에 외주를 주는 경우가 많다. 자연어처리(NLP), 텍스트 자동생성 서비스 ‘GPT-2’ 를 개발한 AI연구조직 오픈AI(OpenAI)도 최근 한 스타트업과 계약을 맺었다.

미국 센프란시스코의 3년차 스타트업 스케일AI(Scale AI Inc.)은 5일(현지시각) 이 분야에서 막대한 인력네트워크와 개선된 프로세스를 구축해 시리즈C에서 1억 달러 투자를 유치했다고 밝혔다.

이 업체는 전 세계 3만 명의 계약직 직원 네트워크에 사진을 전달해 사진을 마크 업하는 첫 번째 소프트웨어 툴셋를 구축했다. 막대한 인력 규모는 구글 모회사인 알파벳(Alphabet)의 웨이모(Waymo), GM(General Motors Co.)의 크루즈(Cruise) 및 우버(Uber Technologies Inc.) 등 자율주행 자동차 분야 주요 업체도 고객이다. 소매점 결제 프로세스를 자동화하는 소프트웨어를 구축하는 스텐다드 코그니션(Standard Cognition) 등도 있다.

스케일AI는 AI기술을 개발하는 회사에 이 제품을 판매한다. 스케일 공동 창립자이자 CEO 알렉산더 왕(Alexandr Wang)은“AI시스템을 인간 수준의 성과로 끌어 올리려면 수십억 이상의 사례가 필요하다. 이 모든 훈련을 할 여력이 있는 소수의 거대 기업과 그렇지 못한 기업 간에는 큰 격차가 있다”고 말했다.

실리콘밸리에서도 왕의 케이스는 드물다. 그는 두 명의 물리학자 부모와 뉴멕시코에서 자랐다. 고등학교 시절 왕은 코딩에 뛰어나 기술 회사에서 일자리를 얻었다. 학교를 일찍 졸업하고 실리콘밸리에서 일하다가 19세에 스케일을 창업했다.

22세의 나이에 왕은 인덱스 벤처스(Index Ventures) 등 투자자들로부터 1억 달러를 투자 받았다.

그는 AI 시스템을 구축하기 위한 두 가지 주요 과제를 해결하는데 도움을 줄 수 있다고 말한다.

하나는 성공적인 ML 훈련을 위한 충분한 데이터 확보다. 다른 하나는 데이터와 결과가 좋은지 확인하는 것이다. 기계가 이 작업을 일부 할 수는 있지만 사진, 텍스트 및 비디오를 해석해 컴퓨터를 올바른 방향으로 정향하는 것은 사람의 도움이 필요하다.

자율주행자동차 업계에서 회사는 매년 차량 카메라에서 수집된 사진 라벨링(labeling)을 위해 사람들을 고용하는 데 수백만 달러를 소비한다. 일반적으로 작업자는 소프트웨어로 컴퓨터 화면상 이미지에 마우스를 사용해 모든 자동차의 윤곽을 추적하고 분류한다. 건물, 주차 공간, 보행자, 신호등 등 한 사람이 한 장의 사진에 있는 모든 물체를 확인하는 데는 10분에서 2 시간 정도 소요될 수 있다.

수백만 개의 이미지 데이터는 AI시스템으로 피드백 된다. 자율주행 차량은 주변에 어떤 것들이 있는지를 더 정확하게 알 수 있다. 스케일은 이미지를 먼저 자동으로 확인하는 소프트웨어를 구축했다. 대체로, 대다수 객체에 자동으로 레이블을 지정할 수 있다. 그런 다음 작업자에게 이미지를 검토하도록 요청한다.

약 100명의 직원이 샌프란시스코 스케일 본사에서 근무하고, 전 세계에 흩어져있는 3만여 계약직 직원들은 이미지 라벨링 작업을 수행한다. 계약자는 그들이 찾고자하는 내용에 대한 세부 지침을 스케일에서 받는다.

스케일에 따르면 전 세계 계약직 라벨링 직원들은 해당 국가 평균 임금의 60 ~ 70 백분위 수익을 얻는다. 임금을 아껴 수익을 내는 회사는 아니라고 하지만 AI를 보완하는 단순 반복 업무는 관련 ML 알고리즘이 고도화 할수록 대체 가능한 일이 된다.