“사람과 AI 함께 성장하는 새로운 미래를 만들 것”

AI 도입의 첫번째 난관에 대한 해결해 제시하는 '크라우드웍스'

데이터 라벨링에서 맞춤형 AI 제공 위한 풀 서비스로 진화 중


각종 산업과 조직에서 최근 AI 수요가 급증하고 있다. 그리고 이런 급증하고 있는 AI에 대한 수요로 인해 연관 산업 또한 빠른 성장을 거듭하고 있다. 특히 AI의 품질을 결정짓는 중요한 요소로 알려진 AI 데이터 시장은 AI 시장의 성장세를 그대로 반영하고 있다.

GVR(Grand View Research)의 보고서에 따르면 글로벌 AI 데이터 시장은 2023년 기준 19.5조 원 규모를 형성할 것으로 예상되고 있으며, 2030년에는 75.2조 원 규모로 급격히 성장할 것으로 예상하고 있다. 국내 시장 또한 이런 성장세는 크게 다르지 않아 현재는 8000억 원 규모를 형성하고 있는 AI 데이터 시장이 2030년에는 4조 원 대까지 성장할 것으로 예상되고 있다.

최근 챗GPT(ChatGPT)의 등장과 함께 생성AI 개발과 관련된 경쟁도 심화되고 있다. 생성AI는 개발할 때 대량의 데이터를 학습하는데 이 때 학습에 사용되는 데이터의 품질이 모델 정확도와 효율성을 크게 좌우한다. 또한 AI의 편향성 문제를 해결하기 위해서는 엄선된 고품질의 데이터가 필요하다.

데이터 분석 등 AI 관련 업무에서 가장 많은 시간과 비용이 필요한 부분이 바로 데이터를 준비하는 과정이라는 점이며, 전체 프로세스의 80%의 시간이 바로 이 데이터 전처리 과정에 소요된다고 하니 데이터 준비 과정의 어려움을 미뤄 짐작할 수 있다.

IT 분야에서 가장 첨단 기술로 꼽히고 있는 AI라고 하더라도, 꽤 많은 인력을 요구하는 분야가 바로 이런 데이터 전처리 과정, 즉 데이터 라벨링 과정이며, 특히 높은 품질의 AI를 학습하기 위해서는 더 많은 학습 데이터가 필요하다는 점 때문에 고성능 AI를 구현하기 위해서는 더 많은 인력이 필요하다.

이런 데이터의 라벨링 작업을 위한 인력을 운용하는 비용도 비용이지만, 이들을 모집하고 교육시키는 과정에 따른 어려움이 AI 도입에서 겪는 가장 큰 어려움 중 하나이면서, 첫번째 난관이라는 점을 생각하면, AI의 대중화를 위해서는 이런 데이터 문제를 해결하기 위한 방안이 필요하다는 것은 너무나 자명한 일이다.


수요에 비해 데이터 라벨러가 부족한 것이 어쩌면 AI 데이터 시장의 가장 큰 문제점이라고도 볼 수 있는 상황에서, 크라우드소싱 방식으로 데이터 라벨러를 모집하고 훈련시켜, 수요처에 공급하거나 데이터 라벨링 작업을 서비스화해 제공한다면, 최소한 AI 도입의 첫번째 난관을 넘어설 수 있도록 돕는 기업이 있다.

크라우드웍스는 다양한 전문성과 경험을 가진 최대 50만 명 이상의 데이터 라벨러가 함께 일하고 있어, AI 데이터 시장의 요구에 즉각적인 대응이 가능하다.


데이터 라벨링과 가공 서비스 중심으로 성장

박민우 크라우드웍스 대표는 일찍부터 AI의 필요성을 절감하고, 이미 2000년에 AI 상용화를 꿈꾸며 AI 검색 엔진 솔루션 기업을 설립했었다. 그 당시 AI 개발에 있어 데이터의 중요성에 대해 실감하게 됐으며, 이후 2010년대에 클라우드 컴퓨팅이 등장하고, 구글과 아마존 등이 AI에 대한 투자를 시작할 무렵, 크라우드웍스를 설립했다.


박민우 크라우드웍스 대표


박민우 대표는 “AI 산업을 뒷받침하는 것을 결국 데이터라는 확신이 있었기에 할 수 있었던 선택이다. 결국 크라우드웍스는 창업 후 세 달 만에 네이버 D2SF로부터 시드 투자를 받았으며, 현재는 코스닥 상장까지 순조롭게 성장하고 있다”고 말한다.

크라우드웍스는 크라우드소싱을 기반으로 한 AI 데이터 플랫폼이다. 그리고 이런 의미를 담아 크라우드웍스라는 이름 또한 ‘Crowd’와 ‘Works’를 조합해 사명을 지었다. 박민우 대표는 “AI 개발을 위해서는 많은 데이터 라벨러가 필요한데, 기업이 현실적으로 개발때마다 많은 사람들을 고용하고 교육하고 관리할 수 없기 때문에 크라우드웍스와 같은 데이터 라벨링 플랫폼을 이용해 데이터 라벨러를 모집하고 고품질의 데이터를 수급할 수 있는 것”이라며, “크라우드웍스의 데이터 라벨러분은 크라우드소싱 방식으로 프로젝트에 참여할 수 있도록 구성된다”고 말한다.

크라우드웍스는 초기 데이터 라벨링과 가공 서비스 중심으로 성장해 왔다. 하지만 지금은 AI 모델 개발 가치사슬 전 단계에 걸친 통합 솔루션을 기업에 제공하는 방향으로 서비스를 확대하고 있다. 2022년 하반기에는 AI 모델 검증 서비스인 QualityWorks를 출시했고, 올해 들어 기업들의 성공적인 LLM 도입을 돕는 올인원 서비스인 LLM Platform/Apps를 선보였다. 물론 2020년 전문 라벨러의 교육을 위해 설립한 아카데미 플랫폼 서비스 또한 지속적인 성장세를 보이고 있는 중이다.

박민우 대표는 “크라우드웍스는 AI 기업이지만 사람에 주목하고 있다. AI 데이터도 결국 사람이 핵심이다. 크라우드웍스는 이런 의미에서 사람과 AI가 함께 성장하는 새로운 미래를 만드는 것을 목표로 삼고 있다”며 크라우드웍스의 비전에 대해 설명한다.


데이터 라벨링에서 AI 데이터 구축 통합 솔루션으로 진화중

크라우드웍스의 제품군은 크게 기존의 데이터 라벨링과 가공 서비스를 제공하는 크라우드웍스 데이터 플랫폼(Crowdworks Data Platform)과 향후 신사업으로 추진 중인 크라우드웍스 LLM 플랫폼(Crowdworks LLM Platform)으로 구분할 수 있다.


크라우드웍스 데이터 플랫폼은 지능형 AI 데이터 구축 서비스인 크라우드웍스 온라인 서비스(Crowdworks Online Services)와 AI 데이터 구축을 위한 통합 솔루션인 워크스테이지(Workstage), 데이터 라벨러 인력 매칭/파견 및 교육 서비스인 크라우드잡스(Crowdjobs)와 크라우드 아카데미(Crowd Academy)로 구성된다.

크라우드웍스 온라인 서비스는 크라우드소싱 방식으로 AI 데이터 구축 프로젝트를 운영, 관리하는 지능형 플랫폼 서비스다. 데이터 수집과 가공을 포함하며, 전문 프로젝트 매니저가 프로젝트 운영과 작업자를 관리한다.

워크스테이지는 온프레미스(on-premise) 또는 SaaS 형태로 제공되는 통합 AI 데이터 구축 솔루션이다. 데이터의 외부 반출을 원치 않거나 데이터를 직접 통제, 관리하고 싶은 고객에게 데이터 구축 도구, 사용자 관리 등 핵심 기능이 포함된 솔루션을 제공하는 서비스다. 또한, 고객의 보안 프로그램 적용과 반영이 가능하다는 것이 특징이다.

크라우드잡스는 데이터 수집과 가공을 포함한 AI 데이터 구축 전체 프로세스 단계에 전문인력을 매칭하고 파견하는 서비스다. 크라우드 웍스 온라인 서비스 내 작업 이력과 활동 데이터를 기반으로 고객이 제공한 필요 자격 요건에 부합한 지원자를 빠르게 제공한다.

크라우드 아카데미는 전문 데이터 라벨러를 육성하는 교육 서비스다. 아카데미 교육을 통해 데이터 라벨러의 정확도와 작업 능률을 향상시킬 수 있으며, 보다 품질 높은 데이터를 생산할 수 있다.

크라우드웍스 LLM 플랫폼은 생성AI 데이터 구축과 통합 서비스인 크라우드웍스 LLM 엔터프라이즈Crowdworks LLM Enterprise와 기업에 바로 적용할 수 있는 AI 솔루션인 크라우드웍스 LLM Apps(Crowdworks LLM Apps)로 구성된다.

크라우드웍스 LLM 엔터프라이즈는 기업이 생성AI를 도입하기 위한 전 과정(데이터 설계, 데이터 구조화와 구축, 모델 개발, 서비스화)를 지원하며, 크라우드웍스 LLM Apps는 기업이 생성AI를 보다 빠르게 적용할 수 있는 도입 솔루션으로, 채팅 기반의 애플리케이션을 제공한다.

박민우 대표는 “크라우드웍스는 시장 초기에 빠르게 크라우드소싱 플랫폼을 구축해 시장을 선점할 수 있었다. 이미 50만 명 이상의 크라우드워커를 확보하고 있기 때문에 경쟁사 대비 우위를 차지하고 있으며, 이를 기반으로 프로젝트 수주 또한 증가하는 선순환 구조를 만들었다”고 평가하고 있다.

또한 시장 초기부터 국내 AI 선도기업과 스타트업, 데이터 활용기업과 정부 등 수많은 고객들과 함께 성장해온 크라우드웍스는 현재 430개 이상의 고객을 확보하고 있다. 박민우 대표는 “코스피 IT 기업 시가총액 상위 30개 기업 중 70%가 크라우드웍스의 고객이다. 이처럼 많은 고객과의 프로젝트 진행 경험을 통해 쌓은 전문성과 노하우를 바탕으로 지속적인 신규 고객 유입과 성장을 이어가고 있다”고 성과를 평가했다.

크라우드웍스는 학습 데이터 가공 분야와 작업자, 데이터 관리 분야에서 국내외 총 180건의 특허를 보유하고 있으며, 네이버와의 협업을 통한 하이퍼클로바X 튜닝 경험, 챗GPT, GPT-4 API를 활용한 다수의 튜닝 경험을 보유하고 있다. 또한 파인튜닝용 데이터셋 구축 경험을 보유하고 있어, AI 분야에서 시장 경쟁력을 확보하고 있으며, 시장 영역을 확장해 나가고 있다.



맞춤형 AI 도입에 필요한 풀 서비스 제공해 나갈 것

지금까지 크라우드웍스는 AI 데이터 플랫폼 선도 기업으로서 견고한 AI 데이터 수요를 기반으로 매출 안정성을 확보하기 위해 노력해 왔다. 이런 기반을 마련한 크라우드웍스는 올해부터 LLM 플랫폼으로 매출 성장성을 확보하는 동시에 데이터와 LLM 패키지 상품을 통해 기업의 맞춤형 AI 도입에 필요한 풀서비스를 제공함으로써, 초거대 AI 시대를 선도하는 기업으로 거듭나기 위한 준비를 이어가고 있다.

또한 올해부터 크라우드웍스는 해외 시장 공략에 나서고 있다. CES 2023과 유럽 스타트업 박람회인 비바 테크놀로지 2023에 연이어 참가하면서 본격적으로 글로벌 시장 확장에 나선 것이다.

박민우 대표는 “지난해 이어 올해 2년 연속으로 가트너의 하이프 사이클 보고서 2개 부분에 샘플 벤더로 등재되는 등 해외 시장에서도 크라우드웍스를 주목하고 있다. 이런 성과를 바탕으로 향후 유럽과 미주, 일본 등에서 현지 협력사 발굴과 글로벌 지사 확장을 통해 글로벌 접근성과 시장 확대해 주력해 나갈 예정”이라고 해외 진출 계획에 대해 밝혔다.

인공지능 13 AI학습 1 크라우드소싱 1 AI데이터 1 데이터라벨링 1 크라우드웍스 1