슬로우 포인트
- ‘클로바’에서 ‘하이퍼클로바’로 (네이버 클라우드, 클로바CIC 흡수)
- 한국어 최적화: GPT-3 보다 6,500배 많은 한국어 학습량(토큰 5천600억 개)
- 하이퍼클로바X: 기업 자체 보유 데이터 활용한 인공지능 서비스 구축 서비스
- 네이버 클라우드 대표 기업서비스 ‘네이버윅스’에도 인공지능 접목 한
- 국어 강점을 내세운 하이퍼클로바, 챗GPT 국내 유력한 대항마로 부상
네이버의 인공지능 분야 연구 및 사업을 대표하는 브랜드인 클로바가 초거대 인공지능 하이퍼클로바로 거듭나며 본격적인 사업 확장을 꾀하고 있다. 한편, 2022년에는 기존 사내 독립기업 형태로 운영되던 클로바CIC가 네이버 클라우드로 흡수되는 네이버 그룹 차원에서의 큰 조직 변화가 있었다.
네이버 클라우드는 네이버 대부분의 서비스 인프라를 제공하는 것과 함께 공공부문 등 대외 B2B 사업을 수행하는 회사다. 네이버 비즈니스 플랫폼에서 네이버 클라우드로 사명을 변경함과 동시에 본격적인 클라우드 비즈니스를 선언하며 네이버 서비스 운영을 바탕으로 한 축적된 기술을 바탕으로 국내 클라우드 시장을 선도하고 있다.
클로바가 네이버 클라우드 지붕 아래 들어간 것은 크게 두 가지 의미를 내포하고 있다.
- 첫째, 본격적으로 클로바를 기반으로 한 엔터프라이즈 사업을 확대하기 위함이며,
- 둘째, 막대한 자원을 필요로 하는 초거대 인공지능 수요에 신속하게 대응하고, 또한 자원 운영을 최적화하기 위함이다.
하이퍼클로바: 개요
2020년 오픈AI가 1천750억 개 매개변수(parameters)와 3,000억 개 토큰으로 학습한 GPT-3 모델을 발표함으로써 초거대 인공지능 구축 경쟁이 촉발되었다. 이에 네이버는 2021년 한국어에 최적화한 2천40억 개 매개변수 규모의 하이퍼클로버를 탄생시켰다. 하이퍼클로버의 등장 이전부터 “클로바”는 네이버의 인공지능 서비스를 대표하는 브랜드로 인공지능 스피커와 같은 다양한 디바이스와 인공지능을 활용한 여러 서비스에 적용되었다.
- 디바이스: 클로바 스피커, 클로바 시계, 클로버 램프, 기타 다양한 파트너 디바이스
- B2C 서비스: 클로바 노트, 클로바 더빙(Dubbing)
- 인공지능 제품: 클로버 AI 컨택트 센터, 클로바 다큐먼트 인사이트, 클로바 페이스 사인, 클로바 케어콜, 클로바 스튜디오 등
- 코어 기술 및 제품: 클로바 챗봇, 클로바 스피치, 클로바 보이스, 클로바 OCR, 클로바 페이스, 클로바 NSML, 클로바 NLP, 클로바 비디오
하이퍼클로바는 GPT-3의 한국어 학습량 대비 6,500배 많은 총 5천600억 토큰을 학습함으로써 한국어에 최적화한 것이 특징이다. 이는 기존 네이버 언어 모델과 비교해도 약 3천 배 많은 양으로 뉴스 50년 치 또는 네이버 블로그 9년 치의 양이라고 한다.
이 정도 규모의 모델을 학습시키기 위해서는 매우 큰 규모의 슈퍼컴퓨팅 인프라가 뒷받침되어야 한다. 2021년 네이버 AI Now에서는 고성능 병렬 GPU 클러스터뿐만 아니라, 초저지연 고대역폭 네트워크, 그리고 고성능 병렬 스토리지를 필수 요소로 들었다. 당시 구축한 슈퍼컴퓨팅 인프라의 연산 능력은 700PF(PetaFlps)로 140개의 서버(Computing Node), 1,120개의 CPU, 그리고 초저지연 네트워크를 위한 3,800개의 케이블로 이루어졌다고 한다. 이를 바탕으로 플랫폼 형태의 서비스로 활용 영역을 확장해 나간다는 것이 하이퍼클로바의 비전이다. (그림 1)
하이퍼클로바X로 기업시장 공략
네이버 클라우드는 지난 2월 27일과 28일 이틀 동안 진행된 네이버 개발자 콘퍼런스 데뷰(DEVIEW) 2023행사에서 클로바CIC 흡수 후 처음으로 클로바 비즈니스에 대한 구체적인 계획을 발표했다. 키노트 연사로 나선 김유원 네이버 클라우드 대표는 하이버클로바X를 오는 7월에 선보인다고 했다.
2022년 네이버 클라우드 대표로 선임된 김유원 대표의 첫 공개 행사 자리에서 하이퍼클로바X를 언급한 것은 향후 네이버 클라우드 사업의 주요 한 축으로 초거대 인공지능을 두고 있음을 시사하며, 그 중심에 하이퍼클로바가 있음을 선언한 것으로 볼 수 있다.
하이퍼클로바X는 기업이 자체 보유한 데이터를 활용해 손쉽게 인공지능 서비스를 만들 수 있도록 하는 것을 목표로 한다. 사전 훈련된 하이퍼클로바를 기반으로 각 도메인 영역에서 자체 데이터를 활용하여 세부 튜닝을 거치면 각 기업이 필요로 하는 인공지능 서비스를 만들 수 있다는 뜻이다. “X”라고 표현한 것은 요즘 흔히 쓰는 “everything”을 나타내는 것으로 보인다. 고객의 수요에 맞춘 초거대 AI 상용화를 적극적으로 추진해 누구나 초거대 AI를 활용할 수 있도록 하며, 이를 통해 세계 시장에서도 경쟁력 있는 인공지능 생태계를 만들어 가겠다는 것이 네이버 클라우드의 비전이며 이를 위한 사전 포석으로 지난해 클로바CIC를 흡수한 것이다.
또한, 네이버 클라우드의 대표적인 기업용 서비스인 네이버웍스에도 인공지능 기술을 접목할 것이라고 밝혔다. 마침 네이버 데뷰에서의 이 발표 이후 초거대 AI를 결합한 마이크로소프트 365 코파일럿(Copilot)을 공개하였으므로 네이버웍스도 하이퍼클로바와 결합한 코파일럿과 유사한 형태의 서비스로 업그레이드될 것으로 조심스럽게 점쳐볼 수 있다. 하이퍼클로바와 네이버웍스와의 결합이 하이퍼클로바X의 한 사례로 성공적으로 이루어진다면 네이버웍스뿐만 아니라 하이퍼클로바X의 적용 사례로도 큰 의미가 있을 것이다.
하이퍼클로바 생태계
기존 인공지능 개발방식은 데이터를 확보하고 최적화 모델을 개발하는 과정에서 고도의 전문성을 가진 개발자에 절대적으로 의존할 수밖에 없다. 하이퍼클로바는 이미 수많은 다양한 데이터를 학습한 초거대 기반(Foundation) 인공지능 모델로 이를 활용하면 전문 개발자가 아니더라도 누구나 인공지능을 개발하고 세부 튜닝이 가능하다.
클로바 스튜디오는 하이퍼클로바 언어 모델을 통해 누구나 쉽게 자신만의 인공지능을 만들 수 있는 노코드(No-code) AI 개발 플랫폼이다. 인공지능 개발방식의 변화와 함께 클로바 스튜디오의 활용으로 하이퍼클로바 생태계 확산을 도모할 수 있다.
하이퍼클로바 적용 사례는 다음과 같다.
- 뤼튼(뤼튼테크놀로지스): 간단한 키워드만으로 완성도 높은 관련 문구를 자동 생성하는 서비스이다. 광고 문구나 제품 소개 문구 등을 작성할 때 매우 유용하게 사용할 수 있다. (wrtn.ai)
- 스토리네이션(우주문방구): 토리(tori) AI 플랫폼을 통해 사용자의 스토리 창작을 돕는다. (uju-munbanggu.com)
- 킵그로우(유니드컴즈): 네이버 스마트스토어 입점 고객의 인스타그램 계정에 게시물을 주기적으로 포스팅해 주는 ‘인스타그램 AI 피드 포스팅’ 서비스를 제공한다. (app.keepgrow.com)
- 카피클(Copykle, 아스타컴퍼니): 빠르고 쉽게 상품설명, 광고 헤드라인 등 광고 문구를 생성한다. (moducopy.ai)
- 단비AI(단비): 기업용 챗봇을 만들어 주는 서비스다. (danbee.ai)
- 라이팅젤(앱플랫폼): 창작자들의 글쓰기를 돕는 서비스로 특히 한국어 맥락에 최적화된 결과를 제공한다. (tinytingel.ai)
- 잡브레인(임플로이랩스): 직장인들을 위한 경력관리 서비스로 AI 자소서 생성 기능 및 포트폴리오 작성에 특화된 서비스이다. (company.jobbrain.co.kr)
- 루이스(현대백화점): 판촉 행사 소개문 작성 등 마케팅 문구 제작을 위해 현대백화점 사내 카피라이팅 시스템이다.
이상과 같은 파트너 서비스 외에도 하이퍼클로바는 네이버 자체 서비스에서도 매우 다양하게 활용되고 있다. 생산성 도구로 주목을 받는 클로바 노트를 비롯하여 쇼핑, MY 플레이스, 커머스 등 많은 분야에 적용되어 있다.
하이퍼클로바 인프라
앞서 잠깐 언급했듯이 하이퍼클로바 학습 및 서비스 운용을 위해서는 엄청나게 많은 자원을 필요로 한다. 2021년 네이버 ‘AI Now’에서 공개된 슈퍼컴퓨팅 인프라가 베이스라인이라고 추정해 볼 수 있다. 네이버 클라우드는 하이퍼클라우드 학습을 위해 엔비디아 DGX 슈퍼팟(SuperPod)을 사용하는 것으로 알려졌다. 엔비디아 DGX 수퍼팟은 턴키 방식의 AI 데이터센터 솔루션이다.
네이버 클라우드에서는 하이퍼클로바 학습에 활용하는 슈퍼컴퓨팅 인프라 외에 하이퍼클로바 서비스 운용을 위해서도 매우 큰 컴퓨팅 자원을 활용하는 것으로 알려져 있다. 상세 구축 규모는 공개되어 있지 않으나 전체 규모는 최소 2~3 천억 원대는 될 것으로 추정하고 있다. 또한, 엄청난 전력 사용량도 피할 수 없다. 글로벌 클라우드 기업들이 이러한 고민을 해결하기 위해 AI 반도체 개발에 직접 나서고 있는 상황에서 네이버도 삼성전자와 AI 반도체 솔루션 개발에 협력하기로 했다.
2023년 네이버 데뷰에서 곽용재 네이버 클라우드 최고기술책임자(CTO)는 “기존 그래픽처리장치(GPU) 대비 10분의 1의 크기, 4배 이상의 전력 효율성을 갖춘 AI 반도체 솔루션을 삼성전자와 함께 만들고 있다”고 양사 협력을 좀 더 구체적으로 재차 확인해 주었다. 한편, 올해 세종시에서 개장할 데이터센터에는 삼성과 협업하여 개발한 AI 반도체 솔루션이 적용된 슈퍼컴퓨팅 인프라가 구축될 것이라고 말했다.
하이퍼클로바를 품은 네이버 클라우드의 미래
국내 클라우드 시장에서도 글로벌 클라우드 공급자의 지배력은 압도적으로 높다. 특히 아마존의 시장 점유율이 매우 높은 편으로 2021년 기준 아마존이 62.1%로 1위, 마이크로소프트가 12.0%로 2위, 그 뒤를 7.0%의 네이버가 뒤를 잇고 있어 그나마 국내 클라우드 기업으로서의 명맥을 유지하고 있다.
2022년 말 챗GPT의 출현 이후 인공지능 시장에서 새로운 국면이 펼쳐지면서 마이크로소프트가 많은 주목을 받고 있다. 아직 아마존이 굳건히 1위 자리를 지키고 있는 클라우드 시장에서도 챗GPT를 만든 오픈AI를 발판으로 마이크로소프트의 도약을 조심스럽게 점칠 수 있다.
하이퍼클로바는 현재 국내에서 가장 유력한 챗GPT 대항마로 꼽히고 있다. 한국어 데이터 학습을 강점으로 우리나라 시장에서 충분히 경쟁력이 있다고 판단된다. 이에 네이버 클라우드에서도 하이퍼클라우드X 계획을 발표하며 본격적으로 초거대 AI 시장 진출을 선언했다. 네이버 클라우드는 또한 소버린 클라우드의 중요성을 강조하며 공격적인 시장공략을 펼칠 것으로 예상된다. 2023 네이버 데뷰 키노트 발표에서도 소버린 클라우드에 대해 강조한 바 있다.
공공 부문의 클라우드 전환과 맞물려 초거대 AI를 어떻게 수용할 것인가도 하이퍼클라우드 사업의 주요 변수다. 만일 공공 부문 클라우드 서비스를 위한 전용 초거대 AI 서비스 구축이 추진된다면 네이버 클라우드는 하이퍼클로바를 앞에 내세워 좋은 기회를 잡을 수 있다. 민감한 데이터에 기반한 지속적인 학습과 피드백이 필요한 상황에서 해외 초거대 인공지능 서비스에 전적으로 의존하는 것은 불가능할 것이며, 상대적으로 부족한 한국어 데이터 학습도 글로벌 서비스를 회피하게 되는 주요 원인이 될 수 있다.
만일 하이퍼클로바가 한국어 도메인에서의 확실한 성능 우위를 인정받는다면 이를 기반으로 민간 클라우드 시장에서의 점유율 상승을 기대해 볼 수 있다. 물론 이를 위해서는 일반 클라우드 서비스와 하이퍼클로바와의 결합을 확대하거나, 아니면 마케팅 관점의 서비스 번들링이 필요하다. 어쨌든 하이퍼클로바 자체 사업뿐만 아니라 이를 통해 네이버 클라우드 사업을 레버리지 할 수 있는 다양한 전략을 적극적으로 모색할 것이다.
참고문헌.
- naver-ai-now.kr
- 한국경제, “기업이 자체 데이터로 AI 서비스 만드는 ‘하이퍼클로바X’ 7월 공개”, 2023.2.27
- 중앙일보, “”향수 카피 써봐” 10초 만에 뚝딱…현대백화점 신입사원 정체”, 2023.2.26
- 한겨레, “삼성전자·네이버, 차세대 AI 반도체 솔루션 개발 협력키로”, 2022.12.6
- 디지털데일리, “[데뷰2023] 네이버 x 삼성전자, AI 반도체 솔루션 개발…10분의 1 가벼움”, 2023.2.27
- 지디넷 코리아, “공정위 “국내 클라우드 시장 점유, AWS·MS·네이버 순””, 2022.12.28.
본 글은 한국지능정보사회진흥원의 지원을 받아 작성되었으며, 디지털서비스 이용지원시스템에 동시 게재합니다.