한동안 오픈AI가 업계 지존이었다. 그런데 게임 체인저가 될 수도 있는 ‘뉴 페이스’가 등장했다. 중국의 한 인공지능 스타트업이 만든 딥시크(DeepSeek)가 세상을 발칵 뒤집어 놓았다.

그래픽 칩을 만드는 엔비디아 주가가 17% 폭락한 걸 비롯해 마이크로소프트와 알파벳(구글) 등도 충격을 피할 수 없었다. “인공지능의 스푸트니크 순간(AI’s Sputnik moment)”이라는 평가도 나온다.

이게 왜 중요한가.

  • 1957년 10월 소련이 스푸트니크 1호를 쏘아 올렸을 때 미국은 엄청난 충격에 빠졌다. 기술력에서 훨씬 뒤쳐져 있다는 평가를 받던 소련이 단숨에 미국을 따라잡은 사건이었다.
  • 딥시크는 일단 오픈AI와 견줄 정도의 놀라운 성능을 보여주고 있다. AI 기업들이 엔비디아 칩을 못 구해서 난린데 딥시크는 저가형 칩으로 해결했다.
  • 5억 달러를 주고 만드는 AI를 500만 달러에 만들 수 있다면? 완전히 게임의 법칙이 달라진다. AI는 규모의 경쟁이라는 그동안의 믿음이 깨지고 있다.
  • 트럼프 정부가 오픈AI와 함께 AI 인프라 구축에 5000억 달러를 쏟아 붓겠다고 발표한 뒤라 충격이 더 컸다. 미국은 그동안 엔비디아 칩 수출을 제한하면서 중국을 견제했지만 경쟁의 양상이 달라졌다.
  • 최신 AI 기술은 상당 부분 오픈소스로 공개돼 있다. 무임승차라고 할 수는 없지만 딥시크 같은 후발 주자들이 시행착오를 줄일 수 있는 환경이다.
  • 참고로 스푸트니크 모멘트가 불러온 미국의 열등감은 1958년 NASA(미국 항공우주국)를 만들고 1969년 7월 달 착륙에 성공한 뒤에야 극복됐다.

핵심 키워드 여덟 가지.

  • 엔비디아의 비싼 그래픽 카드를 꼭 써야 하는 건 아니다. 훨씬 더 적은 비용으로 가능할 수도 있다.
  • 세상의 모든 지식을 다 때려넣어야 하는 것도 아니다. 대형 언어모델말고 다른 길도 있다.
  • 아직은 딥시크가 챗-GPT보다 더 뛰어나다고 볼 수는 없다. 이제 겨우 견줄 만한 정도라고 할 수 있지만 앞으로는 어떨지 모른다.
  • 오픈소스가 폐쇄형 모델보다 가능성이 많다.
  • 빅테크의 독점적 성장 모델에 근본적인 의문이 제기되고 있다. 돈 풀어서 되는 문제가 아니다.
  • 값싼 AI의 시대가 온다. 규모가 아니라 최적화가 핵심이다.
  • ‘적당히 듣기 좋은 말(sounding good)’을 늘어놓는 걸로는 부족하고 ‘더 잘 생각하는(thinking better)’ 추론 능력이 경쟁력이다.
  • 미국과 중국의 AI=안보 경쟁이 더 격화될 가능성이 있다.

딥시크는 어떻게 다른가.

  • 딥시크R1은 이미 오픈AI의 GPT-o1을 뛰어넘었다는 평가를 받고 있다.
  • 딥시크를 만든 하이플라이어(High-Flyer)는 전혀 알려지지 않은 기업이었다. CEO는 1985년생 투자 관리 회사 출신의 랑웬펑(Liang Wenfeng)이다.
  • 메타의 라마3(Llama 3)와 비교하면 왜 딥시크를 게임 체인저라고 하는지 쉽게 이해할 수 있다.
  • 라마3는 H100칩을 1만6000개 이상 썼는데 딥시크R1은 H100보다 훨씬 성능이 떨어지는 H800을 2048개 쓰고도 비슷한 성능을 낸다. 훈련 시간도 라마3는 3084만 GPU시간인데 딥시크R1은 278만 GPU시간으로 10분의 1 수준이다. 비용도 라마3는 5억 달러 이상인데 딥시크R1은 557만 달러에 그쳤다.
  • 미국 정부는 H100은 중국 수출을 금지했지만 H800은 허용했다. H800 정도면 위협이 안 될 거라고 봤기 때문이다. 그런데 그 H800으로 오픈AI에 맞먹는 성능을 냈다면 굴욕을 넘어 충격과 공포가 아닐 수 없다.
  • 딥시크가 구체적으로 어떤 종류의 칩을 얼마나 보유하고 있는지 공개하지 않고 있기 때문에 온갖 추측이 오가지만 대부분 기술이 오픈소스로 공개돼 있기 때문에 검증은 어렵지 않다.

딥시크의 스펙.

  • 딥시크의 훈련 비용은 560만 달러다. 실리콘밸리에서는 전문가 한 사람 연봉 정도밖에 안 되는 금액이다.
  • 참고로 다리오 아모데이(앤트로픽 CEO)에 따르면 클로드의 훈련 비용은 1억~10억 달러에 이른다. 오픈AI의 GPT-4 훈련 비용도 1억 달러가 넘는 것으로 알려졌다.
  • 대략 GPT-4와 비교하면 파라미터는 3분의 1, 훈련 비용은 20분의 1, 훈련 시간도 절반 이하다.
  • 기존의 AI 모델은 문장을 조각(Token)으로 나눠 읽는데 딥시크R1은 문장 전체를 읽어서 처리하기 때문에 생성 속도가 두 배 더 빠르고 답변 정확도도 90%에 이른다.

딥시크의 혁신.

  • 딥시크의 핵심 기술은 매우 구체적으로 공개돼 있다.
  • 다른 대형 언어모델(LLM) 기반 AI는 ‘지도학습(Supervised Fine-Tuning, SFT)’과 피드백 기반 강화학습(Reinforcement learning by Human Feedback)’ 기법으로 훈련을 시킨다. 데이터를 주고 정답을 찾는 능력을 키운다. 100장의 고양이 사진과 100장의 원숭이 사진을 보여주면서 차이를 구별하게 만드는 방식이다.
  • 딥시크는 인간의 개입 없이 ‘강화학습’으로 성능을 끌어올렸다. 굳이 비교하자면 어린아이가 수없이 넘어지면서 자전거를 배우는 것처럼 행동(액션)을 시도하고 그에 따른 결과(보상)를 얻는 과정을 반복하며 최적의 패턴을 찾는 방식이다.
  • 1단계는 추론 기반 강화학습이다. 논리 추론과 문제 해결 능력을 키운 뒤 데이터에서 패턴을 발견하고 추론의 법칙을 끌어낸다.
  • 2단계는 시나리오 기반 강화학습이다. 예측 불가능한 다양한 상황에서 어떤 행동을 해야 최적의 결과를 얻을 수 있을지 결정하는 전략(policy)을 설계한다.
  • 증류(distillation) 방식을 활용했다. 대형 모델이 생성한 데이터를 소형 모델에 학습시킬 수 있다. 비용과 자원을 크게 줄일 수 있다.

딥시크의 ‘아하 모멘트’.

  • “잠깐만요. 이 지점을 아하 모멘트라고 부를 수 있겠네요.”
  • 딥시크가 공개한 기술 논문에서 가장 충격적인 대목은 딥시크R1이 ‘아하 모멘트’를 거치면서 스스로 진화했다는 사실이다.
  • 반복적인 자기 검증(self-verification)과 반성(reflection) 반복적인 성찰과 자기 교정 같은 인간의 문제 해결 프로세스를 흉내냈다. 추론 모델의 새로운 가능성을 열었다는 평가를 받는다.

딥시크의 확장성.

의혹과 논란.

개인정보 이슈도 있다.

  • 중국 기업이라 개인정보 규제를 거의 받지 않는다.
  • IP 주소는 물론이고 장치 정보와 키보드 입력 패턴, 쿠키 값까지 긁어갈 수 있다.
  • 중국에 있는 서버에 정보를 저장하는데 옵트아웃도 없고 언제까지 저장하고 어떻게 활용한다는 안내도 없다.
  • (딥시크를 쓸 것이냐 말 것이냐는 부차적인 문제다. 딥시크가 어떤 변화를 불러올 것이냐가 더 중요한 문제다.)

딥시크가 바꿔놓을 것들.

어떻게 될까.

  • 오픈AI가 AI의 위워크가 될 수도 있다는 경고가 있었다.
  • 챗GPT프로는 이용료가 월 200달러인데 여전히 적자를 보고 있다. 비용은 걷잡을 수 없이 느는데 기대수준은 갈수록 높아지고 요금을 올리기는커녕 낮춰야 할 상황이다.
  • 게리 마커스(뉴욕대 교수)는 “엔비디아도 심각한 타격을 입을 수 있다”고 경고했다. 골드러시 한복판에서 곡괭이을 팔아 부자가 됐지만 곡괭이가 그렇게 많이 필요하지 않다는 주장이 나왔다.
  • 바이든 정부의 칩스법도 역풍을 맞게 될 수 있다. 고성능 그래픽 칩은 여전히 중요하지만 칩이 많다고 해서 더 좋은 성능의 AI를 만들 수 있는 게 아니라는 이야기다. 이제 누가 더 싸게 만드느냐의 경쟁이 시작됐다.
  • 어느 한 기업이 압도적으로 치고 나가는 시대는 끝났다. 계속해서 새로운 모델이 쏟아져 나오고 환각 현상과 신뢰성 문제도 계속된다. 대형 언어모델(LLM) 기반 AI를 포기해야 할 수도 있다.
  • 오픈AI o3가 아직 공개되지 않은 상태라 오픈AI의 패배를 이야기하기는 이르다는 지적도 있다.
  • 오픈소스로 풀렸기 때문에 새로운 게임 체인저가 등장할 수도 있다.
  • 뉴욕타임스는 “미국이 오픈소스 기술을 억제하면 중국이 상당한 우위를 차지하게 될 수도 있다”고 경고했다. 미국 기업들이 무임승차할 수도 있겠지만 장기적으로 중국이 기술을 주도하게 될 거라는 이야기다.
  • 규모가 아니라 최적화가 핵심이다. 게임의 규칙이 달라졌다.

관련 글

첫 댓글

  1. Nice post. I was checking continuously this blpg annd I am impressed!
    Exttremely helpful information specially the clpsing part
    :) I maintain succh info much. I was looking for this certain information forr a long time.

    Thqnk you and best of luck.

답글 남기기

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다