[슬로우리포트] 골드러시에 곡괭이 팔던 시대는 끝났다… 챗GPT와 맞먹는 성능에 가격은 30분의 1, 핵심은 최적화. (⌚7분)
한동안 오픈AI가 업계 지존이었다. 그런데 게임 체인저가 될 수도 있는 ‘뉴 페이스’가 등장했다. 중국의 한 인공지능 스타트업이 만든 딥시크(DeepSeek)가 세상을 발칵 뒤집어 놓았다.
그래픽 칩을 만드는 엔비디아 주가가 17% 폭락한 걸 비롯해 마이크로소프트와 알파벳(구글) 등도 충격을 피할 수 없었다. “인공지능의 스푸트니크 순간(AI’s Sputnik moment)”이라는 평가도 나온다.

이게 왜 중요한가.
- 1957년 10월 소련이 스푸트니크 1호를 쏘아 올렸을 때 미국은 엄청난 충격에 빠졌다. 기술력에서 훨씬 뒤쳐져 있다는 평가를 받던 소련이 단숨에 미국을 따라잡은 사건이었다.
- 딥시크는 일단 오픈AI와 견줄 정도의 놀라운 성능을 보여주고 있다. AI 기업들이 엔비디아 칩을 못 구해서 난린데 딥시크는 저가형 칩으로 해결했다.
- 5억 달러를 주고 만드는 AI를 500만 달러에 만들 수 있다면? 완전히 게임의 법칙이 달라진다. AI는 규모의 경쟁이라는 그동안의 믿음이 깨지고 있다.
- 트럼프 정부가 오픈AI와 함께 AI 인프라 구축에 5000억 달러를 쏟아 붓겠다고 발표한 뒤라 충격이 더 컸다. 미국은 그동안 엔비디아 칩 수출을 제한하면서 중국을 견제했지만 경쟁의 양상이 달라졌다.
- 최신 AI 기술은 상당 부분 오픈소스로 공개돼 있다. 무임승차라고 할 수는 없지만 딥시크 같은 후발 주자들이 시행착오를 줄일 수 있는 환경이다.
- 참고로 스푸트니크 모멘트가 불러온 미국의 열등감은 1958년 NASA(미국 항공우주국)를 만들고 1969년 7월 달 착륙에 성공한 뒤에야 극복됐다.

핵심 키워드 여덟 가지.
- 엔비디아의 비싼 그래픽 카드를 꼭 써야 하는 건 아니다. 훨씬 더 적은 비용으로 가능할 수도 있다.
- 세상의 모든 지식을 다 때려넣어야 하는 것도 아니다. 대형 언어모델말고 다른 길도 있다.
- 아직은 딥시크가 챗-GPT보다 더 뛰어나다고 볼 수는 없다. 이제 겨우 견줄 만한 정도라고 할 수 있지만 앞으로는 어떨지 모른다.
- 오픈소스가 폐쇄형 모델보다 가능성이 많다.
- 빅테크의 독점적 성장 모델에 근본적인 의문이 제기되고 있다. 돈 풀어서 되는 문제가 아니다.
- 값싼 AI의 시대가 온다. 규모가 아니라 최적화가 핵심이다.
- ‘적당히 듣기 좋은 말(sounding good)’을 늘어놓는 걸로는 부족하고 ‘더 잘 생각하는(thinking better)’ 추론 능력이 경쟁력이다.
- 미국과 중국의 AI=안보 경쟁이 더 격화될 가능성이 있다.
딥시크는 어떻게 다른가.
- 딥시크R1은 이미 오픈AI의 GPT-o1을 뛰어넘었다는 평가를 받고 있다.
- 딥시크를 만든 하이플라이어(High-Flyer)는 전혀 알려지지 않은 기업이었다. CEO는 1985년생 투자 관리 회사 출신의 랑웬펑(Liang Wenfeng)이다.
- 메타의 라마3(Llama 3)와 비교하면 왜 딥시크를 게임 체인저라고 하는지 쉽게 이해할 수 있다.
- 라마3는 H100칩을 1만6000개 이상 썼는데 딥시크R1은 H100보다 훨씬 성능이 떨어지는 H800을 2048개 쓰고도 비슷한 성능을 낸다. 훈련 시간도 라마3는 3084만 GPU시간인데 딥시크R1은 278만 GPU시간으로 10분의 1 수준이다. 비용도 라마3는 5억 달러 이상인데 딥시크R1은 557만 달러에 그쳤다.
- 미국 정부는 H100은 중국 수출을 금지했지만 H800은 허용했다. H800 정도면 위협이 안 될 거라고 봤기 때문이다. 그런데 그 H800으로 오픈AI에 맞먹는 성능을 냈다면 굴욕을 넘어 충격과 공포가 아닐 수 없다.
- 딥시크가 구체적으로 어떤 종류의 칩을 얼마나 보유하고 있는지 공개하지 않고 있기 때문에 온갖 추측이 오가지만 대부분 기술이 오픈소스로 공개돼 있기 때문에 검증은 어렵지 않다.
딥시크의 스펙.
- 딥시크의 훈련 비용은 560만 달러다. 실리콘밸리에서는 전문가 한 사람 연봉 정도밖에 안 되는 금액이다.
- 참고로 다리오 아모데이(앤트로픽 CEO)에 따르면 클로드의 훈련 비용은 1억~10억 달러에 이른다. 오픈AI의 GPT-4 훈련 비용도 1억 달러가 넘는 것으로 알려졌다.
- 대략 GPT-4와 비교하면 파라미터는 3분의 1, 훈련 비용은 20분의 1, 훈련 시간도 절반 이하다.
- 기존의 AI 모델은 문장을 조각(Token)으로 나눠 읽는데 딥시크R1은 문장 전체를 읽어서 처리하기 때문에 생성 속도가 두 배 더 빠르고 답변 정확도도 90%에 이른다.

딥시크의 혁신.
- 딥시크의 핵심 기술은 매우 구체적으로 공개돼 있다.
- 다른 대형 언어모델(LLM) 기반 AI는 ‘지도학습(Supervised Fine-Tuning, SFT)’과 피드백 기반 강화학습(Reinforcement learning by Human Feedback)’ 기법으로 훈련을 시킨다. 데이터를 주고 정답을 찾는 능력을 키운다. 100장의 고양이 사진과 100장의 원숭이 사진을 보여주면서 차이를 구별하게 만드는 방식이다.
- 딥시크는 인간의 개입 없이 ‘강화학습’으로 성능을 끌어올렸다. 굳이 비교하자면 어린아이가 수없이 넘어지면서 자전거를 배우는 것처럼 행동(액션)을 시도하고 그에 따른 결과(보상)를 얻는 과정을 반복하며 최적의 패턴을 찾는 방식이다.
- 1단계는 추론 기반 강화학습이다. 논리 추론과 문제 해결 능력을 키운 뒤 데이터에서 패턴을 발견하고 추론의 법칙을 끌어낸다.
- 2단계는 시나리오 기반 강화학습이다. 예측 불가능한 다양한 상황에서 어떤 행동을 해야 최적의 결과를 얻을 수 있을지 결정하는 전략(policy)을 설계한다.
- 증류(distillation) 방식을 활용했다. 대형 모델이 생성한 데이터를 소형 모델에 학습시킬 수 있다. 비용과 자원을 크게 줄일 수 있다.

딥시크의 ‘아하 모멘트’.
- “잠깐만요. 이 지점을 아하 모멘트라고 부를 수 있겠네요.”
- 딥시크가 공개한 기술 논문에서 가장 충격적인 대목은 딥시크R1이 ‘아하 모멘트’를 거치면서 스스로 진화했다는 사실이다.
- 반복적인 자기 검증(self-verification)과 반성(reflection) 반복적인 성찰과 자기 교정 같은 인간의 문제 해결 프로세스를 흉내냈다. 추론 모델의 새로운 가능성을 열었다는 평가를 받는다.

딥시크의 확장성.
- 이원재(경제평론가)는 딥시크의 차별화된 인프라를 두 가지로 꼽았다. 첫째, 미친 사람들과 둘째, 미친 듯이 놀아볼 수 있는 자원. 여기에는 세 가지 포인트가 있다.
- 첫째, 딥시크는 대학 졸업 2년 이하 경력자들만 채용했다. 경험이 장애물이 된다고 봤기 때문이다.
- 둘째, 제약이 혁신을 만들었다. 엔비디아 칩을 마음껏 살 수 있었으면 달랐을 수도 있다.
- 셋째, 빅테크의 폐쇄형 모델에 맞선 오픈소스 문화가 혁신의 동력이었다.
- 얀 르쿤(뉴욕대 교수)은 “중국이 미국을 넘어선 것도 아니라 오픈소스 모델이 폐쇄적 모델을 넘어선 것이라고 봐야 한다”고 지적했다. 한상기(테크프론티어 대표)는 “엄청난 자본을 투입하는 폐쇄 기업에 대해 오픈소스 진영이 얼마든지 경쟁할 수 있으며, 다양성과 집단 지능을 발휘하는 오픈 소스 진영의 리더십이 결코 꺾이지 않을 것이라는 증거를 보여준 사례”라고 설명했다.
의혹과 논란.
- 수입 가능한 H800을 썼다고 주장하고 있지만 실제로는 중국으로 수출이 금지된 H100을 비공식적인 루트로 들여와 활용했을 거라는 의혹이 있다.
- 실제로 인건비와 전기 요금 등을 감안하면 550만 달러보다 훨씬 많은 5억 달러에 이를 거라는 분석도 있다. 그래도 100억 달러가 넘어서는 빅테크 기업들과 비교하면 파격적인 효율이다.
- 오픈AI의 데이터를 훔쳐갔다는 논란도 있다. 데이빗 색스(미국 백악관 암호화폐 차관)는 “딥시크가 오픈AI 모델에서 지식을 추출했다는 상당한 증거가 있다”고 말했다. 저작권 논란에서 자유롭지 못한 오픈AI가 딥시크에 저작권을 주장하는 것도 아이러니한 일이다.
- 천안문 등 민감한 주제에 제대로 답변하지 못한다. 중국 정부의 검열을 의식한 것 아니냐는 비판이 나온다.
- 딥시크도 성능을 끌어올리려면 지금보다 훨씬 더 많은 칩이 필요할 수 있다. 로이터에 따르면 하이플라이어는 H100 칩을 5만 개 정도 보유하고 있다고 한다.
- 미국 정부는 군인들의 딥시크 사용을 금지했다.
- 딥시크에 사이버 공격이 집중되고 있다. 지난 27일에는 일시적으로 회원 가입을 중단하기도 했다.
개인정보 이슈도 있다.
- 중국 기업이라 개인정보 규제를 거의 받지 않는다.
- IP 주소는 물론이고 장치 정보와 키보드 입력 패턴, 쿠키 값까지 긁어갈 수 있다.
- 중국에 있는 서버에 정보를 저장하는데 옵트아웃도 없고 언제까지 저장하고 어떻게 활용한다는 안내도 없다.
- (딥시크를 쓸 것이냐 말 것이냐는 부차적인 문제다. 딥시크가 어떤 변화를 불러올 것이냐가 더 중요한 문제다.)

딥시크가 바꿔놓을 것들.
- 린드로 폰 베라(허깅페이스 연구 책임자)는 더버지와 인터뷰에서 “그동안 빅테크 기업들은 자신들이 가장 위대한 일을 하고 있다고 믿게 만들어서 가치를 유지했다”면서 “더 많은 돈을 끌어모으려고 전망을 부풀렸을 수도 있다”고 지적했다.
- 케빈 루즈(뉴욕타임스 기술 칼럼니스트)는 “딥시크의 혁신은 진짜”라며 “실리콘밸리의 두 가지 믿음이 깨졌다”고 평가했다.
- 첫째, 최첨단 AI 모델을 구축하려면 강력한 칩과 대규모 데이터센터가 필요하다는 가정을 깨뜨렸다.
- 둘째, 빅테크가 아니면 안 된다는 믿음도 깨졌다.
- 중국이 뒤처져 있다는 믿음도 깨졌고 그동안의 혁신이라는 게 한 달이면 복제할 수 있는 수준이라는 사실도 확인됐다. 군비 경쟁(arm race)과도 같았던 “클수록 좋다(bigger is better)”는 믿음도 깨졌다.
- 딥시크가 가격 경쟁을 촉발시킬 거라는 전망도 나온다. 오픈AI는 o3 출시를 서두르고 있다.
- 존 빌라세너(UCLA 교수)는 “AI 수출 규제가 오히려 중국의 혁신을 촉진했다”고 지적했다.
- 에너지 수요 예측이 달라져야 할 거라는 전망도 나온다. 아르빈드 라비쿠바(UT오스틴 분석가)는 “30년짜리 가서 발전소를 짓기 전에 AI 컴퓨팅의 효율 문제를 다시 살펴봐야 한다”고 조언했다. 2028년이면 미국의 데이터센터가 전력 생산의 최대 12%를 차지할 거라는 전망이 있었지만 더 줄어들 수도 있다. AI의 효율성이 높아지는 것만큼 이용이 늘어나서 여전히 더 많은 컴퓨팅 자원을 소비하게 될 거라는 전망도 있다.
- 악시오스는 “여전히 엔비디아 칩이 필요하지만 모두가 생각했던 것만큼 많이 필요하지 않을 수도 있다”고 지적했다.
어떻게 될까.
- 오픈AI가 AI의 위워크가 될 수도 있다는 경고가 있었다.
- 챗GPT프로는 이용료가 월 200달러인데 여전히 적자를 보고 있다. 비용은 걷잡을 수 없이 느는데 기대수준은 갈수록 높아지고 요금을 올리기는커녕 낮춰야 할 상황이다.
- 게리 마커스(뉴욕대 교수)는 “엔비디아도 심각한 타격을 입을 수 있다”고 경고했다. 골드러시 한복판에서 곡괭이을 팔아 부자가 됐지만 곡괭이가 그렇게 많이 필요하지 않다는 주장이 나왔다.
- 바이든 정부의 칩스법도 역풍을 맞게 될 수 있다. 고성능 그래픽 칩은 여전히 중요하지만 칩이 많다고 해서 더 좋은 성능의 AI를 만들 수 있는 게 아니라는 이야기다. 이제 누가 더 싸게 만드느냐의 경쟁이 시작됐다.
- 어느 한 기업이 압도적으로 치고 나가는 시대는 끝났다. 계속해서 새로운 모델이 쏟아져 나오고 환각 현상과 신뢰성 문제도 계속된다. 대형 언어모델(LLM) 기반 AI를 포기해야 할 수도 있다.
- 오픈AI o3가 아직 공개되지 않은 상태라 오픈AI의 패배를 이야기하기는 이르다는 지적도 있다.
- 오픈소스로 풀렸기 때문에 새로운 게임 체인저가 등장할 수도 있다.
- 뉴욕타임스는 “미국이 오픈소스 기술을 억제하면 중국이 상당한 우위를 차지하게 될 수도 있다”고 경고했다. 미국 기업들이 무임승차할 수도 있겠지만 장기적으로 중국이 기술을 주도하게 될 거라는 이야기다.
- 규모가 아니라 최적화가 핵심이다. 게임의 규칙이 달라졌다.
Nice post. I was checking continuously this blpg annd I am impressed!
Exttremely helpful information specially the clpsing part
:) I maintain succh info much. I was looking for this certain information forr a long time.
Thqnk you and best of luck.