본문 바로가기

IT/IT 정보

딥시크, 챗GPT를 넘어선 비결은?

반응형

 

최근 IT 업계에서 큰 화제를 모으고 있는 중국의 인공지능 스타트업 딥시크(DeepSeek)에 대해 들어보셨나요? 딥시크는 애플 앱 스토어에서 챗GPT를 제치고 다운로드 1위를 차지하며 많은 사람들의 주목을 받고 있습니다.

 

딥시크가 어떻게 챗GPT를 넘어설 수 있었는지, 그리고 그들이 어떤 기술적 성과를 이루었는지에 대해 자세히 알아보겠습니다.

 


딥시크의 성공 배경

딥시크가 이렇게 빠르게 성장할 수 있었던 배경에는 여러 가지 요인이 있습니다.

 

우선, 딥시크는 '딥시크-V3'라는 인공지능 모델을 개발하면서 비용을 효율적으로 관리했습니다.

 

이 모델의 개발에는 557만6000달러 즉, 약 78억8000만원이 소요되었는데, 이는 엔비디아의 'H800 GPU'를 시간당 2달러에 2개월 동안 빌려 사용한 결과입니다. 이 비용은 메타가 최신 AI 모델 라마(Llama)3를 훈련하는 데 사용한 비용의 10분의 1에 불과합니다.

 

딥시크의 이러한 비용 절감 전략은 고성능 AI 칩의 사용이 제한된 상황에서도 효율적인 개발이 가능하다는 것을 보여주었습니다.

반응형


딥시크의 기술적 성과

출처. 젠스파크 이미지 생성

 

딥시크의 'R1' 모델은 챗GPT의 'o1' 모델과 비교했을 때 일부 성능 테스트에서 더 나은 결과를 보였습니다. 예를 들어, 미국 수학경시대회인 AIME 2024 벤치마크 테스트에서 'R1'은 79.8%의 점수를 얻어 'o1'의 79.2%를 넘어섰습니다.

 

또한 코딩 부문에서는 라이브벤치 평가 결과 'R1'이 65.9%의 정확도를 기록해 'o1'의 63.4%보다 높았습니다. 이러한 성과는 딥시크의 기술력이 결코 뒤처지지 않음을 보여줍니다.


오픈 소스 모델의 힘

딥시크의 성공은 오픈 소스 모델의 강력함을 입증하기도 했습니다. 딥시크는 오픈 소스 모델을 활용하여 독점 모델에 비해 더 나은 성과를 거두었습니다. 메타의 수석 AI 과학자 얀 르쿤은 "중국이 AI에서 미국을 능가했다는 것은 아니고 오픈 소스 모델이 독점 모델을 능가하고 있다는 것"이라며 딥시크의 성과를 높이 평가했습니다. 이는 AI 개발에 있어 오픈 소스의 중요성을 다시 한번 일깨워 주는 사례입니다.

실리콘밸리의 반응

출처. 젠스파크 이미지 생성

 

딥시크의 성공은 실리콘밸리에도 큰 충격을 주었습니다. 엔비디아, 마이크로소프트, 메타 등 AI 관련 회사들은 딥시크의 성과가 주가에 어떤 영향을 미칠지 주목하고 있습니다. 마이크로소프트의 CEO 사티아 나델라는 딥시크의 모델이 "오픈 소스 모델이 추론 시간 컴퓨팅에 효과적이고 슈퍼 컴퓨팅에도 효율적이라는 점에서 매우 인상적"이라고 언급하며 중국의 발전을 심각하게 받아들여야 한다고 강조했습니다.

 


딥시크의 글로벌 영향력

딥시크의 성공은 AI 산업에 큰 변화를 가져올 것으로 예상됩니다.

 

퍼플렉시티의 CEO 아라빈드 스리니바스는 아래와 같이 발표했습니다.

"딥시크의 R1을 퍼플렉시티 미국 데이터 센터에 도입하고 모두를 위해 무료로 제공할 것"

 

 

 

그는 R1이 'o1' 대비 25배 이상 저렴할 뿐만 아니라 'o3 미니'보다 가성비가 뛰어나다는 점을 강조하며 "이건 미쳤다"고 호평했습니다. 이러한 글로벌 반응은 딥시크의 영향력이 얼마나 큰지를 보여줍니다.


미래의 AI 산업 전망

딥시크의 성공은 AI 산업의 미래에 대해 많은 것을 시사합니다. AI 개발에 있어 비용 효율성과 오픈 소스 모델의 활용이 얼마나 중요한지를 보여주었습니다. 또한, 고성능 칩의 제한적인 사용에도 불구하고 뛰어난 성과를 거둘 수 있다는 것을 입증했습니다. 앞으로 AI 산업은 더 많은 변화와 혁신을 겪을 것으로 예상되며, 딥시크와 같은 스타트업들이 그 중심에 설 것입니다.

오늘은 이렇게 딥시크의 성공 비결과 그들이 AI 산업에 미친 영향을 살펴보았습니다.

 

앞으로도 AI 산업의 발전을 주목하며, 딥시크와 같은 혁신적인 기업들이 어떤 변화를 가져올지 기대해봅시다.

반응형