미래 포럼

제목 : '딥시크'와 '딥 리서치' 등장의 의미..."기업들은 더 이상 똑같은 모델 사용하지 않을 것"

미래 기술 (Technology)
작성일 : 2025-02-09 22:38
조회수 : 58
작성자 : admin
(사진=셔터스톡)(사진=셔터스톡)

최근 인공지능(AI)의 최대 이슈로 떠오른 '딥시크-R1'과 오픈AI의 AI 에이전트 '딥 리서치'가 AI를 새롭게 정의했으며, 검색 증강 생성(RAG)과 증류, 미세조정 등의 기술로 기업이 모두 같은 모델을 사용하는 일은 없어질 것이라는 예측이 등장했다.

맷 마샬 벤처비트 설립자는 6일(현지시간) 칼럼을 통해 최근 두가지 모델이 개발자와 기업 환경을 재편하고 있으며, 이 때문에 RAG와 증류, 감독 미세조정(SFT), 강화 학습(RL) 등의 기술을 제대로 사용하는 것이 더 중요해졌다고 소개했다.

우선 딥시크의 놀라운 성과에 대한 흥분이 가라앉기 시작하면, 개발자와 기업은 그것이 자신에게 어떤 의미를 갖는지 고려해야 한다고 전했다. 가격과 성능은 물론, 환각 위험과 데이터 등에서 이런 기술이 어떤 의미를 가지는지 파악해야 한다는 것이다.

결론은 이들의 기술로 인해 기업이 각자 도메인에 맞는 고성능 모델을 구축하기 쉬워짐에 따라, 앞으로는 같은 모델을 사용하는 것이 비효율적이라는 분석이다.

아래는 칼럼의 주요 내용이다.

■ 증류를 통한 소형모델이 대세

딥시크가 의미하는 핵심은 'o1'보다 훨씬 저렴한 비용으로 첨단 추론 모델을 제공한다는 점이다. 실행 비용은 o1의 약 30분의 1에 불과하며, 폐쇄형 모델과 달리 추론 단계에 대한 완전한 투명성을 제공한다. 개발자는 딥시크를 증류와 미세 조정, RAG 등을 통해 조정, 큰 비용을 들이지 않고도 맞춤화된 첨단 AI 모델을 구축할 수 있다는 의미다.

특히, 증류는 강력한 도구로 떠오르고 있다. 딥시크-R1을 '교사 모델'로 사용, 회사는 R1의 뛰어난 추론 기능을 구현한 더 작은 도메인별 모델을 만들 수 있다. 이런 작은 모델은 기업의 미래다. 현재 R1은 대부분 회사의 업무에는 너무 과할 수 있다.

딥시크는 '라마'나 '큐원' 등 오픈 소스 모델을 활용한 증류 버전도 출시했다. 이런 작은 모델이 특정 작업에 최적화될 수 있으며, 더 작고 빠른 모델에 대한 추세는 가속화될 것이다.

샘 위테빈 ML 개발자는 "이제 세상은 여러 모델을 사용하는 쪽으로 이동하기 시작했다. 항상 하나의 모델만 사용하는 것은 아니다"라며 "제미나이 플래시나 GPT-4o 미니와 같은 모델처럼 매우 저렴하고 작은 모델은 80% 이상의 사례에서 매우 잘 작동한다"라고 말했다.

■ 전문 도메인 및 자체 데이터 있는 경우에는 SFT

증류 후 모델이 자신의 회사에 적절하게 만드는 데에는 몇가지 방법이 있다. 그중 회사가 매우 구체적인 도메인에 해당하고 세부 정보가 웹이나 책에 없어 대형언어모델(LLM)의 학습 자료가 많지 않은 경우, SFT를 사용해 고유한 데이터를 학습할 수 있다. 예를 들어 사양이나 프로토콜, 규정이 널리 알려지지 않은 선박 컨테이너 건조 산업이 여기에 해당한다.

딥시크는 불과 수천개의 질문-답변 데이터 세트로 이를 잘 수행할 수 있음을 보여줬다. 크리스 헤이 IBM 엔지니어도 수학 관련 데이터셋을 사용해 작은 모델을 미세 조정, 빠른 응답을 달성하는 방법을 시연했다. 이는 o1보다 더 나은 성과를 거뒀다

■ 톤 조정과 개성 부여를 위한 RL

특정 선호도를 모델에 훈련하려는 회사는 RL이 적당하다. 예를 들어, 고객 지원 챗봇의 톤과 뉘앙스를 간결하면서도 공감적으로 들리게 만드는 것이 여기에 해당한다. 또 모든 모델의 성능이 발전함에 따라, 챗봇의 개성이 중요하다는 의견도 등장하고 있다.

하지만 SFT와 RL는 일반 회사에서는 구현하기 어려울 수 있다. 또 갑자기 모델에 특정 도메인 데이터를 제공하거나 개성을 부여하면, 이외의 도메인이나 지정한 스타일 외의 작업을 수행하는 데 애를 먹을 수 있다.

■ 대부분 회사는 RAG로 충분

따라서 대부분의 회사에서는 RAG가 가장 쉽고 안전한 경로다. RAG는 자체 데이터베이스에 포함된 독점 데이터로 모델을 구축할 수 있는 비교적 간단한 프로세스로, 가장 관련성 있는 콘텐츠만 찾는 데 매우 능숙해졌다.

RAG 전문 벡터라(Vectara)의 연구에 따르면, 여전히 딥시크의 환각 빈도는 14%, 오픈AI의 'o3'는 8%다. RAG는 이런 문제를 해결하는 데 도움이 된다.

특히 최근에는 RAG 구현 프로세스가 간단해진 것이 장점이다.

■ 딥 리서치는 RAG 장점을 극대화한 것

오픈AI의 딥 리서치는 웹을 검색하고 고도로 맞춤화된 연구를 생성함으로써 RAG를 새로운 수준으로 끌어올릴 수 있다. 또 그 결과를 다시 회사 데이터에 추가할 수 있다.

'에이전트 RAG'라고 하는 이 기능을 통해 AI 시스템은 인터넷에서 최고의 결과를 자율적으로 찾아, 지식 검색과 그라운딩의 새로운 차원을 제공한다.

딥 리서치는 구글의 '딥 리서치'와 퍼플렉시티 등과 비슷하지만, 특히 뛰어난 사고 사슬(CoT) 추론으로 정확도에서 차별화를 꾀했다.

하지만 여전히 문제는 사라지지 않는다. 아므르 아와달라 벡터라 CEO는 "아무리 최고의 추론 모델이라고 해도, 답이 사실인지는 분명하지 않다"라며 "다양한 커뮤니티에서 딥시크는 다른 모델보다 좋을지 모르지만, 여전히 많은 환각을 겪고 있다는 증언이 나오고 있다"라고 말했다.

결국, 모델이 내놓은 답은 인간이 출처를 확인해야 한다는 말이다.

167814_182780_5336.png(사진=오픈AI)

■ 추론 비용은 결국 0이 될 것

딥시크의 의미 중 가장 두드러진 것은 가격 인하다. 시간이 지남에 따라 비용이 적어질 것으로 예상했지만, 이렇게 빨리 이뤄질지 예상한 사람은 거의 없다.

특히 진정한 게임 체인저는 추론 비용이다. 딥시크 추론 비용은 토큰당 o1이나 o3 약 30분의 1이다. 아와달라 CEO는 "오픈AI와 앤트로픽, 구글은 마진을 최소 90%까지 줄여야 한다. 현재 가격으로는 경쟁력을 유지할 수 없다"라고 말했다.

비용은 계속 낮아질 것이다. 다리오 아모데이 앤트로픽 CEO도 모델 개발 비용이 매년 약 4배씩 계속 낮아지고 있다고 말했다. 아시옥 스리바스타바 인튜이트 CDO는 "시간은 걸리겠지만, 비용이 결국 0이 될 것은 확실하다"라고 말했다.

이런 비용 절감은 개발자와 기업에만 이로운 것이 아니다. 수십억달러가 없어도 혁신을 꾀할 수 있든 점으로, 소규모 회사와 개별 개발자에게 영감을 주고 있다. 여기에 스리바스타바 CDO는 "앞으로는 모델을 AI 전문가뿐만 아니라 모든 비즈니스 전문가가 사용할 수 있다는 것이 더 중요하다"라고 말했다.

결국 딥시크가 주요 AI 연구실만이 혁신할 수 있다는 신화를 깨뜨렸다는 것이다. 수년 동안 방대한 리소스와 고급 인력을 갖춘 오픈AI와 구글 같은 회사만이 첨단 모델을 구축할 수 있다는 믿음을 뒤집었다.

■ 그래서 다시 '데이터'

딥시크와 딥 리서치는 강력하지만, 이는 궁극적으로 데이터 품질에 달려 있다. 데이터는 지난 9년 동안 AI 시대의 핵심이었지만, 딥시크로 인해 절대적인 핵심이 됐다.

힐러리 패커 아메리칸 익스프레스 CTO는 "솔직히 말해, 우리에게 '아하' 순간은 데이터였다. 데이터 검증과 정확성이 지금 생성 AI의 성배"라고 말했다.

기업이 노력을 집중해야 하는 부분은 바로 여기다. 결국 성공적인 AI 애플리케이션을 만드는 것은 깨끗하고 잘 구조화된 데이터다. RAG를 사용하든 SFT나 RL을 사용하든, 데이터의 품질이 모델의 정확도와 신뢰성을 결정한다.

물론, 딥시크가 모델을 훈련하는 데 사용한 데이터는 여전히 의문이다. 하지만 이는 메타의 '라마'와 같은 다른 오픈 소스와 다르지 않다. 기업 사용자는 RAG로 모델을 미세 조정하는 식으로 문제를 완화할 수 있다. 그리고 이는 실제로 오픈 소스 확대에 큰 도움이 됐다.

따라서 많은 회사가 중국 회사라는 위험에도 불구하고 딥시크 모델을 사용하리라는 것이라는 것은 분명하다. 하지만 금융이나 의료와 같은 회사가 딥시크 모델을 사용하는 데 신중하리라는 것도 사실이다.

■ 기업 AI의 미래는 개방적·저렴·데이터 중심

딥시크와 딥 리서치는 단순한 신형 모델이 아니다. 기업이 매우 저렴하고 유능하며 자체 데이터와 접근 방식을 기반으로 하는 도메인별 모델을 앞으로 쏟아낼 것이라는 근본적인 변화의 신호다.

이런 강력한 도구가 개방됐는데, 이를 활용하지 않으면 뒤처질 위험이 있다. 또 데이터를 잘 큐레이션하고, RAG나 증류와 같은 기술을 잘 활용해 사전 훈련 단계를 뛰어넘는 것이 필요하다.

결국, 데이터를 올바르게 활용하는 기업이 차세대 AI 혁신을 선도하게 될 것이다.

정리=임대준 기자 ydj@aitimes.com
출처 : AI타임스(https://www.aitimes.com)