이 강화 학습을 통해 AI를

test 25-01-31 04:56 66 0

V3모델을 바탕으로 학습시킨 R1 제로는 일반적으로 쓰이는 지도 학습 없이 강화 학습을 통해 AI를 공부시켰다.

지도 학습의 대표적 사례는 2016년 이세돌 9단과의 바둑 대국에서 이긴 AI 알파고로 기존 수만 장의 기보를 공부하게 해 다음 수를 추론하도록 훈련됐다.

이후 개발된 알파고 제로는 상황 설명.

이들은 딥시크가 자체 AI모델V3를 기존 IT 기업보다 저비용으로 개발하는 과정에서 오픈AI의 데이터를 무단으로 활용했다고 주장한다.

오픈AI는 챗GPT 학습 데이터를 개발하기 위해 천문학적인 비용을 들인 것으로 알려졌다.

딥시크 측은V3를 만드는데 558만달러(약 80억5700만원)가 들었다고 밝혔다.

지난해 말 공개된V3(대규모 언어모델)의 개발비용은 557만6000달러였다.

오픈AI 등 미국의 주요 AI모델은 개당 수천만 원에 달하는 엔비디아의 H100 등 첨단 AI칩을 사용한다.

그러나 미국의 AI칩 대중국 수출 제한으로 첨단 AI 칩 사용이 제한된 딥시크는 R1에서 저사양인 H800을 사용했다.

딥시크는 지난달 공개한 AI모델V3개발에 557만6000달러(약 80억원)가 들었다고 밝혔다.

이 비용 대부분은 AI 학습에 들어간 엔비디아의 저가형 AI 반도체 비용이다.

초기 AI모델개발 비용 등 기초 연구비는 포함되지 않았다.

딥시크가 오픈AI의 데이터를 무단 도용해 AI를 개발했다는 의혹도 있다.

중국 IT대기업 알리바바는 지난 29일 새로운 AI모델‘Qwen(큐원) 2.

5 맥스’를 출시하며 “오픈AI의 GPT-4o(포오), 딥시크의V3, 메타의 라마 3.

1을 거의 모든 영역에서 능가한다”고 발표했다.

틱톡의 모회사인 중국의 바이트댄스는 자사 주력 AI모델을 업그레이드한 ‘도우바오-1.

‘AI 게임’에 미국이 유일한 주자가 아님을 알리는 경종인 것은 분명하다”고 했다.

☞딥시크(DeepSeek) 2023년 중국 저장성 항저우시에 자본금 1000만위안(약 19억9000만원)으로 설립된 인공지능(AI) 스타트업이다.

오픈AI의 챗GPT처럼 사용자 질문에 답하는 생성형 AI모델‘V3′ ‘R1′ 등을 개발해 출시했다.

딥시크가 최근 선보인 AI모델은 두 가지로, 지난해 12월 대규모 언어모델(LLM)V3를 공개했고 지난 20일에는 R1이라는 추론모델을 선보였다.

딥시크의 충격으로 AI랠리가 흔들린 후 월가는 지난 2년간 엔비디아와 매그니피센트 세븐 위주로 상승해온 미국 증시에서 올해 다각화가 좀 더 진전될 것으로.

알리바바 클라우드는 29일 AI모델'큐원(Qwen) 2.

5-맥스'를 출시하며 “20조 개의 토큰을 넘는 데이터로 사전 훈련을 했고, 오픈AI의 GPT-4o, 딥시크-V3, 메타의 라마(LLaMA) 3.

1-405B를 거의 모든 영역에서 능가한다”고 주장했다.

딥시크가 미국 빅테크 기업의 100분의 1 수준의 개발비로 AI모델을 선보이며.

딥시크는V3 모델을 훈련하는 데 560만 달러(약 80억원)를 지출했다고 밝혔는데, 이는 메타의 최신 AI 모델인 ‘라마3’ 모델을 훈련하는 데 사용한 비용의 10분의 1 수준이다.

빅테크 업계는 초반 ‘흥미롭다’는 반응에서 딥시크를 경계하는 반응으로 분위기가 180도 바뀌었다.

2023년 11월 딥시크는 첫 번째 오픈소스 AI모델‘딥시크 코더’를 공개했고, 지난해 5월에는 한층 더 개선된 ‘딥시크-V2’를 출시했다.

이어 12월에는 딥시크-V3를, 지난 22일에는 딥시크-R1을 연이어 공개했다.

딥시크-R1은 애플 앱스토어, 구글 플레이스토어에서 무료앱 1위를 차지했다.

댓글목록

등록된 댓글이 없습니다.

수정 삭제 이전 목록 다음 답변 글쓰기