![](https://tistory1.daumcdn.net/tistory_admin/blogs/image/category/new_ico_1.gif)
[1 Paper 2 Week] DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning![](https://tistory1.daumcdn.net/tistory_admin/blogs/image/category/new_ico_1.gif)
Cori
요즘 갑자기 등장한, DeepSeek라는 모델. 오픈소스 모델이면서 ChatGTP4-o의 성능을 뛰어넘고, 모델 학습에 들어간 비용은 훨씬 저렴하다는 주장과 함께 뜨거운 감자로 부상하고 있다. 플레이스토어 및 앱 스토어에서도 사용 가능하고, 실제 써 본 사람 말에 의하면 괜찮다고 한다.. (2월 6일 현재 ChatGPT를 표절하고 있다는 이야기가 떠돌고 있지만..) 어떻게 저렴한 비용으로 ChatGPT4-o와 비슷한, 혹은 더 뛰어난 성능을 보일 수 있는지 궁금해져 해당 논문 'DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning'을 살펴보고, 간단하게 정리해보려 한다.Abstract해당 논문은 DeepSeek..