Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

Llama-Nemotron: Efficient Reasoning Models

Created by
  • Haebom

저자

Akhiad Bercovich, Itay Levy, Izik Golan, Mohammad Dabbah, Ran El-Yaniv, Omri Puny, Ido Galil, Zach Moshe, Tomer Ronen, Najeeb Nabwani, Ido Shahaf, Oren Tropp, Ehud Karpas, Ran Zilberstein, Jiaqi Zeng, Soumye Singhal, Alexander Bukharin, Yian Zhang, Tugrul Konuk, Gerald Shen, Ameya Sunil Mahabaleshwarkar, Bilal Kartal, Yoshi Suhara, Olivier Delalleau, Zijia Chen, Zhilin Wang, David Mosallanezhad, Adi Renduchintala, Haifeng Qian, Dima Rekesh, Fei Jia, Somshubra Majumdar, Vahid Noroozi, Wasi Uddin Ahmad, Sean Narenthiran, Aleksander Ficek, Mehrzad Samadi, Jocelyn Huang, Siddhartha Jain, Igor Gitman, Ivan Moshkov, Wei Du, Shubham Toshniwal, George Armstrong, Branislav Kisacanin, Matvei Novikov, Daria Gitman, Evelina Bakhturina, Jane Polak Scowcroft, John Kamalu, Dan Su, Kezhi Kong, Markus Kliegl, Rabeeh Karimi, Ying Lin, Sanjeev Satheesh, Jupinder Parmar, Pritam Gundecha, Brandon Norick, Joseph Jennings, Shrimai Prabhumoye, Syeda Nahida Akter, Mostofa Patwary, Abhinav Khattar, Deepak Narayanan, Roger Waleffe, Jimmy Zhang, Bor-Yiing Su, Guyue Huang, Terry Kong, Parth Chadha, Sahil Jain, Christine Harvey, Elad Segal, Jining Huang, Sergey Kashirsky, Robert McQueen, Izzy Putterman, George Lam, Arun Venkatesan, Sherry Wu, Vinh Nguyen, Manoj Kilaru, Andrew Wang, Anna Warno, Abhilash Somasamudramath, Sandip Bhaskar, Maka Dong, Nave Assaf, Shahar Mor, Omer Ullman Argov, Scot Junkin, Oleksandr Romanenko, Pedro Larroy, Monika Katariya, Marco Rovinelli, Viji Balas, Nicholas Edelman, Anahita Bhiwandiwalla, Muthu Subramaniam, Smita Ithape, Karthik Ramamoorthy, Yuting Wu, Suguna Varshini Velury, Omri Almog, Joyjit Daw, Denys Fridman, Erick Galinkin, Michael Evans, Shaona Ghosh, Katherine Luna, Leon Derczynski, Nikki Pope, Eileen Long, Seth Schneider, Guillermo Siman, Tomasz Grzegorzek, Pablo Ribalta, Monika Katariya, Chris Alexiuk, Joey Conway, Trisha Saar, Ann Guan, Krzysztof Pawelec, Shyamala Prayaga, Oleksii Kuchaiev, Boris Ginsburg, Oluwatobi Olabiyi, Kari Briski, Jonathan Cohen, Bryan Catanzaro, Jonah Alben, Yonatan Geifman, Eric Chung

개요

Llama-Nemotron 시리즈는 뛰어난 추론 능력, 효율적인 추론 속도, 그리고 상업적 사용이 가능한 오픈 라이선스를 제공하는 이종 추론 모델의 오픈 패밀리입니다. Nano(8B), Super(49B), Ultra(253B) 세 가지 크기로 제공되며, DeepSeek-R1과 같은 최첨단 추론 모델과 경쟁력을 갖추면서 우수한 추론 처리량과 메모리 효율성을 제공합니다. Llama 3 모델을 기반으로 신경망 구조 탐색을 통한 가속화된 추론, 지식 증류, 그리고 추가적인 사전 학습을 거친 후, 지도 학습 미세 조정과 대규모 강화 학습으로 구성된 추론 중심의 추가 학습 단계를 거칩니다. 또한, 사용자가 추론 중에 표준 채팅 모드와 추론 모드 간을 전환할 수 있는 동적 추론 토글을 지원하는 최초의 오픈소스 모델입니다. 모델과 학습 코드(NeMo, NeMo-Aligner, Megatron-LM), 그리고 추가 학습 데이터셋을 공개합니다.

시사점, 한계점

시사점:
우수한 추론 능력과 효율성을 갖춘 오픈소스 추론 모델 제공
상업적 사용 가능한 오픈 라이선스 제공
동적 추론 토글을 통한 유연한 사용성 제공
모델, 데이터셋, 코드 공개를 통한 연구 및 개발 활성화
한계점:
논문에서 구체적인 성능 비교 결과 및 한계에 대한 자세한 설명 부족
추론 속도 및 메모리 효율성에 대한 정량적인 데이터 제시 부족
모델의 편향성이나 안전성에 대한 평가 미흡
👍