Daily Arxiv

Esta página recopila y organiza artículos sobre inteligencia artificial publicados en todo el mundo.
La información aquí presentada se resume utilizando Google Gemini y el sitio se gestiona sin fines de lucro.
Los derechos de autor de los artículos pertenecen a sus autores y a las instituciones correspondientes; al compartir el contenido, basta con citar la fuente.

Tarjeta modelo gpt-oss-120b y gpt-oss-20b

Created by
  • Haebom

Autor

OpenAI (Xiaoxuan), : (Xiaoxuan), Sandhini Agarwal (Xiaoxuan), Lama Ahmad (Xiaoxuan), Jason Ai (Xiaoxuan), Sam Altman (Xiaoxuan), Andy Applebaum (Xiaoxuan), Edwin Arbus (Xiaoxuan), Rahul K. Arora (Xiaoxuan), Yu Bai (Xiaoxuan), Bowen Baker (Xiaoxuan), Haiming Bao (Xiaoxuan), Boaz Barak (Xiaoxuan), Ally Bennett (Xiaoxuan), Tyler Bertao (Xiaoxuan), Nivedita Brett (Xiaoxuan), Eugene Brevdo (Xiaoxuan), Greg Brockman (Xiaoxuan), Sebastien Bubeck (Xiaoxuan), Che Chang (Xiaoxuan), Kai Chen (Xiaoxuan), Mark Chen (Xiaoxuan), Enoch Cheung (Xiaoxuan), Aidan Clark (Xiaoxuan), Dan Cook (Xiaoxuan), Marat Dukhan (Xiaoxuan), Casey Dvorak (Xiaoxuan), Kevin Fives (Xiaoxuan), Vlad Fomenko (Xiaoxuan), Timur Garipov (Xiaoxuan), Kristian Georgiev (Xiaoxuan), Mia Glaese (Xiaoxuan), Tarun Gogineni (Xiaoxuan), Adam Goucher (Xiaoxuan), Lukas Gross (Xiaoxuan), Katia Gil Guzman (Xiaoxuan), John Hallman (Xiaoxuan), Jackie Hehir (Xiaoxuan), Johannes Heidecke (Xiaoxuan), Alec Helyar (Xiaoxuan), Haitang Hu (Xiaoxuan), Romain Huet (Xiaoxuan), Jacob Huh (Xiaoxuan), Saachi Jain (Xiaoxuan), Zach Johnson (Xiaoxuan), Chris Koch (Xiaoxuan), Irina Kofman (Xiaoxuan), Dominik Kundel (Xiaoxuan), Jason Kwon (Xiaoxuan), Volodymyr Kyrylov (Xiaoxuan), Elaine Ya Le (Xiaoxuan), Guillaume Leclerc (Xiaoxuan), James Park Lennon (Xiaoxuan), Scott Lessans (Xiaoxuan), Mario Lezcano-Casado (Xiaoxuan), Yuanzhi Li (Xiaoxuan), Zhuohan Li (Xiaoxuan), Ji Lin (Xiaoxuan), Jordan Liss (Xiaoxuan), Lily (Xiaoxuan), Liu, Jiancheng Liu, Kevin Lu, Chris Lu, Zoran Martinovic, Lindsay McCallum, Josh McGrath, Scott McKinney, Aidan McLaughlin, Song Mei, Steve Mostovoy, Tong Mu, Gideon Myles, Alexander Neitz, Alex Nichol, Jakub Pachocki, Alex Paino, Dana Palmie, Ashley Pantuliano, Giambattista Parascandolo, Jongsoo Park, Leher Pathak, Carolina Paz, Ludovic Peran, Dmitry Pimenov, Michelle Pokrass, Elizabeth Proehl, Huida Qiu, Gaby Raila, Filippo Raso, Hongyu Ren, Kimmy Richardson, David Robinson, Bob Rotsted, Hadi Salman, Suvansh Sanjeev, Max Schwarzer, D. Sculley, Harshit Sikchi, Kendal Simon, Karan Singhal, Yang Song, Dane Stuckey, Zhiqing Sun, Philippe Tillet, Sam Toizer, Foivos Tsimpourlas, Nikhil Vyas, Eric Wallace,

Describir

Presentamos dos modelos de inferencia de código abierto, gpt-oss-120b y gpt-oss-20b. Estos modelos utilizan una eficiente arquitectura de transformadores mixtos de expertos y se entrenan mediante destilación de conocimiento a gran escala y aprendizaje por refuerzo. Están optimizados para una funcionalidad robusta del agente, incluyendo la recuperación de investigación exhaustiva, herramientas Python y compatibilidad con funciones proporcionadas por el desarrollador. Utilizan un formato de chat renderizado que permite un claro seguimiento de instrucciones y la separación de roles. Alcanzan un rendimiento excelente en diversas pruebas de referencia, como matemáticas, programación y seguridad. Los pesos del modelo, la implementación de la inferencia, el entorno de la herramienta y el tokenizador se publican bajo la licencia Apache 2.0 para facilitar su uso generalizado y la investigación en profundidad.

Takeaways, Limitations

Takeaways:
Hacer que los modelos de inferencia a gran escala sean accesibles a través de código abierto.
Presentando una arquitectura eficiente y un método de entrenamiento.
Demuestra el potencial para desarrollar modelos con potentes capacidades de agente.
Demostró un excelente desempeño en varios campos.
Limitations:
Posible mal uso del modelo.
Se necesita más investigación sobre la seguridad y confiabilidad de las funciones del agente.
Sólo se presenta el rendimiento de puntos de referencia específicos; se necesita una verificación adicional del rendimiento de generalización.
Es necesario tener en cuenta el consumo de energía y el impacto ambiental.
👍