Daily Arxiv

Esta página recopila y organiza artículos sobre inteligencia artificial publicados en todo el mundo.
La información aquí presentada se resume utilizando Google Gemini y el sitio se gestiona sin fines de lucro.
Los derechos de autor de los artículos pertenecen a sus autores y a las instituciones correspondientes; al compartir el contenido, basta con citar la fuente.

ORANSight-2.0: LLM fundamentales para O-RAN

Created by
  • Haebom

Autor

Pranshav Gajjar, Vijay K. Shah

Describir

Este artículo aborda las limitaciones de los LLM de propósito general existentes para la integración de Modelos de Lenguaje a Gran Escala (LLM) en Redes de Acceso Radiofónico Abierto (O-RAN) e introduce la iniciativa ORANSight-2.0 para desarrollar un LLM de referencia específico para O-RAN. ORANSight-2.0 mejora el rendimiento de las tareas específicas de O-RAN mediante el ajuste fino de 18 modelos con rangos de parámetros de 1B a 70B basados en cinco marcos LLM de código abierto: Mistral, Qwen, Llama, Phi y Gemma. En particular, se utiliza un nuevo marco de coordinación de instrucciones basado en Generación Aumentada por Recuperación (RAG), llamado RANSTRUCT, para generar un conjunto de datos de coordinación de instrucciones de alta calidad, que posteriormente se ajusta mediante QLoRA. Para la evaluación del rendimiento, se propone un nuevo punto de referencia basado en srsRAN, srsRANBench.

Takeaways, Limitations

Takeaways:
Al desarrollar un LLM basado en código abierto especializado para O-RAN, reducimos la dependencia de los modelos cerrados existentes y ampliamos el potencial de utilización de LLM en el campo O-RAN.
Proporciona un entorno estandarizado para el desarrollo y la evaluación de O-RAN LLM mediante la introducción de nuevos marcos y puntos de referencia como RANSTRUCT y srsRANBench.
Desarrollamos y evaluamos modelos aplicables a entornos reales utilizando srsRAN, una pila O-RAN 5G.
Limitations:
Dado que actualmente la evaluación se lleva a cabo utilizando únicamente puntos de referencia basados en srsRAN, se requiere una mayor validación de la generalización a otros sistemas O-RAN.
Falta un análisis cuantitativo sobre el grado de mejora del rendimiento de ORANSight-2.0 y un análisis comparativo con otros LLM existentes.
Se necesita un análisis detallado de la eficiencia y escalabilidad de RANSTRUCT.
👍