Este artículo propone Tilus, un novedoso lenguaje específico de dominio (DSL) para la implementación eficiente de modelos de lenguaje a gran escala (LLM). La implementación de LLM requiere recursos computacionales significativos, y la computación de baja precisión es una forma eficaz de reducir el consumo de recursos. Los métodos existentes de generación de kernels de baja precisión tienen anchos de bits limitados a potencias de dos y presentan un rendimiento subóptimo debido a las abstracciones de programación de GPU de alto nivel. Tilus admite tipos de datos de baja precisión con anchos de bits arbitrarios de 1 a 8 bits, y presenta un modelo de programación a nivel de bloque con subprocesos, un espacio de memoria jerárquico y un novedoso sistema de diseño algebraico. Se compila en programas GPU eficientes mediante vectorización automática y selección de instrucciones, superando a métodos existentes como Triton, Ladder, QuantLLM y Marlin.