Este artículo analiza la cuantificación, una técnica de compresión ampliamente utilizada para reducir los costos de memoria y computacionales de modelos a gran escala preentrenados. En particular, la selección de un factor de escala adecuado para reemplazar los valores de ponderación con valores en una cuadrícula entera escalada es un desafío clave en la cuantificación posterior al entrenamiento (PTQ) canal por canal. Los métodos existentes suelen fijar la escala de antemano mediante ajuste heurístico o búsqueda en la cuadrícula. En este artículo, proponemos Beacon, un algoritmo simple y efectivo que elimina la necesidad de ajuste manual. Beacon realiza PTQ canal por canal directamente utilizando una cuadrícula sin escalar y determina automáticamente el factor de escala óptimo aprovechando las propiedades geométricas de la cuantificación escalar. No depende de retropropagación ni de grandes conjuntos de calibración. A pesar de su simplicidad y su naturaleza sin ajuste, Beacon logra un rendimiento competitivo en comparación con los métodos de vanguardia, lo que lo convierte en una solución práctica para la implementación eficiente de modelos.