Coherencia interna en las indicaciones

La autoconsistencia es una técnica nueva que mejora la capacidad de razonamiento de los modelos de lenguaje de inteligencia artificial. Al mejorar el método de Cadena de Pensamiento (CoT), genera diversas rutas de inferencia y selecciona entre ellas la respuesta más coherente. Este método es eficaz para problemas de razonamiento aritmético complejo o de lógica cotidiana.

Esta técnica fue propuesta por Xuezhi Wang en el estudio <La autoconsistencia mejora el razonamiento en Cadena de Pensamiento en Modelos de Lenguaje>, publicado en 2023.

SELF-CONSISTENCY IMPROVES CHAIN OF THOUGHT REASONING IN LANGUAGE MODELS.pdf823.42KB

Cómo funciona la autoconsistencia

•

Generación de varias rutas de inferencia: se crean diferentes caminos de razonamiento utilizando varios prompts cortos de CoT.

•

Selección de respuestas coherentes: se identifica y selecciona la respuesta más consistente entre las rutas generadas.

•

Agregación de resultados: se integran varias rutas de inferencia para obtener la respuesta final

Diferencias con el método CoT tradicional

El método CoT guía al modelo a explicar el proceso de razonamiento paso a paso en lugar de dar respuestas directas. Por el contrario, la autoconsistencia amplía este enfoque generando múltiples rutas de razonamiento y eligiendo la respuesta más coherente entre ellas.

Uso en la práctica

Supongamos que tenemos otro problema de matemáticas. El enunciado es el siguiente.

"Younghee hizo dos paradas durante su viaje en bicicleta de 60 km. La primera parada fue tras 20 km y la segunda fue 15 km antes de finalizar el trayecto. ¿Cuánta distancia recorrió Younghee entre la primera y la segunda parada?"

Normalmente, al introducirlo en el prompt, se muestra así.

Younghee recorrió un total de 60 km. Después de la primera parada, recorrió 60 - 20 = 40 km. Por lo tanto, la respuesta es 40 km.

De nuevo, está equivocado. Aunque parece un simple problema de resta, parece que no fue fácil para nuestro amigo LLM. Veamos cómo se resuelve esto usando el modelo de autoconsistencia.

Ruta de inferencia 1: "Younghee recorrió un total de 60 km. La primera parada fue después de 20 km y la segunda fue 15 km antes de terminar el viaje. Entonces, entre la primera y la segunda parada, recorrió 60 - 20 - 15 = 25 km. La respuesta es 25 km."

Ruta de inferencia 2: "Durante el viaje de 60 km, la primera parada fue a los 20 km y la segunda parada fue a los 60 - 15 = 45 km. La distancia entre la primera y la segunda parada es 45 - 20 = 25 km. La respuesta es 25 km."

Ambas rutas de razonamiento llegan a la respuesta correcta. Esto es justamente aplicar la técnica de autoconsistencia. Para explicarlo más sencillo, veamos el siguiente ejemplo.

P: Younghee hizo la primera parada después de 20 km durante el viaje en bicicleta de 60 km. ¿Cuánto recorrido le quedaba tras la primera parada?

R: Younghee hizo su primera parada tras 20 km. Por lo tanto, la distancia restante después de la primera parada es 60 - 20 = 40 km.

P: La segunda parada de Younghee fue 15 km antes de terminar el viaje. ¿Cuál es la distancia entre el comienzo del viaje y la segunda parada?

R: La segunda parada fue 15 km antes de finalizar el viaje. Por lo tanto, desde el principio hasta la segunda parada hay 60 - 15 = 45 km.

P: ¿Cuál es la distancia entre la primera y la segunda parada?

R: Tras la primera parada quedan 40 km, y hasta la segunda parada son 45 km. Por lo tanto, la distancia entre ambas paradas es 45 - 20 = 25 km.

¿Ves cuál es la diferencia?

Younghee se detuvo dos veces durante su recorrido en bicicleta de 60 km. La primera parada fue después de los 20 km y la segunda, 15 km antes del final del recorrido. ¿Cuánto recorrió Younghee entre la primera y la segunda parada?

Aquí, se segmentó la frase y se respondió por partes para resolver el problema. Así se puede comprobar que problemas que modelos como GPT-3, LLaMA2 o Claude no podían resolver ahora sí lo consiguen; y más adelante, combinando esta técnica con la del árbol de pensamiento, se puede superar en gran medida la brecha causada por el tamaño del modelo, que era una de las desventajas del CoT.

Se puede utilizar con fines comerciales con el permiso del titular de los derechos de autor, siempre que se cite la fuente.

Made with Slashpage