Técnica del árbol del pensamiento (ToT)

El Árbol de los Pensamientos (Tree of Thoughts) es una técnica de indicaciones para modelos de lenguaje propuesta por Yao y Long en el artículo <Tree of Thoughts (ToT): A Framework for Advanced Problem Solving> publicado en 2023, que resulta especialmente adecuada para tareas complejas donde se requiere pensamiento estratégico y exploración. ToT expande el concepto de las cadenas de pensamiento (Chain-of-Thought, CoT) aprovechando una estructura arborescente de ideas combinada con algoritmos de búsqueda sistemática para resolver problemas.

Large Language Model Guided Tree-of-Thought.pdf388.93KB

Tree of Thoughts- Deliberate Problem Solving with Large Language Models.pdf748.36KB

Cómo funciona ToT

En términos sencillos, la técnica Árbol de los Pensamientos (ToT) representa el proceso de explorar distintas posibilidades y encontrar la solución óptima de un problema a través de una estructura similar a un árbol. Esto permite que el modelo de lenguaje considere varias direcciones, como lo haría una persona, e incluso pueda retroceder y probar otras rutas cuando sea necesario.

Por qué ToT está atrayendo la atención

•

Estructura de árbol: ToT explora el proceso de resolución de problemas a través de múltiples caminos, como las ramas de un árbol. Cada 'rama' representa una idea o un paso hacia la resolución del problema. (Puedes imaginarlo como la estructura de carpetas que solemos ver en los exploradores de archivos).

•

Generación y evaluación de ideas: Del mismo modo que una persona considera diversas ideas y evalúa cuál es la mejor para resolver un problema, el modelo de lenguaje propone diferentes soluciones y elige la más óptima.

•

Exploración y retroceso: se exploran varios caminos para resolver un problema, y si es necesario, se puede volver a pasos anteriores para intentar otra dirección.

Aplicación práctica

El problema de CoT es que no permite retroceder. Si tienes que avanzar hasta el final para ver el resultado y luego continuar la cadena, la principal ventaja de ToT es que puedes retroceder en el proceso y corregirlo en el momento. Como mencionamos antes, supongamos que estamos tratando de resolver un problema matemático difícil para los LLM. Por ejemplo, digamos que se nos presenta un quiz como el siguiente.

"4x4 스도쿠 퍼즐의 빈 칸을 채워 넣으시오."

Método general

•

Proceso: De la manera común, se encuentran los números que faltan en cada fila, columna y cuadrícula de 2x2 y se rellenan los espacios vacíos uno por uno.

•

Resultado: Se completa el rompecabezas rellenando en orden los espacios vacíos.

El Sudoku 4x4 que creé tiene todas las casillas vacías. Por lo tanto, el tablero completo para resolver este rompecabezas sería así:

1 2 3 4
3 4 1 2
2 1 4 3
4 3 2 1

Técnica de ToT

Mensaje adicional del proceso ToT

•

Paso 1: El modelo de lenguaje sugiere un número para colocar en el primer espacio vacío.

•

Paso 2: Se determina el número para el siguiente espacio vacío.

•

Retroceso: Si en algún paso el modelo reconoce que el rompecabezas no tiene solución, vuelve al paso anterior para probar con otro número.

•

Resultado final: El modelo completa correctamente todos los espacios vacíos y resuelve el rompecabezas.

Se resolvió el Sudoku 4x4 paso a paso, llenando correctamente todos los espacios vacíos en un total de 14 pasos. El Sudoku completo es el siguiente:

1 2 3 4
3 4 2 1
4 3 1 2
2 1 4 3

A simple vista, puede parecer que no hay mucha diferencia. Pero si revisas el código que utilizó este método, entenderás la diferencia.

Método de indicación normal

Método ToT

Si realizas este proceso con GPT-3.5, podrás verlo de la siguiente manera.

Diferencias entre los resultados de una indicación normal y el método ToT

Como se puede ver en los resultados, lo que es posible hacer con GPT-4 también puede reproducirse bastante bien en modelos como GPT-3.5 o LLaMA2 utilizando estas técnicas de indicaciones. (De hecho, con GPT-4 simplemente se resuelve programando).

Se puede utilizar con fines comerciales con el permiso del titular de los derechos de autor, siempre que se cite la fuente.

Made with Slashpage