Argumentación

La inferencia utilizando modelos de lenguaje es actualmente una de las áreas más importantes y desafiantes en el campo de la inteligencia artificial. El razonamiento implica analizar información y obtener conclusiones lógicas a partir de ella. Esto constituye una tarea más compleja que simplemente recuperar información o generar texto.

Prompt : 57*32의 답은 무엇입니까?

El resultado de multiplicar 57 y 32 es 1824.

Ahora, este tipo de problemas simples los resuelvo bien. Vamos a probar con uno un poco más difícil.

Prompt : 242,343,232,12,1,423,3,2,433,42,21,51,26중 홀수인 숫자들을 더해보시오.

Vamos a sumar los números impares entre los números dados:

Números impares: 343, 1, 423, 3, 433, 21, 51

Sumando: 343 + 1 + 423 + 3 + 433 + 21 + 51 = 1675

Por lo tanto, si sumamos los números impares entre los números dados, obtenemos 1675.

¿Es correcta la respuesta? No, está equivocada. La respuesta correcta es "1275". ¿Por qué sucede esto?

Los modelos de lenguaje, especialmente los modelos de lenguaje a gran escala (LLM), pueden procesar diversos tipos de datos y extraer significado en contextos complejos. Sin embargo, estos modelos todavía tienen limitaciones a la hora de realizar tareas de inferencia.

•

Aprendizaje basado en texto: Los modelos de lenguaje se entrenan principalmente con datos de texto como oraciones, párrafos y conversaciones. Estos datos reflejan sobre todo el significado, el contexto y la sintaxis del idioma, y se centran más en el sentido lingüístico que en los cálculos numéricos o el procesamiento matemático exacto.

•

Inferencia estadística: Los modelos lingüísticos emplean métodos estadísticos para predecir la palabra o frase más probable. Este proceso es eficaz para reconocer y replicar patrones del lenguaje, pero es limitado para llevar a cabo cálculos matemáticos complejos o razonamiento lógico.

•

Diversidad y limitaciones de los datos: Si los datos de entrenamiento no contienen suficientes ejemplos de operaciones numéricas o resolución de problemas matemáticos, el modelo puede tener dificultades para manejar este tipo de cuestiones.

•

Diseño centrado en el lenguaje: Los modelos lingüísticos están diseñados principalmente para comprender y generar lenguaje, y las capacidades matemáticas no son su objetivo o función principal.

Por supuesto, los investigadores en IA no lo dejan así. En GPT-4, por ejemplo, se utiliza programación apoyada en bibliotecas especializadas en inferencia y cálculo ya existentes para resolver este tipo de problemas. Si se ejecuta esta tarea en GPT-4, es posible solucionarla de la siguiente manera:

# 정의된 숫자들의 리스트
numbers = [242, 343, 232, 12, 1, 423, 3, 2, 433, 42, 21, 51, 26]

# 홀수인 숫자들만 필터링
odd_numbers = [num for num in numbers if num % 2 != 0]

# 홀수인 숫자들의 합계 계산
sum_of_odd_numbers = sum(odd_numbers)
sum_of_odd_numbers
---
output: 1275

Para superar estas limitaciones, se necesitan técnicas de ingeniería de prompts más avanzadas. La ingeniería de prompts consiste en proporcionar al modelo instrucciones más claras y precisas, de modo que pueda obtener la información o respuesta deseada de forma más exacta. Por ejemplo, implica presentar de manera explícita las distintas variables y condiciones necesarias en la resolución de problemas complejos o en procesos de toma de decisiones para que el modelo las comprenda. En el ejemplo anterior, esto puede aplicarse así.

Antes del cambio

Prompt : 242,343,232,12,1,423,3,2,433,42,21,51,26중 홀수인 숫자들을 더해보시오.

Después del cambio

Prompt : 242,343,232,12,1,423,3,2,433,42,21,51,26 를 홀수와 짝수로 구별한 다음
홀수 인 숫자를 모두 더하시오. 이를 순서대로 진행해 주세요.

Vamos a clasificar los números dados como impares y pares, y a sumar en orden los impares:

Impares: 343, 1, 423, 3, 433, 21, 51
Suma de impares: 343 + 1 + 423 + 3 + 433 + 21 + 51 = 1275

Así que, si sumamos todos los números impares entre los dados, obtenemos 1275.

Simplemente cambiando el prompt, hemos podido obtener la respuesta correcta. Esto es similar a cómo, cuando enseñamos algo a alguien, si lo hace paso a paso de manera secuencial, lo comprende más rápido y la calidad del trabajo mejora.

El razonamiento usando modelos de lenguaje es todavía un campo en desarrollo, y para realizarlo de manera efectiva se requiere la capacidad de dar instrucciones adecuadas. Estos métodos ayudan a aprovechar al máximo la capacidad de razonamiento del modelo y contribuyen a solucionar problemas complejos.

Se puede utilizar con fines comerciales con el permiso del titular de los derechos de autor, siempre que se cite la fuente.

Made with Slashpage