Share
Sign In
🧮

Demostración

Las tareas de inferencia que utilizan modelos de lenguaje son actualmente una de las áreas importantes y desafiantes en el campo de la inteligencia artificial. Las tareas de razonamiento implican analizar información y sacar conclusiones lógicas de ella. Se trata de una tarea más compleja que va más allá de la simple recuperación de información o generación de texto.
Prompt : 57*32의 답은 무엇입니까?
🤖
El resultado de multiplicar 57 y 32 es 1824.
Ahora puedo resolver problemas simples como este fácilmente. Planteemos un problema ligeramente difícil.
Prompt : 242,343,232,12,1,423,3,2,433,42,21,51,26중 홀수인 숫자들을 더해보시오.
🤖
Sumemos números impares entre los números dados:
Números impares: 343, 1, 423, 3, 433, 21, 51
Sumando: 343 + 1 + 423 + 3 + 433 + 21 + 51 = 1675
Por lo tanto, si sumas los números impares entre los números dados, obtienes 1675.
¿Es esto correcto? No. Equivocado. "1275" es la respuesta correcta. ¿Por qué sucede esto?
Los modelos de lenguaje, especialmente los modelos de lenguaje grandes (LLM), tienen la capacidad de procesar varios tipos de datos y extraer significado de contextos complejos. Sin embargo, estos modelos todavía tienen limitaciones a la hora de realizar tareas de inferencia.
Aprendizaje basado en texto: los modelos de lenguaje se entrenan principalmente con datos de texto como oraciones, párrafos y conversaciones. Estos datos reflejan principalmente el significado, el contexto y la sintaxis del idioma, con énfasis en el significado lingüístico en lugar del cálculo numérico o el procesamiento matemático preciso.
Inferencia estadística: los modelos de lenguaje utilizan métodos estadísticos para predecir la palabra u oración más probable. Este proceso es eficaz para reconocer e imitar patrones en el lenguaje, pero está limitado a la hora de realizar cálculos matemáticos complejos o razonamiento lógico.
Diversidad y limitaciones de datos: si sus datos de entrenamiento no contienen suficientes ejemplos de cálculo numérico o resolución de problemas matemáticos, su modelo puede tener dificultades para manejar este tipo de problemas.
Diseño centrado en el lenguaje: los modelos de lenguaje están diseñados principalmente para centrarse en la comprensión y producción del lenguaje, y las habilidades matemáticas no son el propósito o función principal de estos modelos.
Por supuesto, no corresponde a quienes investigan la inteligencia artificial dejarlo así. En GPT-4, etc., este problema se resuelve mediante la codificación utilizando bibliotecas especializadas en inferencia/cómputo existente. En realidad, ejecutar esto en GPT-4 resuelve el problema de la siguiente manera:
# 정의된 숫자들의 리스트 numbers = [242, 343, 232, 12, 1, 423, 3, 2, 433, 42, 21, 51, 26] # 홀수인 숫자들만 필터링 odd_numbers = [num for num in numbers if num % 2 != 0] # 홀수인 숫자들의 합계 계산 sum_of_odd_numbers = sum(odd_numbers) sum_of_odd_numbers --- output: 1275
Se necesitan técnicas de ingeniería rápida más avanzadas para superar estas limitaciones. La ingeniería rápida es una técnica que proporciona instrucciones más claras y específicas al modelo, permitiéndole derivar con mayor precisión la información o respuesta deseada. Por ejemplo, implica presentar claramente las diversas variables y condiciones necesarias para la resolución de problemas complejos o la toma de decisiones para que el modelo pueda comprenderlas. En el ejemplo anterior, se puede utilizar así.
Antes del cambio
Prompt : 242,343,232,12,1,423,3,2,433,42,21,51,26중 홀수인 숫자들을 더해보시오.
Después del cambio
Prompt : 242,343,232,12,1,423,3,2,433,42,21,51,26 를 홀수와 짝수로 구별한 다음 홀수 인 숫자를 모두 더하시오. 이를 순서대로 진행해 주세요.
💡
Distingamos entre números pares e impares y sumemos los números impares en orden:
Números impares: 343, 1, 423, 3, 433, 21, 51
Suma impar: 343 + 1 + 423 + 3 + 433 + 21 + 51 = 1275
Por lo tanto, si sumas todos los números impares entre los números dados, obtienes 1275.
Solo cambiamos el mensaje, pero podemos ver que obtuvimos la respuesta correcta. Cuando se enseña algo a alguien, hacer que lo haga paso a paso de forma secuencial hace que comprenda más rápido y la calidad de su trabajo aumenta.
El razonamiento utilizando modelos lingüísticos es todavía un área en desarrollo y, para hacerlo de forma eficaz, se necesita la capacidad de dar instrucciones. Estos métodos aprovechan al máximo las capacidades de inferencia del modelo y pueden ayudar a resolver problemas complejos.
👩‍💻
🔨
ⓒ 2023. Haebom, todos los derechos reservados.
Se indica la fuente y puede utilizarse con fines comerciales con el permiso del titular de los derechos de autor.
👍