paint-brush
A nova técnica de indicación afirma que axuda a IA a pensar como os humanospor@mahakshah
755 lecturas
755 lecturas

A nova técnica de indicación afirma que axuda a IA a pensar como os humanos

por Mahak Shah4m2025/01/15
Read on Terminal Reader

Demasiado longo; Ler

As indicacións da cadea de pensamento están revolucionando a forma en que interactuamos coa IA. Descompón problemas complexos en anacos dixeribles, o que permite que o modelo aborde cada compoñente de forma sistemática. Este enfoque estruturado garante a precisión e demostra o proceso de razoamento, algo especialmente valioso cando se trata de operacións matemáticas complexas.
featured image - A nova técnica de indicación afirma que axuda a IA a pensar como os humanos
Mahak Shah HackerNoon profile picture


Algunha vez te preguntas como facer que a IA pense máis como un humano? Aínda que os grandes modelos de linguaxe (LLM) destacan na predicción da seguinte palabra nunha secuencia, adoitan tropezar cando se enfrontan a problemas que requiren un pensamento metódico. Introduce o aviso da cadea de pensamento: unha técnica que cambia o xogo que está a revolucionar a forma en que interactuamos coa IA.

Romper o impulso da cadea de pensamento


Imaxina ensinarlle a un neno a resolver un puzzle complexo. En lugar de mostrarlles a imaxe final, guías a través de cada paso. Iso é esencialmente o que fai a solicitude de Chain-of-Thought (CoT) para os LLM. Ao proporcionar exemplos que mostran o razoamento paso a paso, axudamos a estes modelos a chegar a solucións precisas mediante a progresión lóxica.


Fonte da imaxe: Wei et al. (2022)


A fórmula máxica: por que funciona


Os métodos tradicionais de indicación adoitan levar a resultados de acertar ou fallar. Non obstante, o impulso de CoT divide os problemas complexos en anacos dixeribles, o que permite que o modelo aborde cada compoñente de forma sistemática. Este enfoque demostrou ser tan exitoso que modelos de vangarda como as últimas ofertas de OpenAI incorporárono nas súas funcións básicas.


Aplicación do mundo real: resolución de crebacabezas matemáticos


Mergullémonos nun exemplo práctico. Imaxina que estás axudando a unha IA a resolver esta ecuación

5x - 4 = 16


Así é como as indicacións de CoT guían o modelo:

  1. Primeiro paso: engade 4 a ambos os dous lados
    • 5x - 4 + 4 = 16 + 4
    • 5x = 20
  2. Segundo paso: Divide ambos lados por 5
    • 5x/5 = 20/5

    • x = 4


Este enfoque estruturado garante a precisión e demostra o proceso de razoamento, algo especialmente valioso cando se trata de operacións matemáticas complexas.


Chain-of-thought vs. Few-Shot Prompting: Comprender a distinción


Ambas técnicas poden parecer similares a primeira vista pero teñen un propósito diferente:


  • Solicitude de poucos disparos : ofrece exemplos que mostran entrada e saída, como unha clave de resposta de opción múltiple.

  • Chain-of-Thought Prompting : demostra o proceso de razoamento completo, como mostrar todo o traballo nun problema matemático.


O aviso de poucos disparos sería así:

 Example 1: Problem: If a store sells books for $5 each and markers for $3 each, how much would 2 books and 4 markers cost? Answer: $22 Example 2: Problem: If a store sells notebooks for $4 each and pens for $2 each, how much would 3 notebooks and 5 pens cost? Answer: $22


O aviso de cadea de pensamento sería así:

 Problem: If a store sells books for $5 each and markers for $3 each, how much would 2 books and 4 markers cost? Thinking: 1. Calculate cost of books: 2 books × $5 = $10 2. Calculate cost of markers: 4 markers × $3 = $12 3. Total cost = Cost of books + Cost of markers = $10 + $12 = $22 Answer: $22 Problem: If a store sells notebooks for $4 each and pens for $2 each, how much would 3 notebooks and 5 pens cost? Thinking: 1. Calculate cost of notebooks: 3 notebooks × $4 = $12 2. Calculate cost of pens: 5 pens × $2 = $10 3. Total cost = Cost of notebooks + Cost of pens = $12 + $10 = $22 Answer: $22

Cadea de pensamento de tiro cero


Usando a frase sinxela pero poderosa de " Pensemos paso a paso ", a indicación CoT de disparo cero úsase en circunstancias nas que non tes casos de exemplo a man. Por exemplo, "Pensemos paso a paso: explica a física cuántica".

Cando deberías utilizar as indicacións CoT?


O aviso de CoT brilla cando se trata de:

  • Aritmética complicada
  • Razoamento lóxico de varios pasos
  • Sentido común
  • Manipulación simbólica


Os indicadores de referencia máis recentes de Claude mostraron que os métodos que usan a indicación de CoT de 3 ou 5 tiros están funcionando ben para tarefas pesadas de razoamento: GPQA e MMLU.

O futuro: cadea de pensamento multimodal


O avance máis recente no razoamento da IA integra compoñentes visuais e textuais nos procesos cognitivos. Imaxina unha IA que diagnostica unha reparación de bicicletas, comprende o manual e proporciona orientación visual e sonora en cada etapa do proceso. O enfoque multimodal significa o próximo avance no soporte da IA.


Fonte da imaxe: Zhang et al. (2023)

Maximizando a efectividade das súas solicitudes CoT


Aínda que o indicador da cadea de pensamento é poderoso, opera con certas limitacións. O camiño de razoamento que realiza o modelo non se garante que estea libre de fallos e os resultados varían lixeiramente.


Aquí tes algúns consellos para ter mellores resultados:

  • Proba a fondo con diferentes enfoques.
  • Considere combinar as indicacións CoT con outras estratexias de indicación.
  • Usa modelos máis grandes con máis de 100 mil millóns de parámetros, se é posible.

Conclusión


Tendo en conta como avanzou a IA, é evidente que o impulso da cadea de pensamento (CoT) é unha técnica eficaz para aproveitar habilidades de razoamento máis avanzadas. É importante ter en conta que empregar as solicitudes de CoT para o desenvolvemento de aplicacións ou para lograr resultados máis óptimos nos compromisos de IA aumenta moito as posibilidades de lograr o éxito.


A intención non é só conseguir a resposta precisa, senón tamén comprender o procedemento emprendido para facelo, e esa é a beleza do impulso da cadea de pensamento.

Notas ao pé

  1. Wei, J., Wang, X., Schuurmans, D., Bosma, M., Ichter, B., Xia, F., Chi, E., Le, Q. e Zhou, D. (2022). O impulso da cadea de pensamento provoca o razoamento en grandes modelos lingüísticos.
  2. Kojima, T., Gu, SS, Reid, M., Matsuo, Y. e Iwasawa, Y. (2022). Os grandes modelos lingüísticos son razoadores de tiro cero.
  3. Zhang, Zhuosheng, et al. "Razoamento multimodal en cadea de pensamento nos modelos lingüísticos". preimpresión de arXiv arXiv:2302.00923 (2023).