paint-brush
Uusi kehotustekniikka väittää auttavan tekoälyä ajattelemaan kuten ihmisetkirjoittaja@mahakshah
755 lukemat
755 lukemat

Uusi kehotustekniikka väittää auttavan tekoälyä ajattelemaan kuten ihmiset

kirjoittaja Mahak Shah4m2025/01/15
Read on Terminal Reader

Liian pitkä; Lukea

Ajatusketjun kehotukset mullistavat tapomme olla vuorovaikutuksessa tekoälyn kanssa. Se pilkkoo monimutkaiset ongelmat sulaviksi paloiksi, jolloin malli voi käsitellä jokaista komponenttia järjestelmällisesti. Tämä jäsennelty lähestymistapa varmistaa tarkkuuden ja osoittaa päättelyprosessin, mikä on erityisen arvokasta monimutkaisten matemaattisten operaatioiden käsittelyssä.
featured image - Uusi kehotustekniikka väittää auttavan tekoälyä ajattelemaan kuten ihmiset
Mahak Shah HackerNoon profile picture


Oletko koskaan miettinyt, kuinka saada tekoäly ajattelemaan enemmän ihmisen tavoin? Vaikka suuret kielimallit (LLM) ovat erinomaisia ennustamaan peräkkäin seuraava sana, ne usein kompastuvat kohtaaessaan järjestelmällistä ajattelua vaativia ongelmia. Anna ajatusketjun kehotus – peliä muuttava tekniikka, joka mullistaa tapamme olla vuorovaikutuksessa tekoälyn kanssa.

Ajatusketjun katkeaminen


Kuvittele, että opetat lapsen ratkaisemaan monimutkaisen pulman. Sen sijaan, että näyttäisit heille lopullisen kuvan, ohjaat heitä jokaisen vaiheen läpi. Tämä on pohjimmiltaan mitä ajatusketjun (CoT) kehotus tekee LLM:ille. Tarjoamalla esimerkkejä, jotka esittelevät vaiheittaista päättelyä, autamme näitä malleja löytämään tarkkoja ratkaisuja loogisen etenemisen kautta.


Kuvan lähde: Wei et al. (2022)


Maaginen kaava: miksi se toimii


Perinteiset kehotusmenetelmät johtavat usein osuma-or-mis-tuloksiin. CoT-kehotus kuitenkin pilkkoo monimutkaiset ongelmat sulaviksi paloiksi, jolloin malli voi käsitellä jokaista komponenttia systemaattisesti. Tämä lähestymistapa on osoittautunut niin menestyksekkääksi, että huippuluokan mallit, kuten OpenAI:n uusimmat tarjoukset, ovat sisällyttäneet sen ydintoimintoihinsa.


Reaalimaailman sovellus: Matemaattisten pulmien ratkaiseminen


Sukellaan käytännön esimerkkiin. Kuvittele, että autat tekoälyä ratkaisemaan tämän yhtälön

5x - 4 = 16


Näin CoT-kehotteet ohjaavat mallia:

  1. Ensimmäinen vaihe: Lisää 4 molemmille puolille
    • 5x - 4 + 4 = 16 + 4
    • 5x = 20
  2. Toinen vaihe: Jaa molemmat puolet viidellä
    • 5x/5 = 20/5

    • x = 4


Tämä jäsennelty lähestymistapa varmistaa tarkkuuden ja näyttää päättelyprosessin – mikä on erityisen arvokasta monimutkaisten matemaattisten operaatioiden yhteydessä.


Ajatusketju vs. vähäinen kehotus: eron ymmärtäminen


Molemmat tekniikat saattavat ensi silmäyksellä näyttää samanlaisilta, mutta niillä on eri tarkoitus:


  • Muutaman laukauksen kehotus : Tarjoaa esimerkkejä syötteestä ja lähdöstä, kuten monivalintanäppäin.

  • Ajatusketjun kehotus : Näyttää täydellisen päättelyprosessin, kuten kaiken työn näyttämisen matemaattisessa tehtävässä.


Few-Shot Prompting näyttäisi tältä:

 Example 1: Problem: If a store sells books for $5 each and markers for $3 each, how much would 2 books and 4 markers cost? Answer: $22 Example 2: Problem: If a store sells notebooks for $4 each and pens for $2 each, how much would 3 notebooks and 5 pens cost? Answer: $22


Ajatusketjun kehotus näyttäisi tältä:

 Problem: If a store sells books for $5 each and markers for $3 each, how much would 2 books and 4 markers cost? Thinking: 1. Calculate cost of books: 2 books × $5 = $10 2. Calculate cost of markers: 4 markers × $3 = $12 3. Total cost = Cost of books + Cost of markers = $10 + $12 = $22 Answer: $22 Problem: If a store sells notebooks for $4 each and pens for $2 each, how much would 3 notebooks and 5 pens cost? Thinking: 1. Calculate cost of notebooks: 3 notebooks × $4 = $12 2. Calculate cost of pens: 5 pens × $2 = $10 3. Total cost = Cost of notebooks + Cost of pens = $12 + $10 = $22 Answer: $22

Zero-Shot-ajatteluketju


Käyttämällä yksinkertaista mutta tehokasta lausetta " Ajattelemme askel askeleelta " Zero-shot CoT -kehotteita käytetään tilanteissa, joissa esimerkkitapaukset eivät ole käteviä. Esimerkiksi: "Ajattelemme askel askeleelta: Selitä kvanttifysiikka."

Milloin CoT-kehotteita kannattaa käyttää?


CoT-kehotteet loistavat, kun käsitellään:

  • Monimutkainen aritmetiikka
  • Monivaiheinen looginen päättely
  • Maalaisjärkeä
  • Symbolinen manipulointi


Clauden viimeisimmät vertailuarvot osoittivat, että menetelmät, joissa käytetään 3-shot- tai 5-shot CoT-kehotteita, toimivat hyvin päättelyä vaativissa tehtävissä: GPQA ja MMLU.

Tulevaisuus: Multimodaalinen ajatusketju


Tekoälypäättelyn viimeisin edistysaskel yhdistää visuaaliset ja tekstilliset komponentit kognitiivisiin prosesseihin. Kuvittele, että tekoäly diagnosoi polkupyörän korjauksen, ymmärtää käsikirjan ja tarjoaa visuaalista ja ääniopastusta prosessin jokaisessa vaiheessa. Multimodaalinen lähestymistapa merkitsee tekoälyn tuen tulevaa edistystä.


Kuvan lähde: Zhang et al. (2023)

CoT-kehotteiden tehokkuuden maksimointi


Vaikka ajatusketjun kehotus on voimakas, se toimii tietyin rajoituksin. Mallin suorittama päättelypolku ei ole taatusti virheetön, ja tulokset vaihtelevat marginaalisesti.


Tässä on muutamia vinkkejä parempien tulosten saavuttamiseksi:

  • Testaa huolellisesti eri lähestymistavoilla.
  • Harkitse CoT-kehotusten yhdistämistä muihin kehotusstrategioihin.
  • Käytä suurempia malleja, joissa on yli 100 miljardia parametria, jos mahdollista.

Johtopäätös


Koska tekoäly on edistynyt, on selvää, että ajatusketjun (CoT) kehotus on tehokas tekniikka edistyneempien päättelykykyjen hyödyntämiseen. On tärkeää huomata, että CoT-kehotuksen käyttäminen sovellusten kehittämiseen tai optimaalisempien tulosten saavuttamiseen tekoälytyössä lisää suuresti onnistumisen mahdollisuuksia.


Tarkoituksena ei ole vain saavuttaa tarkka vastaus, vaan myös ymmärtää menettely, joka on suoritettu niin, ja se on Ajatusketjun kehotuksen kauneus.

Alaviitteet

  1. Wei, J., Wang, X., Schuurmans, D., Bosma, M., Ichter, B., Xia, F., Chi, E., Le, Q., & Zhou, D. (2022). Ajatusketjun herättäminen saa aikaan päättelyn suurissa kielimalleissa.
  2. Kojima, T., Gu, SS, Reid, M., Matsuo, Y., & Iwasawa, Y. (2022). Suuret kielimallit ovat Zero-Shot Reasoner -ratkaisuja.
  3. Zhang, Zhuosheng, et ai. "Multimodaalinen ajatusketjun päättely kielimalleissa." arXiv preprint arXiv:2302.00923 (2023).