Поширення думок: аналогічний підхід до складних міркувань за допомогою великих мовних моделей - KDnuggets

Поширення думок: аналогічний підхід до складних міркувань за допомогою великих мовних моделей – KDnuggets

Вихідний вузол: 2963270

Поширення думок: аналогічний підхід до складних міркувань із великими мовними моделями

 

Ключові винесення

  • Поширення думок (TP) — це новий метод, який покращує складні можливості міркування великих мовних моделей (LLM).
  • TP використовує аналогічні проблеми та їх вирішення для покращення міркувань, а не змушує LLM міркувати з нуля.
  • Експерименти з різними завданнями показують, що TP суттєво перевершує базові методи, покращення коливаються від 12% до 15%.

TP спочатку спонукає LLM запропонувати та розв’язати набір аналогічних проблем, пов’язаних із вхідною. Потім TP повторно використовує результати аналогічних проблем, щоб безпосередньо отримати нове рішення або вивести наукомісткий план виконання, щоб змінити початкове рішення, отримане з нуля.

Універсальність і обчислювальна потужність великих мовних моделей (LLM) незаперечні, але вони не безмежні. Однією з найбільш важливих і послідовних проблем для LLM є їхній загальний підхід до вирішення проблем, що складається з аргументації на основі основних принципів для кожного нового завдання. Це проблематично, оскільки забезпечує високий ступінь адаптивності, але також збільшує ймовірність помилок, особливо в завданнях, які вимагають багатоетапного міркування.

Проблема «міркувати з нуля» особливо виражена в складних завданнях, які вимагають кількох кроків логіки та висновків. Наприклад, якщо LLM попросити знайти найкоротший шлях у мережі взаємопов’язаних точок, він зазвичай не використовуватиме попередні знання чи аналогічні проблеми для пошуку рішення. Замість цього він намагатиметься вирішити проблему ізольовано, що може призвести до неоптимальних результатів або навіть відвертих помилок. Введіть Розповсюдження думки (TP), метод, розроблений для розширення можливостей міркування LLM. TP має на меті подолати властиві обмеження LLMs, дозволяючи їм черпати з резервуару аналогічних проблем та їх відповідних рішень. Цей інноваційний підхід не тільки покращує точність рішень, створених LLM, але й значно покращує їхню здатність вирішувати багатоетапні складні завдання міркування. Використовуючи потужність аналогії, TP надає структуру, яка розширює вроджені можливості міркування LLM, наближаючи нас на один крок до створення справді інтелектуальних штучних систем.

Розповсюдження думки складається з двох основних етапів:

  1. По-перше, LLM пропонується запропонувати та вирішити набір аналогічних проблем, пов’язаних із проблемою введення
  2. Далі розв’язки цих аналогічних проблем використовуються або для безпосереднього отримання нового розв’язку, або для внесення змін до початкового розв’язку.

Процес виявлення аналогічних проблем дозволяє LLM повторно використовувати стратегії вирішення проблем і рішення, тим самим покращуючи свої здібності міркування. TP сумісний з існуючими методами підказок, забезпечуючи узагальнене рішення, яке можна включити в різні завдання без значної інженерної розробки для конкретного завдання.

 

Процес поширення думки
малюнок 1: Процес поширення думки (зображення з паперу)
 

Крім того, не можна недооцінювати адаптивність ТП. Його сумісність із існуючими методами підказок робить його надзвичайно універсальним інструментом. Це означає, що TP не обмежується будь-яким конкретним типом області вирішення проблем. Це відкриває захоплюючі можливості для точного налаштування й оптимізації під конкретні завдання, тим самим підвищуючи корисність і ефективність LLM у широкому спектрі програм.

Реалізація Thought Propagation може бути інтегрована в робочий процес існуючих LLM. Наприклад, у завданні «Обґрунтування найкоротшого шляху» TP може спочатку розв’язати набір простіших аналогічних задач, щоб зрозуміти різні можливі шляхи. Потім він використав би цю інформацію для вирішення складної проблеми, тим самим збільшуючи ймовірність знаходження оптимального рішення.

 
Приклад 1

  • Завдання: Розуміння найкоротшого шляху
  • Аналогічні задачі: Найкоротший шлях між точками А і Б, Найкоротший шлях між точками В і С
  • Остаточне рішення: Оптимальний шлях від точки А до С з урахуванням розв’язків аналогічних задач

 
Приклад 2

  • Завдання: Креативне письмо
  • Аналогічні задачі: Написати невелику розповідь про дружбу, Написати невелику розповідь про довіру
  • Остаточне рішення: Напишіть складну коротку історію, яка об’єднує теми дружби та довіри

 
Цей процес передбачає спочатку вирішення цих аналогічних проблем, а потім використання отриманої інформації для вирішення складного завдання. Цей метод продемонстрував свою ефективність у багатьох завданнях, демонструючи суттєві покращення показників продуктивності.

Наслідки Thought Propagation виходять за рамки простого вдосконалення існуючих показників. Ця техніка підказок може змінити те, як ми розуміємо та розгортаємо LLM. Методологія підкреслює перехід від ізольованого, атомарного вирішення проблем до більш цілісного, взаємопов’язаного підходу. Це спонукає нас розглянути, як LLM можуть навчатися не лише на даних, але й на самому процесі вирішення проблем. Постійно оновлюючи своє розуміння шляхом вирішення аналогічних проблем, LLMs, оснащені TP, краще підготовлені до вирішення непередбачених викликів, що робить їх більш стійкими та адаптованими в середовищах, що швидко розвиваються.

Поширення думок є багатообіцяючим доповненням до інструментарію методів підказок, спрямованих на розширення можливостей LLM. Дозволяючи LLM використовувати аналогічні проблеми та їх вирішення, TP забезпечує більш тонкий та ефективний метод міркування. Експерименти підтверджують його ефективність, що робить його кандидатом на стратегію для покращення продуктивності LLM у різноманітних завданнях. Зрештою, TP може стати значним кроком вперед у пошуку більш потужних систем ШІ.
 
 

Метью Майо (@mattmayo13) має ступінь магістра з інформатики та диплом з інтелектуального аналізу даних. Як головний редактор KDnuggets, Метью прагне зробити доступними концепції складних наукових даних. Його професійні інтереси включають обробку природної мови, алгоритми машинного навчання та дослідження ШІ. Він керується місією демократизації знань у спільноті науки про дані. Метью кодує з 6 років.

Часова мітка:

Більше від KDnuggets