Распространение мысли: аналогичный подход к сложным рассуждениям с использованием больших языковых моделей

Распространение мысли: аналогичный подход к сложным рассуждениям с использованием больших языковых моделей – KDnuggets

Исходный узел: 2963270

Распространение мысли: аналогичный подход к сложным рассуждениям с использованием больших языковых моделей

 

Основные выводы

  • Распространение мысли (TP) — это новый метод, который расширяет возможности сложных рассуждений моделей большого языка (LLM).
  • TP использует аналогичные проблемы и их решения для улучшения рассуждений, а не заставляет студентов рассуждать с нуля.
  • Эксперименты с различными задачами показывают, что TP существенно превосходит базовые методы с улучшением от 12% до 15%.

ТП сначала предлагает LLM предложить и решить набор аналогичных задач, связанных с входной. Затем TP повторно использует результаты аналогичных задач, чтобы напрямую получить новое решение или разработать наукоемкий план выполнения для внесения изменений в исходное решение, полученное с нуля.

Универсальность и вычислительная мощность моделей большого языка (LLM) неоспоримы, но они не безграничны. Одной из наиболее значительных и постоянных проблем для LLM является их общий подход к решению проблем, состоящий в рассуждении на основе основных принципов для каждой новой возникающей задачи. Это проблематично, поскольку обеспечивает высокую степень адаптивности, но также увеличивает вероятность ошибок, особенно в задачах, требующих многоэтапного рассуждения.

Проблема «рассуждения с нуля» особенно заметна в сложных задачах, требующих нескольких этапов логики и умозаключений. Например, если LLM просят найти кратчайший путь в сети взаимосвязанных точек, он обычно не будет использовать предварительные знания или аналогичные проблемы для поиска решения. Вместо этого он попытается решить проблему изолированно, что может привести к неоптимальным результатам или даже к прямым ошибкам. Входить Распространение мысли (TP), метод, предназначенный для расширения рассуждений LLM. Целью TP является преодоление присущих LLM ограничений, позволяя им извлекать из резервуара аналогичных проблем и соответствующие решения. Этот инновационный подход не только повышает точность решений, генерируемых LLM, но и значительно расширяет их способность решать многоэтапные и сложные логические задачи. Используя силу аналогии, TP обеспечивает основу, которая расширяет врожденные способности LLM к рассуждению, приближая нас на один шаг к созданию действительно интеллектуальных искусственных систем.

Распространение мысли включает в себя два основных этапа:

  1. Сначала LLM предлагается предложить и решить ряд аналогичных задач, связанных с проблемой ввода.
  2. Далее решения этих аналогичных задач используются либо для непосредственного получения нового решения, либо для внесения изменений в исходное решение.

Процесс выявления аналогичных проблем позволяет LLM повторно использовать стратегии и решения проблем, тем самым улучшая свои способности к рассуждению. TP совместим с существующими методами подсказок, предоставляя обобщаемое решение, которое можно использовать в различных задачах без необходимости тщательного проектирования конкретных задач.

 

Процесс распространения мысли
Рисунок 1: Процесс распространения мысли (Изображение с бумаги)
 

Более того, не следует недооценивать адаптивность ТП. Его совместимость с существующими методами подсказок делает его очень универсальным инструментом. Это означает, что TP не ограничивается какой-либо конкретной областью решения проблем. Это открывает захватывающие возможности для тонкой настройки и оптимизации конкретных задач, тем самым повышая полезность и эффективность LLM в широком спектре приложений.

Внедрение распространения мысли может быть интегрировано в рабочий процесс существующих программ LLM. Например, в задаче «Рассуждение по кратчайшему пути» TP может сначала решить ряд более простых аналогичных задач, чтобы понять различные возможные пути. Затем он будет использовать эти идеи для решения сложной проблемы, тем самым увеличивая вероятность нахождения оптимального решения.

 
Пример 1

  • Сложность задачи : Рассуждение по кратчайшему пути
  • Аналогичные задачи: Кратчайший путь между точками A и B, Кратчайший путь между точками B и C
  • Окончательное решение: Оптимальный путь из точки А в С с учетом решения аналогичных задач.

 
Пример 2

  • Сложность задачи : Писательское творчество
  • Аналогичные задачи: Напишите рассказ о дружбе, Напишите рассказ о доверии.
  • Окончательное решение: Напишите сложный рассказ, объединяющий темы дружбы и доверия.

 
Этот процесс включает в себя сначала решение аналогичных проблем, а затем использование полученных знаний для решения стоящей сложной задачи. Этот метод продемонстрировал свою эффективность при решении множества задач, продемонстрировав существенное улучшение показателей производительности.

Значение «Распространения мысли» выходит за рамки простого улучшения существующих показателей. Этот метод подсказок может изменить то, как мы понимаем и используем LLM. Эта методология подчеркивает переход от изолированного, атомарного решения проблем к более целостному и взаимосвязанному подходу. Это побуждает нас задуматься о том, как LLM могут учиться не только на данных, но и на самом процессе решения проблем. Постоянно обновляя свое понимание посредством решения аналогичных проблем, LLM, оснащенные TP, лучше подготовлены к решению непредвиденных проблем, что делает их более устойчивыми и адаптируемыми в быстро меняющихся средах.

Распространение мысли — многообещающее дополнение к набору методов подсказки, направленное на расширение возможностей LLM. Позволяя специалистам LLM использовать аналогичные проблемы и их решения, TP обеспечивает более детальный и эффективный метод рассуждения. Эксперименты подтверждают его эффективность, что делает его кандидатом на стратегию повышения эффективности LLM при решении различных задач. В конечном итоге TP может стать значительным шагом вперед в поиске более эффективных систем искусственного интеллекта.
 
 

Мэтью Майо (@mattmayo13) имеет степень магистра в области компьютерных наук и диплом о высшем образовании в области интеллектуального анализа данных. Будучи главным редактором KDnuggets, Мэтью стремится сделать доступными сложные концепции науки о данных. Его профессиональные интересы включают обработку естественного языка, алгоритмы машинного обучения и исследование нового искусственного интеллекта. Его миссией является демократизация знаний в сообществе специалистов по обработке и анализу данных. Мэтью занимается программированием с 6 лет.

Отметка времени:

Больше от КДнаггетс