사고 전파: 대규모 언어 모델을 사용한 복잡한 추론에 대한 유추적 접근 방식 - KDnuggets

플라톤에 의해 재발행

팔로워 : 0

사고 전파: 대규모 언어 모델을 사용한 복잡한 추론에 대한 유추적 접근 방식

주요 요점

TP(사고 전파)는 LLM(대형 언어 모델)의 복잡한 추론 능력을 향상시키는 새로운 방법입니다.
TP는 LLM이 처음부터 추론하는 대신 유사한 문제와 솔루션을 활용하여 추론을 개선합니다.
다양한 작업에 대한 실험에서 TP는 기본 방법보다 12%에서 15%까지 향상된 성능을 보이는 것으로 나타났습니다.

TP는 먼저 LLM이 입력 문제와 관련된 일련의 유사한 문제를 제안하고 해결하도록 유도합니다. 그런 다음 TP는 유사한 문제의 결과를 재사용하여 직접 새로운 솔루션을 도출하거나 지식 집약적인 실행 계획을 도출하여 처음부터 얻은 초기 솔루션을 수정합니다.

LLM(대형 언어 모델)의 다양성과 계산 능력은 부인할 수 없지만 한계가 없는 것은 아닙니다. LLM의 가장 중요하고 일관된 과제 중 하나는 직면한 모든 새로운 작업에 대한 첫 번째 원칙을 추론하는 것으로 구성된 문제 해결에 대한 일반적인 접근 방식입니다. 이는 높은 수준의 적응성을 허용하지만 특히 다단계 추론이 필요한 작업에서 오류 가능성을 높이기 때문에 문제가 됩니다.

"처음부터 추론"이라는 과제는 여러 단계의 논리와 추론이 필요한 복잡한 작업에서 특히 두드러집니다. 예를 들어, LLM이 상호 연결된 지점의 네트워크에서 최단 경로를 찾도록 요청받은 경우 일반적으로 솔루션을 찾기 위해 사전 지식이나 유사한 문제를 활용하지 않습니다. 대신 문제를 개별적으로 해결하려고 시도하며, 이로 인해 최적이 아닌 결과가 나오거나 심지어는 완전한 오류가 발생할 수도 있습니다. 입력하다 생각의 전파 (TP)는 LLM의 추론 능력을 강화하기 위해 고안된 방법입니다. TP는 유사한 문제와 그에 상응하는 솔루션을 활용하여 LLM의 고유한 한계를 극복하는 것을 목표로 합니다. 이 혁신적인 접근 방식은 LLM에서 생성된 솔루션의 정확성을 향상시킬 뿐만 아니라 다단계의 복잡한 추론 작업을 처리하는 능력도 크게 향상시킵니다. TP는 유추의 힘을 활용하여 LLM의 타고난 추론 기능을 증폭시키는 프레임워크를 제공하여 진정한 지능형 인공 시스템의 실현에 한 걸음 더 다가서게 해줍니다.

사고 전파에는 두 가지 주요 단계가 포함됩니다.

첫째, LLM은 입력 문제와 관련된 일련의 유사한 문제를 제안하고 해결하도록 요청받습니다.
다음으로, 이러한 유사한 문제에 대한 솔루션은 새로운 솔루션을 직접 생성하거나 초기 솔루션을 수정하는 데 사용됩니다.

유사한 문제를 식별하는 과정을 통해 LLM은 문제 해결 전략과 솔루션을 재사용하여 추론 능력을 향상시킬 수 있습니다. TP는 기존 프롬프트 방법과 호환되므로 중요한 작업별 엔지니어링 없이 다양한 작업에 통합할 수 있는 일반화 가능한 솔루션을 제공합니다.

그림 1: 생각 전파 과정 (종이 이미지)

더욱이 TP의 적응성을 과소평가해서는 안 됩니다. 기존 프롬프트 방법과의 호환성으로 인해 매우 다양한 도구가 됩니다. 이는 TP가 특정 종류의 문제 해결 도메인에만 국한되지 않음을 의미합니다. 이는 작업별 미세 조정 및 최적화를 위한 흥미로운 방법을 열어 광범위한 응용 분야에서 LLM의 유용성과 효율성을 높입니다.

사고 전파 구현은 기존 LLM의 작업 흐름에 통합될 수 있습니다. 예를 들어, 최단 경로 추론 작업에서 TP는 먼저 더 간단하고 유사한 문제 세트를 해결하여 다양한 가능한 경로를 이해할 수 있습니다. 그런 다음 이러한 통찰력을 사용하여 복잡한 문제를 해결함으로써 최적의 솔루션을 찾을 가능성을 높입니다.

예제 1

태스크: 최단 경로 추론
유사한 문제: A와 B 사이의 최단 경로, B와 C 사이의 최단 경로
마지막 해결책: 유사한 문제의 해결을 고려한 지점 A에서 C까지의 최적 경로

예제 2

태스크: 문예창작
유사한 문제: 우정에 관한 짧은 이야기 쓰기, 신뢰에 대한 짧은 이야기 쓰기
마지막 해결책: 우정과 신뢰를 주제로 한 복잡한 단편 소설 쓰기

이 프로세스에는 먼저 이러한 유사한 문제를 해결한 다음 얻은 통찰력을 사용하여 당면한 복잡한 작업을 해결하는 것이 포함됩니다. 이 방법은 여러 작업에 걸쳐 효율성을 입증했으며 성능 지표가 크게 향상되었습니다.

사고 전파의 의미는 단순히 기존 지표를 개선하는 것 이상입니다. 이 프롬프트 기술은 LLM을 이해하고 배포하는 방법을 바꿀 가능성이 있습니다. 이 방법론은 고립된 원자 문제 해결에서 보다 전체적이고 상호 연결된 접근 방식으로의 전환을 강조합니다. 이는 LLM이 데이터뿐만 아니라 문제 해결 과정 자체에서도 학습할 수 있는 방법을 고려하도록 유도합니다. 유사한 문제에 대한 솔루션을 통해 지속적으로 이해를 업데이트함으로써 TP를 갖춘 LLM은 예상치 못한 문제를 해결할 준비가 더 잘 되어 빠르게 변화하는 환경에서 더욱 탄력적이고 적응력이 높아집니다.

사고 전파는 LLM의 역량 강화를 목표로 하는 프롬프트 방법 도구 상자에 유망한 추가 기능입니다. LLM이 유사한 문제와 해당 솔루션을 활용할 수 있도록 함으로써 TP는 보다 미묘하고 효과적인 추론 방법을 제공합니다. 실험을 통해 그 효율성이 확인되어 다양한 작업에서 LLM의 성능을 향상시키기 위한 후보 전략이 되었습니다. TP는 궁극적으로 더 유능한 AI 시스템을 찾는 데 있어 중요한 진전을 나타낼 수 있습니다.

매튜 메이요 (@mattmayo13)는 컴퓨터 과학 석사 학위와 데이터 마이닝 분야 대학원 학위를 보유하고 있습니다. KDnuggets의 편집장인 Matthew는 복잡한 데이터 과학 개념을 쉽게 이해할 수 있도록 만드는 것을 목표로 합니다. 그의 전문적인 관심 분야에는 자연어 처리, 기계 학습 알고리즘, 신흥 AI 탐구가 포함됩니다. 그는 데이터 과학 커뮤니티에서 지식을 민주화하려는 사명을 갖고 있습니다. 매튜는 6살 때부터 코딩을 해왔습니다.