Criando valor real com LLMs

Criando valor real com LLMs

Nó Fonte: 2906364

Em meados de 2023, o mundo da computação está fervilhando de entusiasmo com o surgimento de grandes modelos de linguagem (LLMs), como GPT4/ChatGPT premium e StarChat. Compreender o que estes modelos podem ou não fazer e como aplicá-los com sucesso para obter vantagens comerciais não é simples. É importante analisar as pesquisas emergentes sobre as propriedades da geração atual de LLMs e delinear as estratégias que precisarão ser adotadas para que sejam aplicadas com sucesso. 

Os LLMs são especiais porque emitem linguagem em resposta à linguagem; se o modelo for estimulado com algum texto, ele produz um texto relevante como resposta. Isso significa que é fácil para qualquer pessoa interagir com qualquer LLM para o qual tenha uma interface, e muitos LLMs foram disponibilizados publicamente por meio de interfaces de bate-papo. Por causa disso, o desenvolvimento de LLMs como uma tecnologia de IA teve um impacto repentino e significativo na percepção pública das capacidades da IA. 
 
Compreendendo os LLMs 

 A única coisa que os LLMs fazem é consumir texto e produzir texto, mas como a geração de texto é tão boa, os modelos parecem raciocinar e compreender o texto que estão manipulando. Muitas pessoas que trabalham com linguagem natural e pesquisa de IA têm trabalhado arduamente para compreender e testar as capacidades do LLM. Há uma literatura crescente que identifica as limitações da atual geração de modelos e demonstra que talvez o entusiasmo inicial que os saudou deva ser moderado. É importante resumir a lista atual de limitações dos LLMs de última geração e avaliar tanto a importância destas como a probabilidade de se revelarem falhas fundamentais dos LLMs como abordagem à IA. Em outro trabalho, são levantadas algumas das limitações técnicas dos LLMs.  

No entanto, observei as limitações validadas com alguns exemplos simples do comportamento atual do LLM e analisei restrições não técnicas, como questões de segurança e propriedade intelectual. Depois de analisar as limitações da tecnologia, você poderá então examinar como a tecnologia pode ser aplicada com sucesso e em que as empresas devem se concentrar para gerar o máximo valor a partir da oportunidade que a revolução LLM cria. 

Um caminho para o sucesso 

Um caminho para o sucesso pode ser definido para organizações que desejam aceder ao valor indubitável da nova geração de LLMs, ao mesmo tempo que gerem o risco das suas fraquezas identificadas. Este caminho para o sucesso reside entre restringir o uso dos LLMs a componentes que forneçam funcionalidades bem especificadas e controladas, para incorporá-los em infra-estruturas apropriadas de controlo e responsabilização. 

É possível que futuros LLMs resolvam os problemas que atualmente impedem o uso irrestrito desta nova geração de modelos. Por exemplo, os LLMs podem muito bem ser reprojetados (além dos transformadores de corrente) para planejarem de forma eficaz num futuro relativamente próximo. Tecnicamente, não parece haver uma razão fundamental para que isto não possa ser feito, embora certamente exija outro investimento surpreendente em poder computacional.  

Outras limitações, como lidar com raciocínio composicional, papagaio e segurança, parecem mais intratáveis. Independentemente dos avanços contínuos, vale a pena considerar que tecnologias muito mais simples, maduras e previsíveis, como e-mail, bancos de dados e navegadores da Web, ainda exigem padrões de aplicativos e controles de gerenciamento sofisticados. Parece improvável que os LLMs sejam diferentes. 

A interface de linguagem natural demonstrada por muitos dos LLMs de última geração despertou uma população muito mais ampla para o poder dos LLMs em particular, e da IA ​​em geral. Como tal, identificámos algumas das principais limitações de tais abordagens e, ao mesmo tempo, fizemos recomendações para implementações que podem mitigar algumas destas questões, permitindo, em última análise, a adoção bem-sucedida de LLMs. No entanto, é preciso destacar que nada disso elimina a necessidade de visão, investimento e de uma equipe qualificada para implementar tais soluções. 

Carimbo de hora:

Mais de Fintextra