Código aberto ou OpenAI: qual é o melhor caminho para IA avançada? - Descriptografar

Código aberto ou OpenAI: qual é o melhor caminho para IA avançada? – Descriptografar

Nó Fonte: 3043320

Os modelos de inteligência artificial fragmentados, descentralizados e de código aberto podem competir com modelos proprietários bem financiados, como o poderoso GPT-4 da OpenAI? A pergunta frequente alimentou um debate acalorado no Twitter depois que um ex-pesquisador de IA do Google escolheu um lado.

Arnaud Benard, cofundador da Galileo AI, lançou o desafio, dizendo: “Se você acha que os modelos de código aberto vencerão o GPT-4 este ano, você está errado”. Ele citou o talento e os recursos da OpenAI e a natureza robusta do GPT-4 como um produto além de um LLM, e afirmou que os projetos de código aberto podem ter dificuldades para passar de desafiadores a campeões de IA.

Não surpreendentemente, o tweet de Benard provocou reações mistas, que vão desde um apoio vociferante a um desacordo feroz.

Ryan Casey, um popular entusiasta de IA que escreve o boletim informativo “Além dos Bosques Amarelos,” offered a more optimistic take on open-source AI’s potential, stating, “Open source will match or beat this year,” according to his calculations. “If there’s demand for it, there will be innovation.”

Por outro lado, o estrategista de IA Jeremi Traguna notado que “os modelos OpenAI continuam em movimento”, acrescentando que “os modelos de código aberto terão dificuldade em manter a velocidade para atingir um alvo em movimento no momento em que o alvo estiver em posição de ser atingido”. Em outras palavras, embora os modelos de código aberto possam estar alcançando o GPT-3.5 na era do GPT-4, pode haver um GPT-5 no momento em que tivermos LLMs generalistas comparáveis ​​ao GPT-4.5 Turbo.

Analista de tecnologia, Jon Howells acredita que os recursos não são o único padrão que separa os LLMs de código aberto dos de código fechado.

“Mistral tem um grande financiamento, uma grande equipe e recentemente lançou um modelo de código aberto que supera o GPT-3.5”, escreveu ele. “Eles ou uma empresa semelhante lançarão um modelo de código aberto de nível GPT-4 até o final deste ano.”

Mistral AI, uma startup francesa, ganhou reconhecimento após lançar seu Mixtral LLM, que oferece desempenho aprimorado em relação ao GPT-3.5 em muitos casos de uso.

Em uma discussão encadeada, o cofundador da Nous Research, “Teknium”, apresentou um ponto importante, embora filosófico. “Cada aumento de capacidade no sistema operacional (código aberto) é algo permanente que nunca pode ser tirado do mundo e que pode ser usado de forma confiável para sempre”, disse ele. Basicamente, enquanto houver algum avanço na tecnologia de IA de código aberto, nenhuma empresa poderá restringir seu acesso.

Aberto ou fechado? Um debate sem fim

O debate entre código aberto e código fechado lembra as primeiras batalhas de sistemas operacionais entre Windows e Linux. Santiago Pino, da ML School, escreveu que os modelos proprietários de IA podem conquistar os consumidores em geral, como o Windows fez, mas que o software de código aberto fornece personalização e controle que podem ser extremamente úteis para usuários corporativos.

Pino destacou quantas empresas começam a experimentar o ChatGPT, mas depois migram para modelos de código aberto, que podem ajustar e personalizar de acordo com suas necessidades específicas e requisitos de conformidade de dados. As soluções de código aberto evitam a dependência de fornecedores e proporcionam transparência, disse ele.

“Modelos fechados e proprietários podem conquistar indivíduos, mas a maioria das empresas não quer enviar seus dados para a Microsoft ou o Google. Eles querem controle. Modelos de código aberto são a resposta”, disse ele em um tweet dias antes de o tópico de Bernard se tornar viral.

Esse tipo de visão foi compartilhada no debate sobre o tweet de Bernard pela Scimo Inc., uma empresa de desenvolvimento de software, que enfatizou o potencial de nicho dos modelos de código aberto: “(Modelos de código aberto) competirão onde for importante: problemas específicos de domínio com dados e conhecimentos específicos de domínio que (OpenAI) não possui.”

Furkan Gözükara, um engenheiro de computação conhecido por seu canal no YouTube SECursos, também está entre aqueles com uma postura mais matizada. Conversando com Descifrar, ele concordou com Bernard, dizendo que “somente em tarefas específicas os LLMs de código aberto passarão no OpenAI”.

Gözükara dá o exemplo de uma empresa que “treina LLM em (seus) próprios documentos”. Sim, a OpenAI tem a capacidade de personalizar GPTs com base em instruções e documentos específicos, mas o tratamento de dados confidenciais para terceiros é sempre uma preocupação. Essa preocupação foi recentemente validada quando foi revelado que GPTs personalizados distribuíam dados confidenciais a usuários terceiros.

Yan Lecun, chefe de desenvolvimento de IA da Meta e feroz defensor de código aberto, afirmou repetidamente que “os modelos básicos de IA de código aberto eliminarão os modelos de IA fechados e proprietários”. O Google, outro gigante da IA, também reconhece a ameaça representada pela IA de código aberto: “Os modelos de código aberto são mais rápidos, mais personalizáveis, mais privados e mais capazes, quilo por quilo”, disse um memorando do Google vazado em 2023.

Resta saber se os modelos de código aberto irão igualar ou superar o GPT-4 e as futuras iterações este ano. Contudo, as perspectivas dos especialistas de ambos os lados revelam uma tensão intrigante. Os modelos de código fechado podem ter uma vantagem em termos de recursos e iteração rápida, mas as ferramentas de código aberto estão evoluindo rapidamente, oferecendo capacidades permanentes e personalização. Por enquanto, a comunidade de IA pode observar o desenrolar da competição e aproveitar os benefícios de usar a melhor tecnologia disponível.

Editado por Ryan Ozawa.

Fique por dentro das notícias sobre criptomoedas, receba atualizações diárias em sua caixa de entrada.

Carimbo de hora:

Mais de Descifrar