Código aberto ou OpenAI: qual é o melhor caminho para IA avançada? - Descriptografar

Republicado por Platão

seguidores: 0

Os modelos de inteligência artificial fragmentados, descentralizados e de código aberto podem competir com modelos proprietários bem financiados, como o poderoso GPT-4 da OpenAI? A pergunta frequente alimentou um debate acalorado no Twitter depois que um ex-pesquisador de IA do Google escolheu um lado.

Arnaud Benard, cofundador da Galileo AI, lançou o desafio, dizendo: “Se você acha que os modelos de código aberto vencerão o GPT-4 este ano, você está errado”. Ele citou o talento e os recursos da OpenAI e a natureza robusta do GPT-4 como um produto além de um LLM, e afirmou que os projetos de código aberto podem ter dificuldades para passar de desafiadores a campeões de IA.

se você acha que os modelos de código aberto vencerão o gpt-4 este ano, você está errado.

trabalhei nos principais laboratórios de pesquisa de IA (google ai) e construí bibliotecas de código aberto com mais de 5 milhões de downloads mensais.

gpt-4 tem um ano e até agora nenhum modelo corresponde a ele, aqui está o porquê:

1. talento – openai recrutado…

-Arnaud Benard (@arnaudai) 1 de janeiro de 2024

Não surpreendentemente, o tweet de Benard provocou reações mistas, que vão desde um apoio vociferante a um desacordo feroz.

Ryan Casey, um popular entusiasta de IA que escreve o boletim informativo “Além dos Bosques Amarelos,” offered a more optimistic take on open-source AI’s potential, stating, “Open source will match or beat this year,” according to his calculations. “If there’s demand for it, there will be innovation.”

Por outro lado, o estrategista de IA Jeremi Traguna notado que “os modelos OpenAI continuam em movimento”, acrescentando que “os modelos de código aberto terão dificuldade em manter a velocidade para atingir um alvo em movimento no momento em que o alvo estiver em posição de ser atingido”. Em outras palavras, embora os modelos de código aberto possam estar alcançando o GPT-3.5 na era do GPT-4, pode haver um GPT-5 no momento em que tivermos LLMs generalistas comparáveis ao GPT-4.5 Turbo.

Analista de tecnologia, Jon Howells acredita que os recursos não são o único padrão que separa os LLMs de código aberto dos de código fechado.

“Mistral tem um grande financiamento, uma grande equipe e recentemente lançou um modelo de código aberto que supera o GPT-3.5”, escreveu ele. “Eles ou uma empresa semelhante lançarão um modelo de código aberto de nível GPT-4 até o final deste ano.”

Mistral AI, uma startup francesa, ganhou reconhecimento após lançar seu Mixtral LLM, que oferece desempenho aprimorado em relação ao GPT-3.5 em muitos casos de uso.

Em uma discussão encadeada, o cofundador da Nous Research, “Teknium”, apresentou um ponto importante, embora filosófico. “Cada aumento de capacidade no sistema operacional (código aberto) é algo permanente que nunca pode ser tirado do mundo e que pode ser usado de forma confiável para sempre”, disse ele. Basicamente, enquanto houver algum avanço na tecnologia de IA de código aberto, nenhuma empresa poderá restringir seu acesso.

Eu apresentei juntos e mistral, nenhuma das partes está brava com isso. Mas neste post, ele disse que nenhum modelo de sistema operacional vencerá o GPT-4, mas o GPT-4 será notícia velha – provavelmente este ano – não demorou muito para vencer o 3.5, e o CEO da Mistral disse que planeja lançar um nível GPT4 Abrir…

— Teknium (e/λ) (@ Teknium1) 1 de janeiro de 2024

Aberto ou fechado? Um debate sem fim

O debate entre código aberto e código fechado lembra as primeiras batalhas de sistemas operacionais entre Windows e Linux. Santiago Pino, da ML School, escreveu que os modelos proprietários de IA podem conquistar os consumidores em geral, como o Windows fez, mas que o software de código aberto fornece personalização e controle que podem ser extremamente úteis para usuários corporativos.

Pino destacou quantas empresas começam a experimentar o ChatGPT, mas depois migram para modelos de código aberto, que podem ajustar e personalizar de acordo com suas necessidades específicas e requisitos de conformidade de dados. As soluções de código aberto evitam a dependência de fornecedores e proporcionam transparência, disse ele.

“Modelos fechados e proprietários podem conquistar indivíduos, mas a maioria das empresas não quer enviar seus dados para a Microsoft ou o Google. Eles querem controle. Modelos de código aberto são a resposta”, disse ele em um tweet dias antes de o tópico de Bernard se tornar viral.

Os modelos de código aberto destruirão o ChatGPT e o Gemini.

A história dos Large Language Models de código aberto é a história do Linux. O Windows e o Mac conquistaram os consumidores, mas o Linux tornou-se o sistema operacional da Internet.

O mesmo acontecerá com ChatGPT, Gemini e modelos de código aberto. Fechado,… pic.twitter.com/fdmS1VNtqf

-Santiago (@svpino) 22 de dezembro de 2023

Esse tipo de visão foi compartilhada no debate sobre o tweet de Bernard pela Scimo Inc., uma empresa de desenvolvimento de software, que enfatizou o potencial de nicho dos modelos de código aberto: “(Modelos de código aberto) competirão onde for importante: problemas específicos de domínio com dados e conhecimentos específicos de domínio que (OpenAI) não possui.”

Furkan Gözükara, um engenheiro de computação conhecido por seu canal no YouTube SECursos, também está entre aqueles com uma postura mais matizada. Conversando com Descifrar, ele concordou com Bernard, dizendo que “somente em tarefas específicas os LLMs de código aberto passarão no OpenAI”.

Gözükara dá o exemplo de uma empresa que “treina LLM em (seus) próprios documentos”. Sim, a OpenAI tem a capacidade de personalizar GPTs com base em instruções e documentos específicos, mas o tratamento de dados confidenciais para terceiros é sempre uma preocupação. Essa preocupação foi recentemente validada quando foi revelado que GPTs personalizados distribuíam dados confidenciais a usuários terceiros.

Yan Lecun, chefe de desenvolvimento de IA da Meta e feroz defensor de código aberto, afirmou repetidamente que “os modelos básicos de IA de código aberto eliminarão os modelos de IA fechados e proprietários”. O Google, outro gigante da IA, também reconhece a ameaça representada pela IA de código aberto: “Os modelos de código aberto são mais rápidos, mais personalizáveis, mais privados e mais capazes, quilo por quilo”, disse um memorando do Google vazado em 2023.

Resta saber se os modelos de código aberto irão igualar ou superar o GPT-4 e as futuras iterações este ano. Contudo, as perspectivas dos especialistas de ambos os lados revelam uma tensão intrigante. Os modelos de código fechado podem ter uma vantagem em termos de recursos e iteração rápida, mas as ferramentas de código aberto estão evoluindo rapidamente, oferecendo capacidades permanentes e personalização. Por enquanto, a comunidade de IA pode observar o desenrolar da competição e aproveitar os benefícios de usar a melhor tecnologia disponível.

Editado por Ryan Ozawa.

Fique por dentro das notícias sobre criptomoedas, receba atualizações diárias em sua caixa de entrada.

Conteúdo com tecnologia de SEO e distribuição de relações públicas. Seja amplificado hoje.
PlatoData.Network Gerativa Vertical Ai. Capacite-se. Acesse aqui.
PlatoAiStream. Inteligência Web3. Conhecimento Amplificado. Acesse aqui.
PlatãoESG. Carbono Tecnologia Limpa, Energia, Ambiente, Solar, Gestão de resíduos. Acesse aqui.
PlatoHealth. Inteligência em Biotecnologia e Ensaios Clínicos. Acesse aqui.
Fonte: https://decrypt.co/211563/open-source-or-openai-whats-the-best-path-to-advanced-ai

Carimbo de hora: 2 de janeiro de 2024

Carimbo de hora: Julho 16, 2021

Republicado por Platão

Fique por dentro das notícias sobre criptomoedas, receba atualizações diárias em sua caixa de entrada.

À medida que o BUSD morre, o USDT do Tether absorve mais US $ 1 bilhão

A defesa de Sam Bankman-Fried quer mais latitude no questionamento de testemunhas

Projeto de lei de licenciamento de criptomoedas da Califórnia aguarda assinatura do governador

Coinfund lança fundo Web300 de US$ 3 milhões para apostar na próxima 'revolução industrial'

Um projeto de Blockchain acaba de comprar US $ 704 em bens imobiliários digitais para construir um shopping virtual

O que é Thorchain? A ponte DeFi para Bitcoin, Ethereum e muito mais

Esta semana em moedas: Bitcoin, Ethereum afundam na sexta-feira louca do Fed

Crypto.com abandona acordo de patrocínio de US $ 495 milhões com a Champions League Soccer: relatório

Ministro das Finanças da Holanda rejeita pedido do assessor do governo para banir a criptografia

Mercados de stablecoin escolhem vencedores e perdedores antes do processo da SEC Paxos

RUNE Token de Thorchain desliza 15% após exploração multimilionária

Sobre Nós

Pesquisa vertical e IA

Plataforma

Fique Ligado

Conta