20 de Setembro de 2023
Modelos fundamentais (FMs) estão marcando o início de uma nova era na aprendizado de máquina (ML) e inteligência artificial (AI), o que está a conduzir a um desenvolvimento mais rápido de IA que pode ser adaptada a uma vasta gama de tarefas a jusante e afinada para uma série de aplicações.
Com a crescente importância do processamento de dados onde o trabalho está sendo executado, servir modelos de IA na borda da empresa permite previsões quase em tempo real, ao mesmo tempo em que atende aos requisitos de soberania e privacidade dos dados. Ao combinar o IBM Watson dados e recursos de plataforma de IA para FMs com computação de ponta, as empresas podem executar cargas de trabalho de IA para ajuste fino e inferência de FM na borda operacional. Isso permite que as empresas dimensionem implantações de IA na borda, reduzindo o tempo e o custo de implantação com tempos de resposta mais rápidos.
Certifique-se de verificar todas as parcelas desta série de postagens de blog sobre computação de ponta:
O que são modelos fundamentais?
Os modelos fundamentais (FMs), que são treinados em um amplo conjunto de dados não rotulados em escala, estão impulsionando aplicações de inteligência artificial (IA) de última geração. Eles podem ser adaptados a uma ampla gama de tarefas posteriores e ajustados para uma variedade de aplicações. Os modelos modernos de IA, que executam tarefas específicas num único domínio, estão a dar lugar aos FMs porque aprendem de forma mais geral e trabalham em domínios e problemas. Como o nome sugere, um FM pode ser a base para muitas aplicações do modelo de IA.
Os FMs abordam dois desafios principais que têm impedido as empresas de ampliar a adoção da IA. Primeiro, as empresas produzem uma grande quantidade de dados não rotulados, dos quais apenas uma fração é rotulada para formação de modelos de IA. Em segundo lugar, esta tarefa de rotulagem e anotação é extremamente intensiva em termos humanos, muitas vezes exigindo várias centenas de horas do tempo de um especialista no assunto (SME). Isto torna proibitivo em termos de custos a escalabilidade entre casos de utilização, uma vez que exigiria exércitos de PME e especialistas em dados. Ao ingerir grandes quantidades de dados não rotulados e ao usar técnicas auto-supervisionadas para treinamento de modelos, os FMs removeram esses gargalos e abriram o caminho para a adoção em larga escala da IA em toda a empresa. Essas enormes quantidades de dados que existem em todas as empresas estão esperando para serem liberadas para gerar insights.
O que são grandes modelos de linguagem?
Grandes modelos de linguagem (LLMs) são uma classe de modelos fundamentais (FM) que consistem em camadas de redes neurais que foram treinados nessas enormes quantidades de dados não rotulados. Eles usam algoritmos de aprendizagem auto-supervisionados para realizar uma variedade de processamento de linguagem natural (PNL) tarefas de maneira semelhante à forma como os humanos usam a linguagem (ver Figura 1).
Dimensione e acelere o impacto da IA
Existem várias etapas para construir e implantar um modelo fundamental (FM). Isso inclui ingestão de dados, seleção de dados, pré-processamento de dados, pré-treinamento de FM, ajuste de modelo para uma ou mais tarefas downstream, serviço de inferência e governança de modelo de dados e IA e gerenciamento de ciclo de vida - todos os quais podem ser descritos como FMOps.
Para ajudar com tudo isso, a IBM está oferecendo às empresas as ferramentas e capacidades necessárias para aproveitar o poder desses FMs por meio de IBM Watson, uma plataforma de dados e IA pronta para empresas, projetada para multiplicar o impacto da IA em uma empresa. IBM watsonx consiste no seguinte:
- IBM watsonx.ai traz novidades IA generativa recursos – alimentados por FMs e aprendizado de máquina tradicional (ML) – em um estúdio poderoso que abrange o ciclo de vida da IA.
- IBM watsonx.data é um armazenamento de dados adequado à finalidade, construído em uma arquitetura aberta de lago para dimensionar cargas de trabalho de IA para todos os seus dados, em qualquer lugar.
- IBM watsonx.governança é um kit de ferramentas automatizado de governança do ciclo de vida de IA de ponta a ponta, desenvolvido para permitir fluxos de trabalho de IA responsáveis, transparentes e explicáveis.
Outro vetor importante é a crescente importância da computação na borda da empresa, como locais industriais, fábricas, lojas de varejo, locais de telecomunicações na borda, etc. Mais especificamente, a IA na borda da empresa permite o processamento de dados onde o trabalho está sendo executado para análise quase em tempo real. A borda empresarial é onde grandes quantidades de dados empresariais são geradas e onde a IA pode fornecer insights de negócios valiosos, oportunos e acionáveis.
Servir modelos de IA na borda permite previsões quase em tempo real, ao mesmo tempo em que atende aos requisitos de soberania e privacidade dos dados. Isto reduz significativamente a latência frequentemente associada à aquisição, transmissão, transformação e processamento de dados de inspeção. Trabalhar na borda nos permite proteger dados corporativos confidenciais e reduzir custos de transferência de dados com tempos de resposta mais rápidos.
Dimensionar implantações de IA na borda, no entanto, não é uma tarefa fácil em meio a desafios relacionados a dados (heterogeneidade, volume e regulamentação) e recursos limitados (computação, conectividade de rede, armazenamento e até mesmo habilidades de TI). Eles podem ser amplamente descritos em duas categorias:
- Tempo/custo para implantar: Cada implantação consiste em diversas camadas de hardware e software que precisam ser instaladas, configuradas e testadas antes da implantação. Hoje, um profissional de serviço pode levar até uma ou duas semanas para instalar em cada local, limitando severamente a rapidez e a economia com que as empresas podem ampliar as implantações em toda a organização.
- Gerenciamento do dia 2: O grande número de bordas implantadas e a localização geográfica de cada implantação podem muitas vezes tornar proibitivamente caro fornecer suporte de TI local em cada local para monitorar, manter e atualizar essas implantações.
Implantações de IA de borda
A IBM desenvolveu uma arquitetura de ponta que aborda esses desafios, trazendo um modelo de dispositivo integrado de hardware/software (HW/SW) para implantações de IA de ponta. Consiste em vários paradigmas principais que auxiliam na escalabilidade das implantações de IA:
- Provisionamento sem intervenção humana baseado em políticas de toda a pilha de software.
- Monitoramento contínuo da integridade do sistema de borda
- Capacidades para gerenciar e enviar atualizações de software/segurança/configuração para vários pontos de presença, tudo a partir de um local central baseado em nuvem para gerenciamento no segundo dia.
Uma arquitetura distribuída hub-and-spoke pode ser utilizada para dimensionar implantações empresariais de IA na borda, onde uma nuvem central ou um data center corporativo atua como um hub e o dispositivo edge-in-a-box atua como um spoke em um local de borda. Esse modelo hub and spoke, que se estende por ambientes de nuvem híbrida e de borda, ilustra melhor o equilíbrio necessário para utilizar de forma otimizada os recursos necessários para operações de FM (veja a Figura 2).
O pré-treinamento desses grandes modelos de linguagem (LLMs) básicos e outros tipos de modelos básicos que usam técnicas autossupervisionadas em vastos conjuntos de dados não rotulados geralmente precisam de recursos de computação (GPU) significativos e são melhor executados em um hub. Os recursos computacionais praticamente ilimitados e as grandes pilhas de dados frequentemente armazenados na nuvem permitem o pré-treinamento de modelos de parâmetros grandes e a melhoria contínua na precisão desses modelos básicos.
Por outro lado, o ajuste desses FMs básicos para tarefas posteriores — que requerem apenas algumas dezenas ou centenas de amostras de dados rotulados e serviços de inferência — pode ser realizado com apenas algumas GPUs na borda da empresa. Isso permite que dados rotulados confidenciais (ou dados corporativos) permaneçam com segurança no ambiente operacional da empresa, ao mesmo tempo que reduz os custos de transferência de dados.
Usando uma abordagem full-stack para implantar aplicativos na borda, um cientista de dados pode realizar ajustes finos, testes e implantação dos modelos. Isso pode ser realizado em um único ambiente, ao mesmo tempo que reduz o ciclo de vida de desenvolvimento para servir novos modelos de IA aos usuários finais. Plataformas como o Red Hat OpenShift Data Science (RHODS) e o recentemente anunciado Red Hat OpenShift AI fornecem ferramentas para desenvolver e implantar rapidamente modelos de IA prontos para produção em nuvem distribuída e ambientes de borda.
Por fim, servir o modelo de IA ajustado na borda da empresa reduz significativamente a latência frequentemente associada à aquisição, transmissão, transformação e processamento de dados. Dissociar o pré-treinamento na nuvem do ajuste fino e da inferência na borda reduz o custo operacional geral, reduzindo o tempo necessário e os custos de movimentação de dados associados a qualquer tarefa de inferência (veja a Figura 3).
Para demonstrar esta proposta de valor de ponta a ponta, um modelo de base exemplar baseado em transformador de visão para infraestrutura civil (pré-treinado usando conjuntos de dados públicos e personalizados específicos do setor) foi ajustado e implantado para inferência em uma borda de três nós (falou) aglomerado. A pilha de software incluía o Red Hat OpenShift Container Platform e o Red Hat OpenShift Data Science. Este cluster de borda também foi conectado a uma instância do hub Red Hat Advanced Cluster Management for Kubernetes (RHACM) em execução na nuvem.
Provisionamento sem toque
O provisionamento sem toque baseado em políticas foi feito com o Red Hat Advanced Cluster Management for Kubernetes (RHACM) por meio de políticas e tags de posicionamento, que vinculam clusters de borda específicos a um conjunto de componentes e configurações de software. Esses componentes de software – que se estendem por toda a pilha e abrangem computação, armazenamento, rede e carga de trabalho de IA – foram instalados usando vários operadores OpenShift, provisionamento de serviços de aplicativos necessários e S3 Bucket (armazenamento).
O modelo fundamental (FM) pré-treinado para infraestrutura civil foi ajustado por meio de um Jupyter Notebook no Red Hat OpenShift Data Science (RHODS) usando dados rotulados para classificar seis tipos de defeitos encontrados em pontes de concreto. O serviço de inferência deste FM ajustado também foi demonstrado usando um servidor Triton. Além disso, o monitoramento da integridade desse sistema de borda foi possível agregando métricas de observabilidade dos componentes de hardware e software via Prometheus ao painel central do RHACM na nuvem. As empresas de infraestrutura civil podem implantar esses FMs em seus locais periféricos e usar imagens de drones para detectar defeitos quase em tempo real, acelerando o tempo de obtenção de insights e reduzindo o custo de movimentação de grandes volumes de dados de alta definição de e para a nuvem.
Resumo
Combinando IBM Watson Os recursos de dados e plataforma de IA para modelos básicos (FMs) com um dispositivo de ponta permitem que as empresas executem cargas de trabalho de IA para ajuste fino e inferência de FM na borda operacional. Este dispositivo pode lidar com casos de uso complexos prontos para uso e cria a estrutura hub-and-spoke para gerenciamento centralizado, automação e autoatendimento. As implantações do Edge FM podem ser reduzidas de semanas para horas com sucesso repetível, maior resiliência e segurança.
Saiba mais sobre modelos fundamentais
Certifique-se de verificar todas as parcelas desta série de postagens de blog sobre computação de ponta:
Mais da nuvem
- Conteúdo com tecnologia de SEO e distribuição de relações públicas. Seja amplificado hoje.
- PlatoData.Network Gerativa Vertical Ai. Capacite-se. Acesse aqui.
- PlatoAiStream. Inteligência Web3. Conhecimento Amplificado. Acesse aqui.
- PlatãoESG. Carbono Tecnologia Limpa, Energia, Ambiente, Solar, Gestão de resíduos. Acesse aqui.
- PlatoHealth. Inteligência em Biotecnologia e Ensaios Clínicos. Acesse aqui.
- Fonte: https://www.ibm.com/blog/foundational-models-at-the-edge/
- :tem
- :é
- :não
- :onde
- $UP
- 08
- 1
- 10
- 13
- 15%
- 20
- 2023
- 22
- 28
- 29
- 30
- 300
- 39
- 400
- 41
- 7
- 70
- 9
- a
- Sobre
- acelerar
- Acesso
- realizado
- precisão
- aquisição
- em
- atos
- adaptado
- Adicionalmente
- endereço
- endereços
- Adoção
- avançado
- avanços
- Publicidade
- AI
- Adoção de IA
- Modelos de IA
- Plataforma de IA
- Ajuda
- algoritmos
- Todos os Produtos
- permitir
- permite
- tb
- Entre
- quantidade
- quantidades
- amp
- an
- análise
- analítica
- e
- anunciou
- qualquer
- qualquer lugar
- Aplicação
- aplicações
- abordagem
- arquitetura
- SOMOS
- Ordem
- artigo
- artificial
- inteligência artificial
- Inteligência artificial (AI)
- AS
- associado
- At
- autor
- Automatizado
- Automação
- disponível
- Avenida
- em caminho duplo
- Equilíbrio
- Bank
- bancos
- base
- BE
- Porque
- tornam-se
- tornando-se
- sido
- Começo
- ser
- Acreditar
- MELHOR
- vincular
- Blog
- Posts do Blog
- Blogs
- ambos
- Caixa
- pontes
- Trazendo
- Traz
- amplo
- amplamente
- Prédio
- Constrói
- construído
- negócio
- by
- CAN
- capacidades
- capital
- Capturar
- carbono
- cartão
- Cartões
- casos
- CAT
- Categorias
- Causar
- Centralização de
- central
- Banco Central
- moedas digitais do banco central
- centralizada
- cadeia
- desafios
- alterar
- mudança
- verificar
- escolhas
- círculos
- CIS
- civil
- classe
- classificar
- remover filtragem
- clientes
- de perto
- Na nuvem
- Agrupar
- cor
- colorido
- combinando
- competitivo
- integrações
- complexidade
- compliance
- componentes
- Computar
- computação
- Configuração
- configurado
- conectado
- Conectividade
- consiste
- Recipiente
- continuar
- ao controle
- Custo
- custos
- poderia
- cobertura
- criptomoedas
- APF
- moedas
- personalizadas
- cliente
- experiência do cliente
- Clientes
- painel de instrumentos
- dados,
- Data Center
- Plataforma de dados
- ciência de dados
- cientista de dados
- conjuntos de dados
- Data
- dedicado
- Padrão
- definições
- entregar
- demonstrar
- demonstraram
- implantar
- implantado
- Implantação
- desenvolvimento
- Implantações
- descrito
- descrição
- projetado
- desenvolver
- desenvolvido
- Desenvolvimento
- digital
- moedas digitais
- digitalização
- Rompimento
- disruptivo
- Disruptores
- distribuído
- distrito
- domínio
- domínios
- feito
- distância
- condução
- zangão
- cada
- fácil
- ecossistema
- borda
- computação de borda
- ELEVATE
- elevado
- permitir
- permite
- final
- end-to-end
- engenheiro
- Engenharia
- Entrar
- Empreendimento
- empresas
- entrada
- Meio Ambiente
- ambientes
- Era
- especialmente
- etc.
- Éter (ETH)
- Mesmo
- eventos
- Cada
- evoluiu
- Examinando
- exemplos
- executar
- existir
- saída
- caro
- vasta experiência
- especialistas
- IA explicável
- explicando
- estendendo
- extremamente
- fatores
- RÁPIDO
- mais rápido
- poucos
- campo
- Figura
- financeiro
- Instituições financeiras
- financiamento
- Primeiro nome
- pisos
- seguir
- seguinte
- fontes
- Escolha
- Frente
- encontrado
- Foundation
- fração
- Quadro
- da
- cheio
- Full stack
- Além disso
- geralmente
- gerado
- gerador
- geográfico
- Geopolítica
- Dando
- Global
- comércio global
- governo
- GPU
- GPUs
- Grade
- mão
- manipular
- Hardware
- chapéu
- Ter
- Saúde
- altura
- ajudar
- ajuda
- ajuda
- alta definição
- superior
- altamente
- história
- hospedeiro
- HORÁRIO
- Como funciona o dobrador de carta de canal
- Como Negociar
- Contudo
- HTTPS
- Hub
- Humanos
- Centenas
- HÍBRIDO
- Nuvem híbrida
- IBM
- IBM Cloud
- ICO
- ÍCONE
- ilustra
- imagem
- Impacto
- importância
- melhoria
- in
- incluir
- incluído
- aumentando
- cada vez mais
- índice
- industrial
- indústrias
- indústria
- específico da indústria
- inflação
- Inflexão
- Ponto de inflexão
- influenciado
- Infraestrutura
- Iniciativa
- Inovação
- inovadores
- inputs
- insights
- instância
- instituições
- integrado
- Inteligência
- intrínseco
- introduzindo
- IT
- Suporte de TI
- Viagens
- jpg
- saltar
- Caderno Jupyter
- apenas por
- apenas um
- manteve
- Chave
- Kubernetes
- marcação
- língua
- grande
- largamente
- Latência
- mais recente
- camadas
- principal
- APRENDER
- aprendizagem
- Alavancagem
- wifecycwe
- como
- ilimitado
- linux
- local
- local
- localização
- locais
- longo
- olhar
- máquina
- aprendizado de máquina
- moldadas
- a manter
- fazer
- FAZ
- gerencia
- de grupos
- fabrica
- muitos
- marca��o
- maciço
- dominar
- Importância
- max-width
- mecanismos
- métodos
- Métrica
- minutos
- minimizando
- minutos
- ML
- Móvel Esteira
- modelo
- modelos
- EQUIPAMENTOS
- modernização
- modernizar
- Monitore
- monitoração
- mais
- movimento
- em movimento
- nome
- Navegação
- Perto
- necessário
- você merece...
- necessário
- Cria
- rede
- Novo
- Próximo
- PNL
- caderno
- nada
- agora
- número
- numeroso
- of
- oferecendo treinamento para distância
- frequentemente
- on
- ONE
- só
- aberto
- aberto
- operacional
- Operações
- operadores
- otimizado
- or
- organização
- Outros
- A Nossa
- Fora
- global
- pacotes
- página
- parâmetro
- pagamento
- métodos de pagamento
- pagamentos
- realizar
- realizada
- PHP
- localização
- plataforma
- Plataformas
- platão
- Inteligência de Dados Platão
- PlatãoData
- plug-in
- ponto
- políticas
- Privacidade
- posição
- possível
- Publique
- POSTAGENS
- potencial
- poder
- poderoso
- Previsões
- Prévio
- política de privacidade
- privado
- problemas
- em processamento
- produzir
- profissional
- proposição
- fornecer
- público
- Empurrar
- alcance
- rapidamente
- Leitura
- em tempo real
- recentemente
- registro
- gravação
- Vermelho
- Red Hat
- reduzir
- Reduzido
- reduz
- redução
- regulamentos
- Reguladores
- reguladores
- relacionado
- Removido
- Repetivel
- requerer
- requeridos
- Requisitos
- necessário
- pesquisa
- Recursos
- resposta
- responsável
- responsivo
- varejo
- Subir
- robôs
- Execute
- corrida
- seguramente
- mesmo
- AMPLIAR
- Escala
- escala ai
- dimensionamento
- Ciência
- Cientista
- Peneira
- Scripts
- Segundo
- firmemente
- segurança
- Vejo
- visto
- doadores,
- Autoatendimento
- sensível
- seo
- Setembro
- Série
- servidor
- serviço
- Serviços
- de servir
- Sessão
- sessões
- conjunto
- vários
- Partilhar
- mostrar
- periodo
- de forma considerável
- semelhante
- desde
- Singapore
- solteiro
- ambiente único
- local
- Locais
- SIX
- Habilidades
- pequeno
- EMS
- PME
- Software
- componentes de software
- solução
- soberania
- Espaço
- abrangendo
- específico
- especificamente
- Patrocinado
- pilha
- começo
- estado-da-arte
- ficar
- Passos
- armazenamento
- loja
- armazenadas
- lojas
- Storm
- estudo
- sujeito
- sucesso
- tal
- Sugere
- supply
- cadeia de suprimentos
- ajuda
- certo
- .
- Tire
- tomado
- Tarefa
- tarefas
- técnicas
- Tecnologia
- Telco
- Temenos
- dezenas
- Terraform
- testado
- ensaio
- que
- A
- deles
- tema
- Lá.
- Este
- deles
- isto
- Através da
- tempo
- oportuno
- vezes
- Título
- para
- hoje
- juntos
- kit de ferramentas
- ferramentas
- topo
- comércio
- tradicional
- Trem
- treinado
- Training
- transferência
- Transformar
- Transformação
- transformações
- transparente
- Tritão
- dois
- tipo
- tipos
- desencadeou
- Atualizar
- Atualizações
- URL
- us
- usar
- usava
- usuários
- utilização
- utilizar
- utilizado
- Valioso
- valor
- proposição de valor
- variedade
- vário
- Grande
- via
- Ver
- praticamente
- volume
- volumes
- W
- Esperando
- Wallet
- foi
- Onda
- Caminho..
- maneiras
- we
- semana
- semanas
- O Quê
- O que é a
- quando
- qual
- enquanto
- QUEM
- porque
- Largo
- Ampla variedade
- de
- dentro
- mulher
- WordPress
- Atividades:
- fluxos de trabalho
- trabalhar
- seria
- escrito
- investimentos
- zefirnet