ChatGPT fala sobre MBA da Wharton e exames médicos

Republicado por Platão

seguidores: 0

O software de bate-papo da OpenAI, ChatGPT, se fosse lançado no mundo, teria uma pontuação entre B e B no exame de Gerenciamento de Operações da Wharton Business School e se aproximaria ou excederia a pontuação necessária para passar no US Medical Licensing Exam (USMLE).

Embora isso possa dizer mais sobre a natureza estática e centrada em documentos do material de teste do que sobre a proeza intelectual do software, não deixa de ser uma questão de preocupação e interesse para os educadores e para quase todas as outras pessoas que vivem na era da automação.

Os acadêmicos têm se preocupado com o fato de sistemas assistivos como ChatGPT e do GitHub Copilot (baseado em um modelo OpenAI chamado Codex) exigirá que os professores reavaliem como ensinam e avaliam os exames porque a tecnologia assistiva baseada no aprendizado de máquina tornou-se tão capaz.

Em ambientes educacionais, o conselho de IA está se tornando comum: o Stanford Daily acaba de relatado, “um grande número de alunos já utilizou o ChatGPT nos seus exames finais.” Estima-se que 17% dos alunos, com base em uma pesquisa anônima com 4,497 entrevistados, disseram ter usado o ChatGPT para ajudar nas tarefas e exames do trimestre de outono, com 5% dizendo que enviaram material diretamente do ChatGPT com pouca ou nenhuma edição - o que é presumivelmente uma violação do código de honra.

Separadamente, Christian Terwiesch, professor da Wharton School da Universidade da Pensilvânia, e um grupo de pesquisadores médicos afiliados principalmente à Ansible Health, decidiram colocar o ChatGPT, um indiscutivelmente consultor automatizado amoral e desafiado factualmente sistema especialista, para o teste.

Tanto Terwiesch quanto os boffins do Ansible Health deixaram claro que o ChatGPT tem limitações e faz as coisas erradas. No geral, eles deram notas medianas, mas deixaram claro que esperam que os sistemas assistivos de IA encontrem um lugar no ensino e em outros setores.

Afinal, o modelo foi treinado em incontáveis peças de escrita feitas pelo homem e, portanto, sua capacidade de adivinhar uma resposta satisfatória a uma pergunta de todo esse conhecimento inalado e factóides não é inesperada.

“Primeiro, ele faz um trabalho incrível em gerenciamento de operações básicas e questões de análise de processos, incluindo aquelas baseadas em estudos de caso”, disse Terwiesch em seu papel. “Não apenas as respostas estão corretas, mas as explicações são excelentes.”

Dito isso, ele observou que o ChatGPT comete erros simples de matemática e se atrapalha com questões avançadas de análise de processos. No entanto, o modelo de IA responde às dicas das pessoas sobre como melhorar – ele pode se corrigir com sucesso quando recebe dicas de um especialista humano.

A orientação humana também serviu como fonte de entrada maliciosa, conforme demonstrado por Tay chatbot da Microsoft e por pesquisa subsequente.

Doutor, doutor

O grupo de pesquisa médica que escreveu “Desempenho do ChatGPT no USMLE: potencial para educação médica assistida por IA usando modelos de linguagem grandes” inclui “ChatGPT” como co-autor.

“ChatGPT contribuiu para a redação de várias seções deste manuscrito”, afirmam os autores biológicos em seu artigo.

Outras afiliações organizacionais dos autores incluem: Massachusetts General Hospital, Harvard School of Medicine, em Boston, Massachusetts; Escola de Medicina Warren Alpert, Brown University, em Providence, Rhode Island; e Departamento de Educação Médica da UWorld, LLC, uma empresa de e-learning de saúde com sede em Dallas, Texas.

Os autores – Tiffany Kung, Morgan Cheatham, ChatGPT, Arielle Medenilla, Czarina Sillos, Lorie De Leon, Camille Elepaño, Maria Madriaga, Rimel Aggabao, Giezel Diaz-Candido, James Maningo e Victor Tseng – chegaram a uma conclusão semelhante à de Terwiesch, da Wharton. . Especificamente, eles descobriram que o ChatGPT teve um desempenho aceitável – acima do limite de aprovação variável de cerca de 60 por cento – no exame USMLE, se for dado o benefício de respostas indeterminadas. E eles esperam que modelos de linguagem grandes (LLMs) desempenhem um papel crescente na educação médica e na tomada de decisões clínicas.

“O ChatGPT produz uma precisão moderada, aproximando-se do desempenho de aprovação no USMLE”, afirmam os autores em seu artigo. “Os itens do exame foram inicialmente codificados como perguntas abertas com prompts de entrada variáveis. Este formato de entrada simula um padrão de consulta de usuário natural e gratuito. Com respostas indeterminadas censuradas/incluídas, a precisão do ChatGPT para USMLE Steps 1, 2CK e 3 foi de 68.0 por cento/42.9 por cento, 58.3 por cento/51.4 por cento e 62.4 por cento/55.7 por cento, respectivamente.”

Descrever o desempenho do ChatGPT como “aproximando-se da passagem” é uma maneira generosa de expressá-lo, principalmente com a IA recebendo crédito por respostas indeterminadas. Chegar a um consultório médico e ver um diploma anunciando nota D pode provocar um pouco mais de preocupação nos pacientes.

Mas os pesquisadores sustentam que as coisas que o ChatGPT acertou estavam em conformidade com as respostas aceitas e que o modelo de IA melhorou notavelmente, tendo meses antes alcançado uma taxa de sucesso de apenas cerca de 36.7%.

Curiosamente, eles observaram que o ChatGPT teve um desempenho melhor do que o PubMedGPT, um LLM baseado apenas em dados biomédicos que conseguiu uma precisão de apenas cerca de 50.8% (com base em dados não publicados).

“Especulamos que o treinamento específico do domínio pode ter criado maior ambivalência no modelo PubMedGPT, pois absorve o texto do mundo real do discurso acadêmico em andamento que tende a ser inconclusivo, contraditório ou altamente conservador ou evasivo em sua linguagem”, afirmam os autores .

Essencialmente, o material menos científico e mais opinativo que entrou no treinamento do ChatGPT, como panfletos de explicação de doenças voltados para pacientes, parece ter tornado o ChatGPT mais opinativo.

“À medida que a IA se torna cada vez mais proficiente, ela logo se tornará onipresente, transformando a medicina clínica em todos os setores da saúde”, concluem os autores, acrescentando que os médicos associados ao AnsibleHealth têm usado o ChatGPT em seus fluxos de trabalho e relataram uma redução de 33% no tempo necessários para completar a documentação e as tarefas indiretas de assistência ao paciente.

Isso talvez explique a decisão da Microsoft para canalizar bilhões para OpenAI para seu futuro software.

A utilidade do ChatGPT em um ambiente educacional - apesar do fato de muitas vezes estar errado - foi enfatizada em um no blog publicado no domingo por Thomas Rid, professor de estudos estratégicos e diretor fundador do Alperovich Institute for Cybersecurity Studies.

Rid descreve um curso recente de análise de malware e engenharia reversa de cinco dias ministrado por Juan Andres Guerrero-Saade.

“Cinco dias depois eu não tinha mais dúvidas: isso vai transformar o ensino superior”, disse Rid. “Eu era um dos alunos. E fiquei impressionado com o que o aprendizado de máquina foi capaz de fazer por nós, em tempo real. E digo isso como alguém que foi um endurecido cético do hype da inteligência artificial por muitos anos. Observe que eu não disse transformação 'provável'. Isso vai transformar o ensino superior.”

Guerrero-Saade, em um tópico no Twitter, reconhece que o ChatGPT entendeu errado, mas insiste que a ferramenta ajudou os alunos a encontrar respostas melhores. Ele sugere que funcione como um assistente de ensino pessoal para cada aluno.

“O temor em torno da IA (ou expectativas exageradas de resultados perfeitos) obscurecem o reconhecimento deste impressionante utilitário LLMs: como um assistente capaz de reunir rapidamente informações (certas ou erradas) com extrema relevância para uma inteligência mais perspicaz (o usuário) para trabalhar, ” , escreveu ele.

Rid argumenta que, embora as preocupações sobre a IA como um mecanismo de plágio e trapaça na educação precisem ser abordadas, a conversa mais importante tem a ver com como as ferramentas de IA podem melhorar os resultados educacionais. ®

Conteúdo com tecnologia de SEO e distribuição de relações públicas. Seja amplificado hoje.
Platoblockchain. Inteligência Metaverso Web3. Conhecimento Ampliado. Acesse aqui.
Fonte: https://go.theregister.com/feed/www.theregister.com/2023/01/24/chatgpt_exam_study/

Carimbo de hora: 23 de janeiro de 2023

Carimbo de hora: 16 Novembro, 2023

ChatGPT abre caminho através do MBA da Wharton, exames médicos

Republicado por Platão

Doutor, doutor

Mais de O registro

Os boffins da Microsoft contemplam equipar o Excel com IA

Califórnia acusa Tesla de propaganda enganosa no piloto automático

OpenAI está desenvolvendo software para detectar texto gerado pelo ChatGPT

Reino Unido quer que imigrantes criminosos escaneiem seus rostos até cinco vezes por dia usando um relógio

Um japonês preso após usar um software de IA para remover a censura e açoitá-lo

O que liga o guru da CPU da AMD Jim Keller, um iniciante em chips de IA, e o SiFive? Este processador RISC-V de 64 bits com processamento de vetores

Você pode fazer os melhores LLMs quebrarem suas próprias regras com gibberish

A corrida armamentista de hoje gira em torno de IA e é China vs América, diz o secretário de defesa dos EUA

A FCC está analisando mais de perto as chamadas automáticas de IA

Sobre Nós

Pesquisa vertical e IA

Plataforma

Fique Ligado

Conta