Dank generativer KI wird es viel schwieriger, wissenschaftliche Betrugsfälle aufzudecken

Neuauflage von Plato

Verfolger: 0

Merkmal Generative KI stellt akademische Verlage vor interessante Herausforderungen, die Betrug in wissenschaftlichen Arbeiten bekämpfen, da die Technologie das Potenzial zeigt, menschliches Peer-Review zu täuschen.

Beschreiben Sie ein Bild für DALL-E, Stable Diffusion und Midjourney, und sie werden in Sekundenschnelle eines erstellen. Diese Text-zu-Bild-Systeme haben sich in den letzten Jahren schnell verbessert und was ursprünglich als Forschungsprototyp begann, produzierte harmlose und wunderbar bizarre Produkte Illustrationen von Baby-Rettich-Spaziergängern im Jahr 2021 hat sich seitdem in eine kommerzielle Software verwandelt, die von Milliarden-Dollar-Unternehmen entwickelt wurde und in der Lage ist, immer realistischere Bilder zu erzeugen.

Diese KI-Modelle können lebensechte Bilder von menschlichen Gesichtern, Objekten und Szenen erzeugen, und es scheint eine Frage der Zeit zu sein, bis sie auch überzeugende wissenschaftliche Bilder und Daten erstellen können. Text-zu-Bild-Modelle sind jetzt allgemein zugänglich, ziemlich billig in der Anwendung und könnten zwielichtigen Wissenschaftlern dabei helfen, Ergebnisse zu fälschen und Scheinforschung einfacher zu veröffentlichen.

Bildmanipulation ist bereits ein Hauptanliegen für akademische Verlage, da es am meisten ist gemeinsame Form des wissenschaftlichen Fehlverhaltens der letzten Zeit. Autoren können alle möglichen Tricks anwenden, wie z. B. Spiegeln, Drehen oder Zuschneiden von Teilen desselben Bildes, um Daten zu fälschen. Redakteure werden getäuscht und glauben, dass alle präsentierten Ergebnisse echt sind, und werden ihre Arbeit veröffentlichen.

Viele Verlage wenden sich jetzt KI-Software zu, um dies zu versuchen entdecken Anzeichen von Bildduplizierung während des Überprüfungsprozesses. In den meisten Fällen wurden Bilder fälschlicherweise von Wissenschaftlern dupliziert, die ihre Daten durcheinander gebracht haben, aber manchmal werden sie für offensichtlichen Betrug verwendet.

Aber gerade als Verlage beginnen, die Bildvervielfältigung in den Griff zu bekommen, taucht eine weitere Bedrohung auf. Einige Forscher könnten versucht sein, generative KI-Modelle zu verwenden, um gefälschte Daten zu erstellen. Tatsächlich gibt es Hinweise darauf, dass Scheinwissenschaftler dies bereits tun.

Von KI erstellte Bilder in Papieren entdeckt?

Im Jahr 2019 startete DARPA seine semantische Forensik (SemaFor)-Programm, das Forscher finanziert, die forensische Tools entwickeln, mit denen von KI erstellte Medien erkannt werden können, um Desinformation zu bekämpfen.

Ein Sprecher der Verteidigungsforschungsagentur von Uncle Sam bestätigte, dass sie gefälschte medizinische Bilder entdeckt hat, die in echten Wissenschaftsartikeln veröffentlicht wurden und anscheinend mit KI erstellt wurden. Vor Text-to-Image-Modellen waren Generative Adversarial Networks beliebt. DARPA erkannte, dass diese Modelle, die vor allem für ihre Fähigkeit zur Erstellung von Deepfakes bekannt sind, auch Bilder von medizinischen Scans, Zellen oder anderen Arten von Bildern fälschen können, die häufig in biomedizinischen Studien zu finden sind.

„Die Bedrohungslandschaft bewegt sich ziemlich schnell“, sagte William Corvey, Programmmanager von SemaFor Das Register. „Die Technologie wird für harmlose Zwecke allgegenwärtig.“ Corvey sagte, die Agentur habe einige Erfolge bei der Entwicklung von Software gehabt, die in der Lage sei, von GAN erstellte Bilder zu erkennen, und die Tools seien noch in der Entwicklung.

Die Bedrohungslandschaft bewegt sich ziemlich schnell

„Wir haben Ergebnisse, die darauf hindeuten, dass Sie „Geschwister oder entfernte Cousins“ des generativen Mechanismus erkennen können, den Sie zuvor erkannt haben, unabhängig vom Inhalt der erzeugten Bilder. SemaFor Analytics untersucht eine Vielzahl von Zuordnungen und Details im Zusammenhang mit manipulierten Medien, von Metadaten über statistische Anomalien bis hin zu eher visuellen Darstellungen“, sagte er.

Einige Bildanalytiker, die Daten in wissenschaftlichen Arbeiten untersuchen, sind auch auf Bilder gestoßen, die wie GAN-generierte Bilder aussehen. Ein GAN ist ein generatives gegnerisches Netzwerk, eine Art maschinelles Lernsystem, das Schrift, Musik, Bilder und mehr erzeugen kann.

Zum Beispiel stießen Jennifer Byrne, Professorin für molekulare Onkologie an der University of Sydney, und Jana Christopher, Bildintegritätsanalytikerin für den Zeitschriftenverlag EMBO Press, auf eine seltsame Reihe von Bildern, die in 17 biochemischen Studien auftauchten.

Die Bilder zeigten eine Reihe von Bands, die allgemein als bekannt sind Western Blots, die auf das Vorhandensein spezifischer Proteine in einer Probe hindeuten, die merkwürdigerweise alle den gleichen Hintergrund zu haben schienen. Das soll nicht passieren.

Abbildung A aus dem Byrne-Christopher-Papier über verdächtige Papiere

Beispiele für sich wiederholende Hintergründe in Western Blot-Bildern, hervorgehoben durch die roten und grünen Umrisse … Quelle: Byrne, Christopher 2020

Im Jahr 2020 kamen Byrne und Christopher zu dem Schluss, dass die verdächtig aussehenden Bilder wahrscheinlich im Rahmen einer Papierfabrik hergestellt wurden: ein Versuch, Papiere über biochemische Studien unter Verwendung gefälschter Daten in Massenproduktion zu produzieren und sie von Experten begutachten und veröffentlichen zu lassen. Eine solche Kapriole könnte zum Beispiel zugunsten von Akademikern durchgeführt werden, die auf der Grundlage ihrer akzeptierten Papierausgaben vergütet werden, oder um einer Abteilung zu helfen, eine Quote veröffentlichter Berichte zu erreichen.

„Die Blots in dem Beispiel, das in gezeigt wird unser Papier sind höchstwahrscheinlich computergeneriert“, sagte Christopher Das Register.

Oft stoße ich auf gefälschte Bilder, überwiegend Western Blots, aber zunehmend auch Mikroskopbilder

„Bei der Sichtung von Papieren sowohl vor als auch nach der Veröffentlichung stoße ich oft auf gefälschte Bilder, hauptsächlich Western Blots, aber zunehmend auch Mikroskopbilder. Mir ist sehr bewusst, dass viele davon höchstwahrscheinlich mit GANs generiert werden.“

Auch Elisabeth Bik, freie Bilddetektivin, erkennt oft, wenn Bilder manipuliert wurden. Sie brütet über wissenschaftlichen Manuskripten, jagt nach doppelten Bildern und markiert diese Probleme für Zeitschriftenredakteure, damit sie sie weiter untersuchen können. Aber es ist schwieriger, gefälschte Bilder zu bekämpfen, wenn sie umfassend von einem Algorithmus generiert wurden.

Sie wies darauf hin, dass, obwohl der wiederholte Hintergrund in Bildern, die in der Studie von Byrne und Christopher hervorgehoben werden, ein verräterisches Zeichen der Fälschung ist, die eigentlichen Western Blots selbst einzigartig sind. Die Computer-Vision-Software, die Bik verwendet, um Papiere zu scannen und Bildbetrug zu erkennen, würde es schwierig finden, diese Bänder zu kennzeichnen, da es keine Duplikate der tatsächlichen Blots gibt.

„Wir werden nie eine Überschneidung finden. Sie sind alle, glaube ich, künstlich hergestellt. Wie genau, bin ich mir nicht sicher“, sagte sie Das Register.

Mit den neuesten generativen KI-Modellen ist es einfacher, gefälschte Bilder zu generieren

GANs wurden weitgehend durch Diffusionsmodelle verdrängt. Diese Systeme erzeugen einzigartige Bilder und unterstützen die heutige Text-to-Image-Software, einschließlich DALL-E, Stable Diffusion und Midjourney. Sie lernen, die visuelle Darstellung von Objekten und Konzepten in natürlicher Sprache abzubilden, und könnten die Barriere für akademischen Betrug erheblich senken.

Wissenschaftler können einfach beschreiben, welche Art von falschen Daten sie generiert haben möchten, und diese Tools werden es für sie tun. Im Moment können sie jedoch noch nicht ganz realistisch wirkende wissenschaftliche Bilder erstellen. Manchmal produzieren die Tools Zellcluster, die auf den ersten Blick überzeugend aussehen, aber bei Western Blots kläglich versagen.

Diese KI-Programme können Folgendes erzeugen:

Hier ist, was @ OpenAI's DALL-E macht mit biologischen Zellaufforderungen

Konkret: „Zellen unter dem Mikroskop“ und „T-Zellen unter dem Rasterelektronenmikroskop“ pic.twitter.com/BgcZr3k5Q5

– Tara Basu Trivedi (@tbt94) 23. August 2022

William Gibson – ein Arzt, Wissenschaftler und medizinischer Onkologe, nicht der berühmte Autor – hat weitere Beispiele hier, einschließlich, wie heutige Models mit dem Konzept eines Western Blots kämpfen.

Die Technologie wird jedoch immer besser, da Entwickler größere Modelle mit mehr Daten trainieren.

David Bimler, ein weiterer Experte für die Erkennung von Bildmanipulationen in wissenschaftlichen Arbeiten, besser bekannt als Smut Clyde, sagte uns: „Papierhersteller werden ihre Produkte mit der billigsten und schnellsten Methode illustrieren und sich dabei auf Schwächen im Peer-Review-Prozess verlassen.“

„Sie könnten einfach [Western Blots] aus älteren Papieren kopieren, aber selbst das erfordert Arbeit, um alte Papiere zu durchsuchen. Im Moment, vermute ich, ist die Verwendung eines GAN noch etwas Aufwand. Das wird sich aber ändern“, fügte er hinzu.

DARPA beabsichtigt nun, sein SemaFor-Programm zu erweitern, um Text-zu-Bild-Systeme zu untersuchen. „Diese Art von Modellen ist ziemlich neu und, obwohl sie im Umfang enthalten sind, nicht Teil unserer aktuellen Arbeit an SemaFor“, sagte Corvey.

„Die Evaluatoren von SemaFor werden sich diese Modelle jedoch wahrscheinlich während der nächsten Evaluierungsphase des Programms, die im Herbst 2023 beginnt, ansehen.“

In der Zwischenzeit wird die Qualität der wissenschaftlichen Forschung untergraben, wenn akademische Verlage keine Möglichkeiten finden, gefälschte KI-generierte Bilder in Papieren zu erkennen. Im besten Fall wird sich diese Form des akademischen Betrugs auf Papierfabriken beschränken, die ohnehin nicht viel Aufmerksamkeit erhalten. Im schlimmsten Fall wird es sogar die angesehensten Zeitschriften treffen und Wissenschaftler mit guten Absichten werden Zeit und Geld verschwenden, um falschen Ideen nachzujagen, die sie für wahr halten. ®

SEO-gestützte Content- und PR-Distribution. Holen Sie sich noch heute Verstärkung.
Platoblockkette. Web3-Metaverse-Intelligenz. Wissen verstärkt. Hier zugreifen.
Quelle: https://go.theregister.com/feed/www.theregister.com/2023/03/11/ai_scientfic_fraud/

Zeitstempel: 11. März 2023

Zeitstempel: Jan 10, 2024

Dank der generativen KI wird es viel schwieriger, Betrugswissenschaften aufzudecken

Neuauflage von Plato

Von KI erstellte Bilder in Papieren entdeckt?

Mit den neuesten generativen KI-Modellen ist es einfacher, gefälschte Bilder zu generieren

Mehr von Das Register

Steam fordert Entwickler auf, KI-erstellte Inhalte in Spielen offenzulegen

Elon Musk hatte 2021 heimliche Zwillinge mit Neuralink-Manager

Waymo-Robo-Taxis legen eine Million Meilen zurück, ohne jemanden zu töten

Den Weg zum Erfolg ebnen

Waferscale trifft auf Atommaßstab: Uncle Sam testet Cerebras-Chips in Atomwaffensimulationen

China setzt die eigene KI-Infrastruktur auf seine To-Do-Liste

Schauen Sie sich Insekten an, wenn Sie winzige KI-Roboter bauen möchten, die tatsächlich intelligent sind

Washington erwägt die Überwachung von Wolken auf verdächtiges KI-Training

Brustkrebsvorsorge-KI-App von Watchdog genehmigt

Über uns

Vertikale Suche & Ai

Plattform

Bleiben Sie in Verbindung

Konto