Merkmal Generative KI stellt akademische Verlage vor interessante Herausforderungen, die Betrug in wissenschaftlichen Arbeiten bekämpfen, da die Technologie das Potenzial zeigt, menschliches Peer-Review zu täuschen.
Beschreiben Sie ein Bild für DALL-E, Stable Diffusion und Midjourney, und sie werden in Sekundenschnelle eines erstellen. Diese Text-zu-Bild-Systeme haben sich in den letzten Jahren schnell verbessert und was ursprünglich als Forschungsprototyp begann, produzierte harmlose und wunderbar bizarre Produkte Illustrationen von Baby-Rettich-Spaziergängern im Jahr 2021 hat sich seitdem in eine kommerzielle Software verwandelt, die von Milliarden-Dollar-Unternehmen entwickelt wurde und in der Lage ist, immer realistischere Bilder zu erzeugen.
Diese KI-Modelle können lebensechte Bilder von menschlichen Gesichtern, Objekten und Szenen erzeugen, und es scheint eine Frage der Zeit zu sein, bis sie auch überzeugende wissenschaftliche Bilder und Daten erstellen können. Text-zu-Bild-Modelle sind jetzt allgemein zugänglich, ziemlich billig in der Anwendung und könnten zwielichtigen Wissenschaftlern dabei helfen, Ergebnisse zu fälschen und Scheinforschung einfacher zu veröffentlichen.
Bildmanipulation ist bereits ein Hauptanliegen für akademische Verlage, da es am meisten ist gemeinsame Form des wissenschaftlichen Fehlverhaltens der letzten Zeit. Autoren können alle möglichen Tricks anwenden, wie z. B. Spiegeln, Drehen oder Zuschneiden von Teilen desselben Bildes, um Daten zu fälschen. Redakteure werden getäuscht und glauben, dass alle präsentierten Ergebnisse echt sind, und werden ihre Arbeit veröffentlichen.
Viele Verlage wenden sich jetzt KI-Software zu, um dies zu versuchen entdecken Anzeichen von Bildduplizierung während des Überprüfungsprozesses. In den meisten Fällen wurden Bilder fälschlicherweise von Wissenschaftlern dupliziert, die ihre Daten durcheinander gebracht haben, aber manchmal werden sie für offensichtlichen Betrug verwendet.
Aber gerade als Verlage beginnen, die Bildvervielfältigung in den Griff zu bekommen, taucht eine weitere Bedrohung auf. Einige Forscher könnten versucht sein, generative KI-Modelle zu verwenden, um gefälschte Daten zu erstellen. Tatsächlich gibt es Hinweise darauf, dass Scheinwissenschaftler dies bereits tun.
Von KI erstellte Bilder in Papieren entdeckt?
Im Jahr 2019 startete DARPA seine semantische Forensik (SemaFor)-Programm, das Forscher finanziert, die forensische Tools entwickeln, mit denen von KI erstellte Medien erkannt werden können, um Desinformation zu bekämpfen.
Ein Sprecher der Verteidigungsforschungsagentur von Uncle Sam bestätigte, dass sie gefälschte medizinische Bilder entdeckt hat, die in echten Wissenschaftsartikeln veröffentlicht wurden und anscheinend mit KI erstellt wurden. Vor Text-to-Image-Modellen waren Generative Adversarial Networks beliebt. DARPA erkannte, dass diese Modelle, die vor allem für ihre Fähigkeit zur Erstellung von Deepfakes bekannt sind, auch Bilder von medizinischen Scans, Zellen oder anderen Arten von Bildern fälschen können, die häufig in biomedizinischen Studien zu finden sind.
„Die Bedrohungslandschaft bewegt sich ziemlich schnell“, sagte William Corvey, Programmmanager von SemaFor Das Register. „Die Technologie wird für harmlose Zwecke allgegenwärtig.“ Corvey sagte, die Agentur habe einige Erfolge bei der Entwicklung von Software gehabt, die in der Lage sei, von GAN erstellte Bilder zu erkennen, und die Tools seien noch in der Entwicklung.
Die Bedrohungslandschaft bewegt sich ziemlich schnell
„Wir haben Ergebnisse, die darauf hindeuten, dass Sie „Geschwister oder entfernte Cousins“ des generativen Mechanismus erkennen können, den Sie zuvor erkannt haben, unabhängig vom Inhalt der erzeugten Bilder. SemaFor Analytics untersucht eine Vielzahl von Zuordnungen und Details im Zusammenhang mit manipulierten Medien, von Metadaten über statistische Anomalien bis hin zu eher visuellen Darstellungen“, sagte er.
Einige Bildanalytiker, die Daten in wissenschaftlichen Arbeiten untersuchen, sind auch auf Bilder gestoßen, die wie GAN-generierte Bilder aussehen. Ein GAN ist ein generatives gegnerisches Netzwerk, eine Art maschinelles Lernsystem, das Schrift, Musik, Bilder und mehr erzeugen kann.
Zum Beispiel stießen Jennifer Byrne, Professorin für molekulare Onkologie an der University of Sydney, und Jana Christopher, Bildintegritätsanalytikerin für den Zeitschriftenverlag EMBO Press, auf eine seltsame Reihe von Bildern, die in 17 biochemischen Studien auftauchten.
Die Bilder zeigten eine Reihe von Bands, die allgemein als bekannt sind Western Blots, die auf das Vorhandensein spezifischer Proteine in einer Probe hindeuten, die merkwürdigerweise alle den gleichen Hintergrund zu haben schienen. Das soll nicht passieren.
Beispiele für sich wiederholende Hintergründe in Western Blot-Bildern, hervorgehoben durch die roten und grünen Umrisse … Quelle: Byrne, Christopher 2020
Im Jahr 2020 kamen Byrne und Christopher zu dem Schluss, dass die verdächtig aussehenden Bilder wahrscheinlich im Rahmen einer Papierfabrik hergestellt wurden: ein Versuch, Papiere über biochemische Studien unter Verwendung gefälschter Daten in Massenproduktion zu produzieren und sie von Experten begutachten und veröffentlichen zu lassen. Eine solche Kapriole könnte zum Beispiel zugunsten von Akademikern durchgeführt werden, die auf der Grundlage ihrer akzeptierten Papierausgaben vergütet werden, oder um einer Abteilung zu helfen, eine Quote veröffentlichter Berichte zu erreichen.
„Die Blots in dem Beispiel, das in gezeigt wird unser Papier sind höchstwahrscheinlich computergeneriert“, sagte Christopher Das Register.
Oft stoße ich auf gefälschte Bilder, überwiegend Western Blots, aber zunehmend auch Mikroskopbilder
„Bei der Sichtung von Papieren sowohl vor als auch nach der Veröffentlichung stoße ich oft auf gefälschte Bilder, hauptsächlich Western Blots, aber zunehmend auch Mikroskopbilder. Mir ist sehr bewusst, dass viele davon höchstwahrscheinlich mit GANs generiert werden.“
Auch Elisabeth Bik, freie Bilddetektivin, erkennt oft, wenn Bilder manipuliert wurden. Sie brütet über wissenschaftlichen Manuskripten, jagt nach doppelten Bildern und markiert diese Probleme für Zeitschriftenredakteure, damit sie sie weiter untersuchen können. Aber es ist schwieriger, gefälschte Bilder zu bekämpfen, wenn sie umfassend von einem Algorithmus generiert wurden.
Sie wies darauf hin, dass, obwohl der wiederholte Hintergrund in Bildern, die in der Studie von Byrne und Christopher hervorgehoben werden, ein verräterisches Zeichen der Fälschung ist, die eigentlichen Western Blots selbst einzigartig sind. Die Computer-Vision-Software, die Bik verwendet, um Papiere zu scannen und Bildbetrug zu erkennen, würde es schwierig finden, diese Bänder zu kennzeichnen, da es keine Duplikate der tatsächlichen Blots gibt.
„Wir werden nie eine Überschneidung finden. Sie sind alle, glaube ich, künstlich hergestellt. Wie genau, bin ich mir nicht sicher“, sagte sie Das Register.
Mit den neuesten generativen KI-Modellen ist es einfacher, gefälschte Bilder zu generieren
GANs wurden weitgehend durch Diffusionsmodelle verdrängt. Diese Systeme erzeugen einzigartige Bilder und unterstützen die heutige Text-to-Image-Software, einschließlich DALL-E, Stable Diffusion und Midjourney. Sie lernen, die visuelle Darstellung von Objekten und Konzepten in natürlicher Sprache abzubilden, und könnten die Barriere für akademischen Betrug erheblich senken.
Wissenschaftler können einfach beschreiben, welche Art von falschen Daten sie generiert haben möchten, und diese Tools werden es für sie tun. Im Moment können sie jedoch noch nicht ganz realistisch wirkende wissenschaftliche Bilder erstellen. Manchmal produzieren die Tools Zellcluster, die auf den ersten Blick überzeugend aussehen, aber bei Western Blots kläglich versagen.
Diese KI-Programme können Folgendes erzeugen:
Hier ist, was @ OpenAI's DALL-E macht mit biologischen Zellaufforderungen
Konkret: „Zellen unter dem Mikroskop“ und „T-Zellen unter dem Rasterelektronenmikroskop“ pic.twitter.com/BgcZr3k5Q5
– Tara Basu Trivedi (@tbt94) 23. August 2022
William Gibson – ein Arzt, Wissenschaftler und medizinischer Onkologe, nicht der berühmte Autor – hat weitere Beispiele hier, einschließlich, wie heutige Models mit dem Konzept eines Western Blots kämpfen.
Die Technologie wird jedoch immer besser, da Entwickler größere Modelle mit mehr Daten trainieren.
David Bimler, ein weiterer Experte für die Erkennung von Bildmanipulationen in wissenschaftlichen Arbeiten, besser bekannt als Smut Clyde, sagte uns: „Papierhersteller werden ihre Produkte mit der billigsten und schnellsten Methode illustrieren und sich dabei auf Schwächen im Peer-Review-Prozess verlassen.“
„Sie könnten einfach [Western Blots] aus älteren Papieren kopieren, aber selbst das erfordert Arbeit, um alte Papiere zu durchsuchen. Im Moment, vermute ich, ist die Verwendung eines GAN noch etwas Aufwand. Das wird sich aber ändern“, fügte er hinzu.
DARPA beabsichtigt nun, sein SemaFor-Programm zu erweitern, um Text-zu-Bild-Systeme zu untersuchen. „Diese Art von Modellen ist ziemlich neu und, obwohl sie im Umfang enthalten sind, nicht Teil unserer aktuellen Arbeit an SemaFor“, sagte Corvey.
„Die Evaluatoren von SemaFor werden sich diese Modelle jedoch wahrscheinlich während der nächsten Evaluierungsphase des Programms, die im Herbst 2023 beginnt, ansehen.“
In der Zwischenzeit wird die Qualität der wissenschaftlichen Forschung untergraben, wenn akademische Verlage keine Möglichkeiten finden, gefälschte KI-generierte Bilder in Papieren zu erkennen. Im besten Fall wird sich diese Form des akademischen Betrugs auf Papierfabriken beschränken, die ohnehin nicht viel Aufmerksamkeit erhalten. Im schlimmsten Fall wird es sogar die angesehensten Zeitschriften treffen und Wissenschaftler mit guten Absichten werden Zeit und Geld verschwenden, um falschen Ideen nachzujagen, die sie für wahr halten. ®
- SEO-gestützte Content- und PR-Distribution. Holen Sie sich noch heute Verstärkung.
- Platoblockkette. Web3-Metaverse-Intelligenz. Wissen verstärkt. Hier zugreifen.
- Quelle: https://go.theregister.com/feed/www.theregister.com/2023/03/11/ai_scientfic_fraud/
- :Ist
- $UP
- 2019
- 2020
- 2021
- 2023
- a
- Fähigkeit
- akademisch
- zugänglich
- über
- hinzugefügt
- widersprüchlich
- Agentur
- AI
- Algorithmus
- Alle
- bereits
- Obwohl
- Analytiker
- Business Analysten
- Analytik
- und
- Ein anderer
- erscheinen
- erschienen
- SIND
- AS
- damit verbundenen
- At
- Aufmerksamkeit
- Autor
- Autoren
- Baby
- Hintergrund
- Hintergründe
- Barriere
- basierend
- BE
- weil
- Werden
- Bevor
- begann
- beginnen
- Anfang
- Sein
- Glauben
- Glauben
- Nutzen
- BESTE
- Besser
- biomedizinische
- erbaut
- by
- CAN
- fähig
- Fälle
- Die Zellen
- Herausforderungen
- Übernehmen
- billig
- billigsten
- Betrug
- Friedrich
- CO
- Bekämpfung
- wie die
- kommerziell
- häufig
- Unternehmen
- ausgeglichen
- Computer
- Computer Vision
- computergeneriert
- konzept
- Konzepte
- Hautpflegeprobleme
- Abschluss
- BESTÄTIGT
- Inhalt
- könnte
- erstellen
- Erstellen
- Strom
- Dalls
- Darpa
- technische Daten
- Deepfakes
- Militär
- Abteilung
- beschreiben
- Details
- Entwickler
- Entwicklung
- Entwicklung
- Rundfunk
- Desinformation
- Vertriebene
- Entfernt
- Hunde
- Dabei
- im
- einfacher
- leicht
- Anstrengung
- aufstrebenden
- Äther (ETH)
- Auswertung
- Sogar
- alles
- Beweis
- genau
- Beispiel
- Beispiele
- Erweitern Sie die Funktionalität der
- Experte
- Gesichter
- FAIL
- ziemlich
- Fälschung
- Fallen
- berühmt
- schnellsten
- Kerl
- wenige
- Abbildung
- Finden Sie
- Vorname
- Fahnen
- Aussichten für
- gerichtlich
- Forensik
- schmieden
- unten stehende Formular
- gefunden
- Betrug
- frei
- für
- Finanzierung
- weiter
- GANs
- erzeugen
- erzeugt
- Erzeugung
- generativ
- generative kontradiktorische Netzwerke
- Generative KI
- Genom
- bekommen
- bekommen
- Blick
- gehen
- gut
- Grün
- passieren
- hart
- Haben
- Hilfe
- Besondere
- Hit
- Ultraschall
- aber
- HTTPS
- human
- Jagd
- i
- Ideen
- Image
- Bilder
- Impact der HXNUMXO Observatorien
- verbessert
- in
- Einschließlich
- zunehmend
- zeigen
- anfänglich
- Instanz
- Integrität
- Absichten
- interessant
- unabhängig
- Probleme
- IT
- SEINE
- Jennifer
- Zeitschrift
- jpg
- bekannt
- Label
- Landschaft
- Sprache
- weitgehend
- größer
- Spät
- neueste
- ins Leben gerufen
- LERNEN
- gelernt
- Gefällt mir
- wahrscheinlich
- Limitiert
- aussehen
- aussehen wie
- suchen
- gemacht
- Manager
- manipuliert
- Manipulation
- viele
- Karte
- Masse
- Materie
- Mechanismus
- Medien
- sowie medizinische
- Metadaten
- Methode
- Mikroskopie
- Mitte der Reise
- könnte
- für
- Molekular-
- Moment
- Geld
- mehr
- vor allem warme
- ziehen um
- Musik
- Natürliche
- Natürliche Sprache
- Netzwerk
- Netzwerke
- Neu
- weiter
- NIH
- Objekte
- of
- Alt
- on
- Onkologie
- EINEM
- Betrieb
- Andere
- Umrissen
- Möglichkeiten für das Ausgangssignal:
- Papier
- Papiere
- Teil
- Teile
- passt
- Peer
- Phase
- Fotos
- Plato
- Datenintelligenz von Plato
- PlatoData
- Beliebt
- Posen
- Potenzial
- Werkzeuge
- überwiegend
- Präsenz
- vorgeführt
- Presse
- ziemlich
- vorher
- wahrscheinlich
- Prozessdefinierung
- produziert
- Produziert
- Produkte
- Professor
- Programm
- Programme
- Proteine
- Prototyp
- veröffentlichen
- veröffentlicht
- Herausgeber
- Verlag
- Zwecke
- Qualität
- schnell
- RE
- echt
- realistisch
- realisiert
- erhalten
- Rot
- Registrieren
- wiederholt
- Meldungen
- Darstellung
- seriöse
- Forschungsprojekte
- Forscher
- Die Ergebnisse
- Überprüfen
- bewertet
- s
- Said
- Sam
- gleich
- Scan
- Scannen
- Szenario
- Szenen
- Regelungen
- Wissenschaft
- Wissenschaftliche Forschung
- Wissenschaftler
- Umfang
- regelmäßigen Abständen
- Suche
- Sekunden
- schien
- Semaphor
- Modellreihe
- kompensieren
- gezeigt
- Konzerte
- Schild
- bedeutend
- Schilder
- einfach
- da
- Sleuth
- Software
- einige
- Quelle
- spezifisch
- Sprecher
- Spot
- stabil
- statistisch
- Immer noch
- Kämpfen
- Es wurden Studien
- Studie
- Erfolg
- so
- vermutet
- misstrauisch
- Sydney
- System
- Systeme und Techniken
- Technologie
- zur Verbesserung der Gesundheitsgerechtigkeit
- Das
- ihr
- Sie
- sich
- Diese
- Ding
- Bedrohung
- Durch
- Zeit
- zu
- heute
- auch
- Werkzeuge
- Top
- Training
- was immer dies auch sein sollte.
- Drehung
- Typen
- allgegenwärtig
- für
- einzigartiges
- Universität
- Universität von Sydney
- us
- -
- Vielfalt
- Ve
- Seh-
- Gehen
- Abfall / Verschnitt
- Wege
- Westlich
- Was
- welche
- während
- WHO
- weit
- werden wir
- mit
- Arbeiten
- würde
- Schreiben
- Jahr
- Zephyrnet