Cecha Generatywna sztuczna inteligencja stawia interesujące wyzwania przed wydawcami akademickimi zajmującymi się zwalczaniem oszustw w artykułach naukowych, ponieważ technologia ta wykazuje potencjał do oszukiwania recenzentów przez ludzi.
Opisz obraz dla DALL-E, Stable Diffusion i Midjourney, a oni wygenerują go w kilka sekund. Te systemy przetwarzania tekstu na obraz szybko się poprawiły w ciągu ostatnich kilku lat, a to, co początkowo było prototypem badawczym, wytwarzało łagodne i cudownie dziwaczne ilustracje młodych rzodkiewek daikon wyprowadzających psy w 2021 r., przekształciło się od tego czasu w komercyjne oprogramowanie, tworzone przez miliardowe firmy, zdolne do generowania coraz bardziej realistycznych obrazów.
Te modele sztucznej inteligencji mogą tworzyć realistyczne obrazy ludzkich twarzy, obiektów i scen, a wygląda na to, że kwestią czasu jest, zanim staną się dobre w tworzeniu przekonujących obrazów i danych naukowych. Modele zamiany tekstu na obraz są obecnie powszechnie dostępne, dość tanie w użyciu i mogą pomóc podejrzanym naukowcom fałszować wyniki i łatwiej publikować fałszywe badania.
Manipulowanie obrazami jest już głównym problemem wydawców akademickich, ponieważ jest to najbardziej forma pospolita nierzetelności naukowej w ostatnim czasie. Autorzy mogą stosować różnego rodzaju sztuczki, takie jak odwracanie, obracanie lub przycinanie części tego samego obrazu, aby sfałszować dane. Redaktorzy są oszukiwani, że wszystkie prezentowane wyniki są prawdziwe i opublikują ich pracę.
Wielu wydawców zwraca się teraz do oprogramowania AI, próbując to zrobić wykryć oznaki powielania obrazu podczas procesu recenzji. W większości przypadków obrazy zostały omyłkowo zduplikowane przez naukowców, którzy pomieszali swoje dane, ale czasami jest to wykorzystywane do rażących oszustw.
Ale kiedy wydawcy zaczynają opanowywać problem powielania obrazów, pojawia się kolejne zagrożenie. Niektórzy badacze mogą pokusić się o wykorzystanie generatywnych modeli AI do tworzenia fałszywych danych. W rzeczywistości istnieją dowody sugerujące, że fałszywi naukowcy już to robią.
Obrazy stworzone przez sztuczną inteligencję zauważone w gazetach?
W 2019 roku DARPA uruchomiła Semantic Forensics (SemaFor), finansujący naukowców opracowujących narzędzia kryminalistyczne zdolne do wykrywania mediów tworzonych przez sztuczną inteligencję w celu zwalczania dezinformacji.
Rzecznik agencji badań obronnych Uncle Sam potwierdził, że wykrył fałszywe obrazy medyczne opublikowane w prawdziwych artykułach naukowych, które wydają się być generowane przy użyciu sztucznej inteligencji. Przed modelami zamiany tekstu na obraz popularne były generatywne sieci kontradyktoryjne. DARPA zdała sobie sprawę, że te modele, najlepiej znane ze swojej zdolności do tworzenia głębokich podróbek, mogą również fałszować obrazy skanów medycznych, komórek lub innych rodzajów obrazów często spotykanych w badaniach biomedycznych.
„Krajobraz zagrożeń zmienia się dość szybko” — powiedział William Corvey, kierownik programu SemaFor Rejestr. „Technologia staje się wszechobecna w dobroczynnych celach”. Corvey powiedział, że agencja odniosła pewien sukces, opracowując oprogramowanie zdolne do wykrywania obrazów tworzonych przez GAN, a narzędzia są wciąż w fazie rozwoju.
Krajobraz zagrożeń zmienia się dość szybko
„Mamy wyniki, które sugerują, że możesz wykryć „rodzeństwo lub dalekich kuzynów” mechanizmu generatywnego, którego nauczyłeś się wcześniej wykrywać, niezależnie od zawartości generowanych obrazów. Analitycy SemaFor przyglądają się różnym atrybucjom i szczegółom związanym z manipulowanymi mediami, od metadanych, anomalii statystycznych po bardziej wizualne reprezentacje” – powiedział.
Niektórzy analitycy obrazu analizujący dane w artykułach naukowych natknęli się również na coś, co wygląda jak obrazy generowane przez GAN. GAN jest generatywną siecią przeciwstawną, rodzajem systemu uczenia maszynowego, który może generować pismo, muzykę, obrazy i nie tylko.
Na przykład Jennifer Byrne, profesor onkologii molekularnej na Uniwersytecie w Sydney i Jana Christopher, analityk integralności obrazu dla wydawcy czasopisma EMBO Press, natknęli się na dziwny zestaw obrazów, który pojawił się w 17 badaniach związanych z biochemią.
Zdjęcia przedstawiały szereg zespołów zwanych potocznie tzw western bloty, które wskazują na obecność określonych białek w próbce, z których wszystkie, co ciekawe, wydawały się mieć to samo tło. To nie powinno się zdarzyć.
Przykłady powtarzających się teł na obrazach Western blot, podkreślonych czerwonymi i zielonymi konturami… Źródło: Byrne, Krzysztof 2020
W 2020 roku Byrne i Christopher doszli do wniosku, że podejrzanie wyglądające obrazy zostały prawdopodobnie stworzone w ramach operacji papierni: próba masowego wyprodukowania artykułów na temat badań biochemicznych przy użyciu sfałszowanych danych oraz poddania ich recenzji i opublikowaniu. Taki kaprys może zostać wykorzystany, na przykład, do korzyści dla naukowców, którzy otrzymują wynagrodzenie na podstawie zaakceptowanej przez nich pracy papierowej, lub aby pomóc wydziałowi w osiągnięciu limitu opublikowanych raportów.
„Plamy w przykładzie pokazanym w nasz papier są najprawdopodobniej generowane komputerowo” – powiedział Christopher Rejestr.
Często spotykam fałszywie wyglądające obrazy, głównie western blot, ale coraz częściej także obrazy mikroskopowe
„Przeglądając artykuły zarówno przed, jak i po publikacji, często napotykam fałszywie wyglądające obrazy, głównie western blot, ale coraz częściej także obrazy mikroskopowe. Doskonale zdaję sobie sprawę, że wiele z nich jest najprawdopodobniej generowanych przy użyciu sieci GAN”.
Elisabeth Bik, niezależna badaczka obrazów, często potrafi stwierdzić, kiedy zdjęcia zostały zmanipulowane. Zagłębia się w rękopisy prac naukowych, szukając zduplikowanych obrazów i zaznacza te kwestie, aby redaktorzy czasopism mogli je dokładniej przeanalizować. Jednak trudniej jest walczyć z fałszywymi obrazami, gdy zostały one kompleksowo wygenerowane przez algorytm.
Zwróciła uwagę, że chociaż powtarzające się tło na obrazach wyróżnionych w badaniu Byrne'a i Christophera jest charakterystyczną oznaką fałszerstwa, same western blots są wyjątkowe. Oprogramowanie do wizji komputerowej, którego Bik używa do skanowania dokumentów i wykrywania oszustw graficznych, miałoby trudności z oznaczeniem tych pasm, ponieważ nie ma duplikatów rzeczywistych kleksów.
„Nigdy nie znajdziemy nakładki. Wszystkie są, jak sądzę, sztucznie stworzone. Jak dokładnie, nie jestem pewien” – powiedziała Rejestr.
Łatwiej jest generować fałszywe obrazy dzięki najnowszym generatywnym modelom sztucznej inteligencji
Sieci GAN zostały w dużej mierze wyparte przez modele dyfuzji. Systemy te generują unikalne obrazy i zasilają dzisiejsze oprogramowanie przetwarzające tekst na obraz, w tym DALL-E, Stable Diffusion i Midjourney. Uczą się odwzorowywać wizualną reprezentację przedmiotów i pojęć na język naturalny i mogą znacznie obniżyć barierę dla akademickiego ściągania.
Naukowcy mogą po prostu opisać, jakiego rodzaju fałszywe dane chcą wygenerować, a te narzędzia zrobią to za nich. W tej chwili jednak nie mogą jeszcze tworzyć realistycznie wyglądających obrazów naukowych. Czasami narzędzia tworzą skupiska komórek, które na pierwszy rzut oka wyglądają przekonująco, ale zawodzą żałośnie, jeśli chodzi o Western blot.
Oto, co mogą generować te programy AI:
Oto co @OtwarteAIDALL-E robi z monitami komórek biologicznych
W szczególności: „komórki pod mikroskopem” i „komórki T pod skaningowym mikroskopem elektronowym” pic.twitter.com/BgcZr3k5Q5
— Tara Basu Trivedi (@tbt94) 23 sierpnia 2022 r.
William Gibson – lekarz-naukowiec i onkolog medyczny, a nie słynny autor – ma dalsze przykłady tutaj, w tym jak dzisiejsze modele zmagają się z koncepcją western blot.
Jednak technologia jest coraz lepsza, ponieważ programiści szkolą większe modele na większej liczbie danych.
David Bimler, inny ekspert w rozpoznawaniu manipulacji obrazami w artykułach naukowych, lepiej znany jako Smut Clyde, powiedział nam: „Papermillers będą ilustrować swoje produkty przy użyciu dowolnej najtańszej i najszybszej metody, opierając się na słabościach w procesie recenzowania”.
„Mogli po prostu skopiować [western blots] ze starszych dokumentów, ale nawet to wymaga pracy związanej z przeszukiwaniem starych dokumentów. Podejrzewam, że w tej chwili korzystanie z GAN jest nadal pewnym wysiłkiem. Chociaż to się zmieni – dodał.
DARPA chce teraz rozszerzyć swój program SemaFor o badanie systemów zamiany tekstu na obraz. „Tego rodzaju modele są dość nowe i chociaż wchodzą w zakres, nie są częścią naszej obecnej pracy nad SemaFor” – powiedział Corvey.
„Jednak ewaluatorzy SemaFor prawdopodobnie przyjrzą się tym modelom podczas następnej fazy oceny programu rozpoczynającej się jesienią 2023 r.”.
Tymczasem jakość badań naukowych spadnie, jeśli wydawcy akademiccy nie będą w stanie znaleźć sposobów na wykrycie fałszywych obrazów generowanych przez sztuczną inteligencję w artykułach. W najlepszym przypadku ta forma oszustwa akademickiego będzie ograniczona do programów papierniczych, którym i tak nie poświęca się zbytniej uwagi. W najgorszym przypadku wpłynie to nawet na najbardziej renomowane czasopisma, a naukowcy z dobrymi intencjami będą tracić czas i pieniądze na pogoń za fałszywymi ideami, które uważają za prawdziwe. ®
- Dystrybucja treści i PR oparta na SEO. Uzyskaj wzmocnienie już dziś.
- Platoblockchain. Web3 Inteligencja Metaverse. Wzmocniona wiedza. Dostęp tutaj.
- Źródło: https://go.theregister.com/feed/www.theregister.com/2023/03/11/ai_scientfic_fraud/
- :Jest
- $W GÓRĘ
- 2019
- 2020
- 2021
- 2023
- a
- zdolność
- akademicki
- dostępny
- w poprzek
- w dodatku
- przeciwny
- agencja
- AI
- algorytm
- Wszystkie kategorie
- już
- Chociaż
- analityk
- analitycy
- analityka
- i
- Inne
- zjawić się
- pojawił się
- SĄ
- AS
- powiązany
- At
- Uwaga
- autor
- Autorzy
- Niemowlę
- tło
- tła
- bariera
- na podstawie
- BE
- bo
- staje
- zanim
- rozpoczął
- rozpocząć
- Początek
- jest
- uwierzyć
- wierząc
- korzyści
- BEST
- Ulepsz Swój
- biomedyczny
- wybudowany
- by
- CAN
- zdolny
- Etui
- Komórki
- wyzwania
- zmiana
- tani
- najtańsze
- oszukiwanie
- Christopher
- CO
- zwalczania
- jak
- handlowy
- powszechnie
- Firmy
- kompensowane
- komputer
- Wizja komputerowa
- wygenerowane komputerowo
- pojęcie
- Koncepcje
- Troska
- konkluzja
- ZATWARDZIAŁY
- zawartość
- mógłby
- Stwórz
- Tworzenie
- Aktualny
- Dall's
- Darpa
- dane
- deepfakes
- Obrona
- Departament
- opisać
- detale
- deweloperzy
- rozwijanie
- oprogramowania
- Transmitowanie
- dezinformacja
- przesiedlony
- Odległy
- psy
- robi
- podczas
- łatwiej
- z łatwością
- wysiłek
- wschodzących
- Eter (ETH)
- ewaluację
- Parzyste
- wszystko
- dowód
- dokładnie
- przykład
- przykłady
- Rozszerzać
- ekspert
- twarze
- FAIL
- dość
- imitacja
- Spadać
- sławny
- najszybszy
- facet
- kilka
- Postać
- Znajdź
- i terminów, a
- Flagi
- W razie zamówieenia projektu
- Kryminalistyka
- kryminalistyki
- wykuć
- Nasz formularz
- znaleziono
- oszustwo
- wolny zawód
- od
- Finansowanie
- dalej
- GAN
- Generować
- wygenerowane
- generujący
- generatywny
- generatywne sieci przeciwne
- generatywna sztuczna inteligencja
- Genom
- otrzymać
- miejsce
- Spojrzenie
- będzie
- dobry
- Zielony
- zdarzyć
- Ciężko
- Have
- pomoc
- Podświetlony
- Dobranie (Hit)
- W jaki sposób
- Jednak
- HTTPS
- człowiek
- Łowiectwo
- i
- pomysły
- obraz
- zdjęcia
- Rezultat
- ulepszony
- in
- Włącznie z
- coraz bardziej
- wskazać
- początkowo
- przykład
- integralność
- intencje
- ciekawy
- niezależny
- problemy
- IT
- JEGO
- Jennifer
- dziennik
- jpg
- znany
- Etykieta
- krajobraz
- język
- w dużej mierze
- większe
- Późno
- firmy
- uruchomiona
- UCZYĆ SIĘ
- dowiedziałem
- lubić
- Prawdopodobnie
- Ograniczony
- Popatrz
- wygląda jak
- poszukuje
- zrobiony
- kierownik
- manipulować
- Manipulacja
- wiele
- mapa
- Masa
- Materia
- mechanizm
- Media
- medyczny
- Metadane
- metoda
- Mikroskopia
- W połowie podróży
- może
- modele
- Cząsteczkowa
- moment
- pieniądze
- jeszcze
- większość
- przeniesienie
- Muzyka
- Naturalny
- Język naturalny
- sieć
- sieci
- Nowości
- Następny
- NIH
- obiekty
- of
- Stary
- on
- onkologia
- ONE
- działanie
- Inne
- wytyczne
- wydajność
- Papier
- Papiery
- część
- strony
- Przeszłość
- par
- faza
- Zdjęcia
- plato
- Analiza danych Platona
- PlatoDane
- Popularny
- stwarza
- potencjał
- power
- przeważnie
- obecność
- przedstawione
- naciśnij
- bardzo
- poprzednio
- prawdopodobnie
- wygląda tak
- produkować
- Wytworzony
- Produkty
- Profesor
- Program
- Programy
- Białka
- prototyp
- publikować
- opublikowany
- wydawca
- wydawcy
- cele
- jakość
- szybko
- RE
- real
- realistyczny
- realizowany
- otrzymać
- Czerwony
- zarejestrować
- powtórzony
- Raporty
- reprezentacja
- renomowany
- Badania naukowe
- Badacze
- Efekt
- przeglądu
- recenzja
- s
- Powiedział
- Sam
- taki sam
- skanować
- skanowanie
- scenariusz
- Sceny
- systemy
- nauka
- Badania naukowe
- Naukowcy
- zakres
- pokaz
- Szukaj
- sekund
- wydawało się
- Sygnalizacja świetlna
- Serie
- zestaw
- pokazane
- Targi
- znak
- znacznie
- znaki
- po prostu
- ponieważ
- Tajniak
- Tworzenie
- kilka
- Źródło
- specyficzny
- Rzecznik
- Spot
- stabilny
- statystyczny
- Nadal
- Walka
- badania naukowe
- Badanie
- sukces
- taki
- domniemany
- podejrzliwy
- sydney
- system
- systemy
- Technologia
- że
- Połączenia
- ich
- Im
- sami
- Te
- rzecz
- groźba
- Przez
- czas
- do
- już dziś
- także
- narzędzia
- Top
- Pociąg
- prawdziwy
- Obrócenie
- i twitterze
- typy
- wszechobecny
- dla
- wyjątkowy
- uniwersytet
- Uniwersytet w Sydney
- us
- posługiwać się
- różnorodność
- Ve
- wizja
- chodzący
- Marnotrawstwo
- sposoby
- Western
- Co
- który
- Podczas
- KIM
- szeroko
- będzie
- w
- Praca
- by
- pisanie
- lat
- zefirnet