Thanks To Generative AI, Catching Fraud Science Is Going To Be This Much Harder

Αναδημοσίευση από τον Πλάτωνα

Ακολουθούν: 0

Χαρακτηριστικό Το Generative AI θέτει ενδιαφέρουσες προκλήσεις για τους ακαδημαϊκούς εκδότες που αντιμετωπίζουν την απάτη στις επιστημονικές εργασίες, καθώς η τεχνολογία δείχνει τη δυνατότητα να ξεγελάσει την ανθρώπινη κριτική από ομοτίμους.

Περιγράψτε μια εικόνα για το DALL-E, το Stable Diffusion και το Midjourney και θα δημιουργήσουν μία σε δευτερόλεπτα. Αυτά τα συστήματα κειμένου σε εικόνα έχουν βελτιωθεί γρήγορα τα τελευταία χρόνια και αυτό που αρχικά ξεκίνησε ως ερευνητικό πρωτότυπο, δημιουργώντας καλοήθη και υπέροχα παράξενα εικονογραφήσεις από μωρά ραπανάκια daikon που περπατούν σκυλιά το 2021, έκτοτε μετατράπηκε σε εμπορικό λογισμικό, κατασκευασμένο από εταιρείες δισεκατομμυρίων δολαρίων, ικανό να παράγει όλο και πιο ρεαλιστικές εικόνες.

Αυτά τα μοντέλα τεχνητής νοημοσύνης μπορούν να παράγουν ρεαλιστικές εικόνες ανθρώπινων προσώπων, αντικειμένων και σκηνών και είναι θέμα χρόνου να καταφέρουν να δημιουργήσουν και πειστικές επιστημονικές εικόνες και δεδομένα. Τα μοντέλα κειμένου σε εικόνα είναι πλέον ευρέως προσβάσιμα, αρκετά φθηνά στη χρήση και θα μπορούσαν να βοηθήσουν τους επιστήμονες να πλαστογραφήσουν αποτελέσματα και να δημοσιεύσουν πιο εύκολα ψευδείς έρευνες.

Η χειραγώγηση της εικόνας είναι ήδη ένα σημαντικό μέλημα για τους ακαδημαϊκούς εκδότες, καθώς είναι και το πιο σημαντικό κοινή μορφή επιστημονικών παραπτωμάτων τελευταία. Οι συγγραφείς μπορούν να χρησιμοποιήσουν κάθε είδους κόλπα, όπως αναστροφή, περιστροφή ή περικοπή τμημάτων της ίδιας εικόνας σε πλαστά δεδομένα. Οι συντάκτες ξεγελιούνται και πιστεύουν ότι όλα τα αποτελέσματα που παρουσιάζονται είναι πραγματικά και θα δημοσιεύσουν τη δουλειά τους.

Πολλοί εκδότες στρέφονται τώρα στο λογισμικό AI σε μια προσπάθεια να το κάνουν ανίχνευση σημάδια διπλασιασμού της εικόνας κατά τη διαδικασία αναθεώρησης. Στις περισσότερες περιπτώσεις, οι εικόνες έχουν αντιγραφεί κατά λάθος από επιστήμονες που έχουν μπερδέψει τα δεδομένα τους, αλλά μερικές φορές χρησιμοποιούνται για κατάφωρη απάτη.

Αλλά ακριβώς τη στιγμή που οι εκδότες αρχίζουν να καταλαβαίνουν την αντιγραφή εικόνων, μια άλλη απειλή εμφανίζεται. Ορισμένοι ερευνητές μπορεί να μπουν στον πειρασμό να χρησιμοποιήσουν παραγωγικά μοντέλα AI για να δημιουργήσουν πλαστά δεδομένα. Στην πραγματικότητα, υπάρχουν στοιχεία που υποδηλώνουν ότι οι ψεύτικοι επιστήμονες το κάνουν ήδη αυτό.

Εικόνες από τεχνητή νοημοσύνη εντοπίστηκαν σε χαρτιά;

Το 2019, η DARPA κυκλοφόρησε την Semantic Forensics (SemaFor) πρόγραμμα, που χρηματοδοτεί ερευνητές που αναπτύσσουν εγκληματολογικά εργαλεία ικανά να ανιχνεύουν μέσα που κατασκευάζονται από την τεχνητή νοημοσύνη, για την καταπολέμηση της παραπληροφόρησης.

Ένας εκπρόσωπος της αμυντικής ερευνητικής υπηρεσίας του Uncle Sam επιβεβαίωσε ότι εντόπισε ψεύτικες ιατρικές εικόνες που δημοσιεύτηκαν σε πραγματικές επιστημονικές εργασίες που φαίνεται να δημιουργούνται χρησιμοποιώντας AI. Πριν από τα μοντέλα κειμένου-σε-εικόνα, τα δίκτυα παραγωγής αντιπάλου ήταν δημοφιλή. Η DARPA συνειδητοποίησε ότι αυτά τα μοντέλα, πιο γνωστά για την ικανότητά τους να δημιουργούν deepfakes, θα μπορούσαν επίσης να πλαστογραφήσουν εικόνες ιατρικών σαρώσεων, κυττάρων ή άλλων τύπων εικόνων που βρίσκονται συχνά σε βιοϊατρικές μελέτες.

«Το τοπίο της απειλής κινείται αρκετά γρήγορα», είπε ο William Corvey, διευθυντής προγράμματος της SemaFor. Το μητρώο. «Η τεχνολογία γίνεται πανταχού παρούσα για καλοήθεις σκοπούς». Ο Corvey είπε ότι ο οργανισμός είχε κάποια επιτυχία στην ανάπτυξη λογισμικού ικανού να ανιχνεύει εικόνες κατασκευασμένες από το GAN και τα εργαλεία είναι ακόμα υπό ανάπτυξη.

Το τοπίο της απειλής κινείται αρκετά γρήγορα

«Έχουμε αποτελέσματα που υποδεικνύουν ότι μπορείτε να ανιχνεύσετε «αδέρφια ή μακρινά ξαδέρφια» του μηχανισμού παραγωγής που έχετε μάθει να ανιχνεύετε προηγουμένως, ανεξάρτητα από το περιεχόμενο των εικόνων που δημιουργούνται. Το SemaFor analytics εξετάζει μια ποικιλία αποδόσεων και λεπτομερειών που σχετίζονται με χειραγωγημένα μέσα, τα πάντα, από μεταδεδομένα, στατιστικές ανωμαλίες έως περισσότερες οπτικές αναπαραστάσεις», είπε.

Ορισμένοι αναλυτές εικόνων που εξετάζουν τα δεδομένα σε επιστημονικές εργασίες έχουν επίσης συναντήσει εικόνες που μοιάζουν με εικόνες που δημιουργούνται από το GAN. Το GAN είναι ένα παραγωγικό ανταγωνιστικό δίκτυο, ένας τύπος συστήματος μηχανικής μάθησης που μπορεί να δημιουργήσει γραφή, μουσική, εικόνες και πολλά άλλα.

Για παράδειγμα, η Jennifer Byrne, καθηγήτρια μοριακής ογκολογίας στο Πανεπιστήμιο του Σίδνεϋ και η Jana Christopher, αναλύτρια ακεραιότητας εικόνας για τον εκδότη περιοδικού EMBO Press, βρήκαν ένα περίεργο σύνολο εικόνων που εμφανίστηκαν σε 17 μελέτες που σχετίζονται με τη βιοχημεία.

Οι εικόνες απεικόνιζαν μια σειρά από συγκροτήματα κοινώς γνωστά ως western blots, οι οποίες υποδεικνύουν την παρουσία συγκεκριμένων πρωτεϊνών σε ένα δείγμα, που όλες έμοιαζαν να έχουν το ίδιο υπόβαθρο. Αυτό δεν πρέπει να συμβεί.

Εικόνα Α από το έγγραφο Byrne-Christopher για ύποπτα χαρτιά

Παραδείγματα επαναλαμβανόμενων φόντων σε εικόνες western blot, που επισημαίνονται από τα κόκκινα και πράσινα περιγράμματα… Πηγή: Byrne, Christopher 2020

Το 2020, ο Byrne και ο Christopher κατέληξαν στο συμπέρασμα ότι οι ύποπτες εικόνες παρήχθησαν πιθανότατα ως μέρος μιας επιχείρησης εργοστασίου χαρτιού: μια προσπάθεια μαζικής παραγωγής εγγράφων για βιοχημικές μελέτες χρησιμοποιώντας πλαστά δεδομένα και αξιολόγηση και δημοσίευσή τους από ομοτίμους. Μια τέτοια κάπαρη μπορεί να γίνει για να ωφεληθούν, για παράδειγμα, ακαδημαϊκοί που αμείβονται με βάση την αποδεκτή παραγωγή χαρτιού ή για να βοηθήσουν ένα τμήμα να πετύχει ένα όριο δημοσιευμένων εκθέσεων.

«Οι κηλίδες στο παράδειγμα που φαίνονται στο το χαρτί μας είναι πιθανότατα δημιουργημένα από υπολογιστή», είπε ο Christopher Το μητρώο.

Συχνά συναντώ εικόνες ψεύτικες, κυρίως western blots, αλλά όλο και περισσότερο και εικόνες μικροσκοπίας

«Σε προβολές τόσο πριν όσο και μετά τη δημοσίευση, συναντώ συχνά εικόνες με ψεύτικες όψεις, κυρίως στυπώματα γουέστερν, αλλά όλο και περισσότερο και μικροσκοπικές εικόνες. Γνωρίζω πολύ καλά ότι πολλά από αυτά πιθανότατα δημιουργούνται χρησιμοποιώντας GAN.”

Η Elisabeth Bik, ένας ανεξάρτητος τεχνικός εικόνων, μπορεί συχνά να πει πότε έχουν γίνει χειραγώγηση των εικόνων. Ασχολείται με επιστημονικά χειρόγραφα, ψάχνει για διπλές εικόνες και επισημαίνει αυτά τα τεύχη για να τα εξετάσουν περαιτέρω οι συντάκτες των περιοδικών. Αλλά είναι πιο δύσκολο να καταπολεμηθούν οι ψεύτικες εικόνες όταν έχουν δημιουργηθεί πλήρως από έναν αλγόριθμο.

Επισήμανε ότι παρόλο που το επαναλαμβανόμενο υπόβαθρο στις εικόνες που επισημαίνονται στη μελέτη του Byrne και του Christopher είναι ένα ενδεικτικό σημάδι πλαστογραφίας, τα ίδια τα πραγματικά στυπώματα γουέστερν είναι μοναδικά. Το λογισμικό υπολογιστικής όρασης που χρησιμοποιεί η Bik για τη σάρωση των χαρτιών και τον εντοπισμό απάτης εικόνων θα ήταν δύσκολο να επισημάνει αυτές τις ζώνες, επειδή δεν υπάρχουν διπλασιασμοί των πραγματικών κηλίδων.

«Δεν θα βρούμε ποτέ επικάλυψη. Είναι όλα, πιστεύω, φτιαγμένα τεχνητά. Πώς ακριβώς, δεν είμαι σίγουρη», είπε Το Μητρώο.

Είναι πιο εύκολο να δημιουργήσετε ψεύτικες εικόνες με τα πιο πρόσφατα μοντέλα τεχνητής νοημοσύνης

Τα GAN έχουν εκτοπιστεί σε μεγάλο βαθμό από τα μοντέλα διάχυσης. Αυτά τα συστήματα δημιουργούν μοναδικές εικόνες και τροφοδοτούν το σημερινό λογισμικό μετατροπής κειμένου σε εικόνα, συμπεριλαμβανομένων των DALL-E, Stable Diffusion και Midjourney. Μαθαίνουν να χαρτογραφούν την οπτική αναπαράσταση αντικειμένων και εννοιών στη φυσική γλώσσα και θα μπορούσαν να μειώσουν σημαντικά το εμπόδιο για την ακαδημαϊκή απάτη.

Οι επιστήμονες μπορούν απλώς να περιγράψουν τι είδους ψευδή δεδομένα θέλουν να δημιουργηθούν και αυτά τα εργαλεία θα το κάνουν για αυτούς. Προς το παρόν, ωστόσο, δεν μπορούν να δημιουργήσουν ακόμα ρεαλιστικές επιστημονικές εικόνες. Μερικές φορές τα εργαλεία παράγουν συστάδες κυττάρων που φαίνονται πειστικά με την πρώτη ματιά, αλλά αποτυγχάνουν παταγωδώς όταν πρόκειται για western blots.

Αυτό είναι το είδος των πραγμάτων που μπορούν να δημιουργήσουν αυτά τα προγράμματα AI:

Εδώ είναι τι @OpenAIΤο DALL-E του 's κάνει με τις προτροπές βιολογικών κυττάρων

Συγκεκριμένα: «κύτταρα κάτω από μικροσκόπιο» και «Τ-κύτταρα κάτω από ηλεκτρονικό μικροσκόπιο σάρωσης» pic.twitter.com/BgcZr3k5Q5

— Tara Basu Trivedi (@tbt94) Αύγουστος 23, 2022

Ο Γουίλιαμ Γκίμπσον – γιατρός-επιστήμονας και ιατρός ογκολόγος, όχι ο διάσημος συγγραφέας – έχει περαιτέρω παραδείγματα εδώ, συμπεριλαμβανομένου του τρόπου με τον οποίο τα σημερινά μοντέλα παλεύουν με την έννοια του western blot.

Ωστόσο, η τεχνολογία βελτιώνεται μόνο, καθώς οι προγραμματιστές εκπαιδεύουν μεγαλύτερα μοντέλα με περισσότερα δεδομένα.

Ο David Bimler, ένας άλλος ειδικός στην αναγνώριση της χειραγώγησης εικόνας σε επιστημονικές εργασίες, πιο γνωστός ως Smut Clyde, μας είπε: «Οι χαρτοπωλεία θα απεικονίσουν τα προϊόντα τους χρησιμοποιώντας οποιαδήποτε μέθοδο είναι φθηνότερη και ταχύτερη, βασιζόμενοι στις αδυναμίες της διαδικασίας αξιολόγησης από ομοτίμους».

«Μπορούσαν απλώς να αντιγράψουν [γουέστερν λεκέδες] από παλαιότερες εφημερίδες, αλλά ακόμη και αυτό απαιτεί δουλειά για την αναζήτηση παλιών εφημερίδων. Προς το παρόν, υποπτεύομαι ότι η χρήση ενός GAN είναι ακόμα κάποια προσπάθεια. Αν και αυτό θα αλλάξει», πρόσθεσε.

Η DARPA προσπαθεί τώρα να επεκτείνει το πρόγραμμά της SemaFor για τη μελέτη συστημάτων κειμένου σε εικόνα. «Αυτά τα είδη μοντέλων είναι αρκετά καινούργια και, αν και έχουν εύρος, δεν αποτελούν μέρος της τρέχουσας δουλειάς μας στο SemaFor», είπε ο Corvey.

"Ωστόσο, οι αξιολογητές του SemaFor είναι πιθανό να εξετάσουν αυτά τα μοντέλα κατά την επόμενη φάση αξιολόγησης του προγράμματος που αρχίζει το φθινόπωρο του 2023."

Εν τω μεταξύ, η ποιότητα της επιστημονικής έρευνας θα διαβρωθεί εάν οι ακαδημαϊκοί εκδότες δεν μπορούν να βρουν τρόπους να ανιχνεύσουν ψεύτικες εικόνες που δημιουργούνται από AI σε έγγραφα. Στην καλύτερη περίπτωση, αυτή η μορφή ακαδημαϊκής απάτης θα περιοριστεί μόνο σε συστήματα χαρτοποιίας που ούτως ή άλλως δεν τυγχάνουν ιδιαίτερης προσοχής. Στη χειρότερη περίπτωση, θα επηρεάσει ακόμη και τα πιο έγκριτα περιοδικά και οι επιστήμονες με καλές προθέσεις θα σπαταλήσουν χρόνο και χρήμα κυνηγώντας ψεύτικες ιδέες που πιστεύουν ότι είναι αληθινές. ®

SEO Powered Content & PR Distribution. Ενισχύστε σήμερα.
Platoblockchain. Web3 Metaverse Intelligence. Ενισχύθηκε η γνώση. Πρόσβαση εδώ.
πηγή: https://go.theregister.com/feed/www.theregister.com/2023/03/11/ai_scientfic_fraud/

Σφραγίδα ώρας: Μαρτίου 11, 2023

Σφραγίδα ώρας: 10 Ιανουαρίου 2024

Χάρη στη γενετική τεχνητή νοημοσύνη, η σύλληψη της επιστήμης της απάτης θα είναι πολύ πιο δύσκολη

Αναδημοσίευση από τον Πλάτωνα

Εικόνες από τεχνητή νοημοσύνη εντοπίστηκαν σε χαρτιά;

Είναι πιο εύκολο να δημιουργήσετε ψεύτικες εικόνες με τα πιο πρόσφατα μοντέλα τεχνητής νοημοσύνης

Περισσότερα από Το μητρώο

Το Steam λέει στους προγραμματιστές να αποκαλύπτουν περιεχόμενο που δημιουργείται από AI σε παιχνίδια

Ο Έλον Μασκ απέκτησε μυστικά δίδυμα το 2021 με το στέλεχος της Neuralink

Τα Robo ταξί Waymo διανύουν ένα εκατομμύριο μίλια χωρίς να σκοτώσουν κανέναν

Καθαρίζοντας έναν δρόμο προς την επιτυχία

Waferscale, συναντήστε την ατομική κλίμακα: Ο θείος Σαμ θα δοκιμάσει τα τσιπ της Cerebras σε πυρηνικά όπλα sims

Η Κίνα βάζει την εγχώρια υποδομή τεχνητής νοημοσύνης στη λίστα με τις υποχρεώσεις της

Κοιτάξτε τα έντομα εάν θέλετε να φτιάξετε μικροσκοπικά ρομπότ τεχνητής νοημοσύνης που είναι πραγματικά έξυπνα

Η Ουάσιγκτον εξετάζει τα σύννεφα παρακολούθησης για ύποπτη εκπαίδευση τεχνητής νοημοσύνης

Η εφαρμογή AI για προσυμπτωματικό έλεγχο καρκίνου του μαστού OK'd by watchdog

Σχετικά με μας

Κάθετη αναζήτηση & Ai

Πλατφόρμα

Μείνετε συνδεδεμένοι

Λογαριασμός