Χαρακτηριστικό Το Generative AI θέτει ενδιαφέρουσες προκλήσεις για τους ακαδημαϊκούς εκδότες που αντιμετωπίζουν την απάτη στις επιστημονικές εργασίες, καθώς η τεχνολογία δείχνει τη δυνατότητα να ξεγελάσει την ανθρώπινη κριτική από ομοτίμους.
Περιγράψτε μια εικόνα για το DALL-E, το Stable Diffusion και το Midjourney και θα δημιουργήσουν μία σε δευτερόλεπτα. Αυτά τα συστήματα κειμένου σε εικόνα έχουν βελτιωθεί γρήγορα τα τελευταία χρόνια και αυτό που αρχικά ξεκίνησε ως ερευνητικό πρωτότυπο, δημιουργώντας καλοήθη και υπέροχα παράξενα εικονογραφήσεις από μωρά ραπανάκια daikon που περπατούν σκυλιά το 2021, έκτοτε μετατράπηκε σε εμπορικό λογισμικό, κατασκευασμένο από εταιρείες δισεκατομμυρίων δολαρίων, ικανό να παράγει όλο και πιο ρεαλιστικές εικόνες.
Αυτά τα μοντέλα τεχνητής νοημοσύνης μπορούν να παράγουν ρεαλιστικές εικόνες ανθρώπινων προσώπων, αντικειμένων και σκηνών και είναι θέμα χρόνου να καταφέρουν να δημιουργήσουν και πειστικές επιστημονικές εικόνες και δεδομένα. Τα μοντέλα κειμένου σε εικόνα είναι πλέον ευρέως προσβάσιμα, αρκετά φθηνά στη χρήση και θα μπορούσαν να βοηθήσουν τους επιστήμονες να πλαστογραφήσουν αποτελέσματα και να δημοσιεύσουν πιο εύκολα ψευδείς έρευνες.
Η χειραγώγηση της εικόνας είναι ήδη ένα σημαντικό μέλημα για τους ακαδημαϊκούς εκδότες, καθώς είναι και το πιο σημαντικό κοινή μορφή επιστημονικών παραπτωμάτων τελευταία. Οι συγγραφείς μπορούν να χρησιμοποιήσουν κάθε είδους κόλπα, όπως αναστροφή, περιστροφή ή περικοπή τμημάτων της ίδιας εικόνας σε πλαστά δεδομένα. Οι συντάκτες ξεγελιούνται και πιστεύουν ότι όλα τα αποτελέσματα που παρουσιάζονται είναι πραγματικά και θα δημοσιεύσουν τη δουλειά τους.
Πολλοί εκδότες στρέφονται τώρα στο λογισμικό AI σε μια προσπάθεια να το κάνουν ανίχνευση σημάδια διπλασιασμού της εικόνας κατά τη διαδικασία αναθεώρησης. Στις περισσότερες περιπτώσεις, οι εικόνες έχουν αντιγραφεί κατά λάθος από επιστήμονες που έχουν μπερδέψει τα δεδομένα τους, αλλά μερικές φορές χρησιμοποιούνται για κατάφωρη απάτη.
Αλλά ακριβώς τη στιγμή που οι εκδότες αρχίζουν να καταλαβαίνουν την αντιγραφή εικόνων, μια άλλη απειλή εμφανίζεται. Ορισμένοι ερευνητές μπορεί να μπουν στον πειρασμό να χρησιμοποιήσουν παραγωγικά μοντέλα AI για να δημιουργήσουν πλαστά δεδομένα. Στην πραγματικότητα, υπάρχουν στοιχεία που υποδηλώνουν ότι οι ψεύτικοι επιστήμονες το κάνουν ήδη αυτό.
Εικόνες από τεχνητή νοημοσύνη εντοπίστηκαν σε χαρτιά;
Το 2019, η DARPA κυκλοφόρησε την Semantic Forensics (SemaFor) πρόγραμμα, που χρηματοδοτεί ερευνητές που αναπτύσσουν εγκληματολογικά εργαλεία ικανά να ανιχνεύουν μέσα που κατασκευάζονται από την τεχνητή νοημοσύνη, για την καταπολέμηση της παραπληροφόρησης.
Ένας εκπρόσωπος της αμυντικής ερευνητικής υπηρεσίας του Uncle Sam επιβεβαίωσε ότι εντόπισε ψεύτικες ιατρικές εικόνες που δημοσιεύτηκαν σε πραγματικές επιστημονικές εργασίες που φαίνεται να δημιουργούνται χρησιμοποιώντας AI. Πριν από τα μοντέλα κειμένου-σε-εικόνα, τα δίκτυα παραγωγής αντιπάλου ήταν δημοφιλή. Η DARPA συνειδητοποίησε ότι αυτά τα μοντέλα, πιο γνωστά για την ικανότητά τους να δημιουργούν deepfakes, θα μπορούσαν επίσης να πλαστογραφήσουν εικόνες ιατρικών σαρώσεων, κυττάρων ή άλλων τύπων εικόνων που βρίσκονται συχνά σε βιοϊατρικές μελέτες.
«Το τοπίο της απειλής κινείται αρκετά γρήγορα», είπε ο William Corvey, διευθυντής προγράμματος της SemaFor. Το μητρώο. «Η τεχνολογία γίνεται πανταχού παρούσα για καλοήθεις σκοπούς». Ο Corvey είπε ότι ο οργανισμός είχε κάποια επιτυχία στην ανάπτυξη λογισμικού ικανού να ανιχνεύει εικόνες κατασκευασμένες από το GAN και τα εργαλεία είναι ακόμα υπό ανάπτυξη.
Το τοπίο της απειλής κινείται αρκετά γρήγορα
«Έχουμε αποτελέσματα που υποδεικνύουν ότι μπορείτε να ανιχνεύσετε «αδέρφια ή μακρινά ξαδέρφια» του μηχανισμού παραγωγής που έχετε μάθει να ανιχνεύετε προηγουμένως, ανεξάρτητα από το περιεχόμενο των εικόνων που δημιουργούνται. Το SemaFor analytics εξετάζει μια ποικιλία αποδόσεων και λεπτομερειών που σχετίζονται με χειραγωγημένα μέσα, τα πάντα, από μεταδεδομένα, στατιστικές ανωμαλίες έως περισσότερες οπτικές αναπαραστάσεις», είπε.
Ορισμένοι αναλυτές εικόνων που εξετάζουν τα δεδομένα σε επιστημονικές εργασίες έχουν επίσης συναντήσει εικόνες που μοιάζουν με εικόνες που δημιουργούνται από το GAN. Το GAN είναι ένα παραγωγικό ανταγωνιστικό δίκτυο, ένας τύπος συστήματος μηχανικής μάθησης που μπορεί να δημιουργήσει γραφή, μουσική, εικόνες και πολλά άλλα.
Για παράδειγμα, η Jennifer Byrne, καθηγήτρια μοριακής ογκολογίας στο Πανεπιστήμιο του Σίδνεϋ και η Jana Christopher, αναλύτρια ακεραιότητας εικόνας για τον εκδότη περιοδικού EMBO Press, βρήκαν ένα περίεργο σύνολο εικόνων που εμφανίστηκαν σε 17 μελέτες που σχετίζονται με τη βιοχημεία.
Οι εικόνες απεικόνιζαν μια σειρά από συγκροτήματα κοινώς γνωστά ως western blots, οι οποίες υποδεικνύουν την παρουσία συγκεκριμένων πρωτεϊνών σε ένα δείγμα, που όλες έμοιαζαν να έχουν το ίδιο υπόβαθρο. Αυτό δεν πρέπει να συμβεί.
Παραδείγματα επαναλαμβανόμενων φόντων σε εικόνες western blot, που επισημαίνονται από τα κόκκινα και πράσινα περιγράμματα… Πηγή: Byrne, Christopher 2020
Το 2020, ο Byrne και ο Christopher κατέληξαν στο συμπέρασμα ότι οι ύποπτες εικόνες παρήχθησαν πιθανότατα ως μέρος μιας επιχείρησης εργοστασίου χαρτιού: μια προσπάθεια μαζικής παραγωγής εγγράφων για βιοχημικές μελέτες χρησιμοποιώντας πλαστά δεδομένα και αξιολόγηση και δημοσίευσή τους από ομοτίμους. Μια τέτοια κάπαρη μπορεί να γίνει για να ωφεληθούν, για παράδειγμα, ακαδημαϊκοί που αμείβονται με βάση την αποδεκτή παραγωγή χαρτιού ή για να βοηθήσουν ένα τμήμα να πετύχει ένα όριο δημοσιευμένων εκθέσεων.
«Οι κηλίδες στο παράδειγμα που φαίνονται στο το χαρτί μας είναι πιθανότατα δημιουργημένα από υπολογιστή», είπε ο Christopher Το μητρώο.
Συχνά συναντώ εικόνες ψεύτικες, κυρίως western blots, αλλά όλο και περισσότερο και εικόνες μικροσκοπίας
«Σε προβολές τόσο πριν όσο και μετά τη δημοσίευση, συναντώ συχνά εικόνες με ψεύτικες όψεις, κυρίως στυπώματα γουέστερν, αλλά όλο και περισσότερο και μικροσκοπικές εικόνες. Γνωρίζω πολύ καλά ότι πολλά από αυτά πιθανότατα δημιουργούνται χρησιμοποιώντας GAN.”
Η Elisabeth Bik, ένας ανεξάρτητος τεχνικός εικόνων, μπορεί συχνά να πει πότε έχουν γίνει χειραγώγηση των εικόνων. Ασχολείται με επιστημονικά χειρόγραφα, ψάχνει για διπλές εικόνες και επισημαίνει αυτά τα τεύχη για να τα εξετάσουν περαιτέρω οι συντάκτες των περιοδικών. Αλλά είναι πιο δύσκολο να καταπολεμηθούν οι ψεύτικες εικόνες όταν έχουν δημιουργηθεί πλήρως από έναν αλγόριθμο.
Επισήμανε ότι παρόλο που το επαναλαμβανόμενο υπόβαθρο στις εικόνες που επισημαίνονται στη μελέτη του Byrne και του Christopher είναι ένα ενδεικτικό σημάδι πλαστογραφίας, τα ίδια τα πραγματικά στυπώματα γουέστερν είναι μοναδικά. Το λογισμικό υπολογιστικής όρασης που χρησιμοποιεί η Bik για τη σάρωση των χαρτιών και τον εντοπισμό απάτης εικόνων θα ήταν δύσκολο να επισημάνει αυτές τις ζώνες, επειδή δεν υπάρχουν διπλασιασμοί των πραγματικών κηλίδων.
«Δεν θα βρούμε ποτέ επικάλυψη. Είναι όλα, πιστεύω, φτιαγμένα τεχνητά. Πώς ακριβώς, δεν είμαι σίγουρη», είπε Το Μητρώο.
Είναι πιο εύκολο να δημιουργήσετε ψεύτικες εικόνες με τα πιο πρόσφατα μοντέλα τεχνητής νοημοσύνης
Τα GAN έχουν εκτοπιστεί σε μεγάλο βαθμό από τα μοντέλα διάχυσης. Αυτά τα συστήματα δημιουργούν μοναδικές εικόνες και τροφοδοτούν το σημερινό λογισμικό μετατροπής κειμένου σε εικόνα, συμπεριλαμβανομένων των DALL-E, Stable Diffusion και Midjourney. Μαθαίνουν να χαρτογραφούν την οπτική αναπαράσταση αντικειμένων και εννοιών στη φυσική γλώσσα και θα μπορούσαν να μειώσουν σημαντικά το εμπόδιο για την ακαδημαϊκή απάτη.
Οι επιστήμονες μπορούν απλώς να περιγράψουν τι είδους ψευδή δεδομένα θέλουν να δημιουργηθούν και αυτά τα εργαλεία θα το κάνουν για αυτούς. Προς το παρόν, ωστόσο, δεν μπορούν να δημιουργήσουν ακόμα ρεαλιστικές επιστημονικές εικόνες. Μερικές φορές τα εργαλεία παράγουν συστάδες κυττάρων που φαίνονται πειστικά με την πρώτη ματιά, αλλά αποτυγχάνουν παταγωδώς όταν πρόκειται για western blots.
Αυτό είναι το είδος των πραγμάτων που μπορούν να δημιουργήσουν αυτά τα προγράμματα AI:
Εδώ είναι τι @OpenAIΤο DALL-E του 's κάνει με τις προτροπές βιολογικών κυττάρων
Συγκεκριμένα: «κύτταρα κάτω από μικροσκόπιο» και «Τ-κύτταρα κάτω από ηλεκτρονικό μικροσκόπιο σάρωσης» pic.twitter.com/BgcZr3k5Q5
— Tara Basu Trivedi (@tbt94) Αύγουστος 23, 2022
Ο Γουίλιαμ Γκίμπσον – γιατρός-επιστήμονας και ιατρός ογκολόγος, όχι ο διάσημος συγγραφέας – έχει περαιτέρω παραδείγματα εδώ, συμπεριλαμβανομένου του τρόπου με τον οποίο τα σημερινά μοντέλα παλεύουν με την έννοια του western blot.
Ωστόσο, η τεχνολογία βελτιώνεται μόνο, καθώς οι προγραμματιστές εκπαιδεύουν μεγαλύτερα μοντέλα με περισσότερα δεδομένα.
Ο David Bimler, ένας άλλος ειδικός στην αναγνώριση της χειραγώγησης εικόνας σε επιστημονικές εργασίες, πιο γνωστός ως Smut Clyde, μας είπε: «Οι χαρτοπωλεία θα απεικονίσουν τα προϊόντα τους χρησιμοποιώντας οποιαδήποτε μέθοδο είναι φθηνότερη και ταχύτερη, βασιζόμενοι στις αδυναμίες της διαδικασίας αξιολόγησης από ομοτίμους».
«Μπορούσαν απλώς να αντιγράψουν [γουέστερν λεκέδες] από παλαιότερες εφημερίδες, αλλά ακόμη και αυτό απαιτεί δουλειά για την αναζήτηση παλιών εφημερίδων. Προς το παρόν, υποπτεύομαι ότι η χρήση ενός GAN είναι ακόμα κάποια προσπάθεια. Αν και αυτό θα αλλάξει», πρόσθεσε.
Η DARPA προσπαθεί τώρα να επεκτείνει το πρόγραμμά της SemaFor για τη μελέτη συστημάτων κειμένου σε εικόνα. «Αυτά τα είδη μοντέλων είναι αρκετά καινούργια και, αν και έχουν εύρος, δεν αποτελούν μέρος της τρέχουσας δουλειάς μας στο SemaFor», είπε ο Corvey.
"Ωστόσο, οι αξιολογητές του SemaFor είναι πιθανό να εξετάσουν αυτά τα μοντέλα κατά την επόμενη φάση αξιολόγησης του προγράμματος που αρχίζει το φθινόπωρο του 2023."
Εν τω μεταξύ, η ποιότητα της επιστημονικής έρευνας θα διαβρωθεί εάν οι ακαδημαϊκοί εκδότες δεν μπορούν να βρουν τρόπους να ανιχνεύσουν ψεύτικες εικόνες που δημιουργούνται από AI σε έγγραφα. Στην καλύτερη περίπτωση, αυτή η μορφή ακαδημαϊκής απάτης θα περιοριστεί μόνο σε συστήματα χαρτοποιίας που ούτως ή άλλως δεν τυγχάνουν ιδιαίτερης προσοχής. Στη χειρότερη περίπτωση, θα επηρεάσει ακόμη και τα πιο έγκριτα περιοδικά και οι επιστήμονες με καλές προθέσεις θα σπαταλήσουν χρόνο και χρήμα κυνηγώντας ψεύτικες ιδέες που πιστεύουν ότι είναι αληθινές. ®
- SEO Powered Content & PR Distribution. Ενισχύστε σήμερα.
- Platoblockchain. Web3 Metaverse Intelligence. Ενισχύθηκε η γνώση. Πρόσβαση εδώ.
- πηγή: https://go.theregister.com/feed/www.theregister.com/2023/03/11/ai_scientfic_fraud/
- :είναι
- $UP
- 2019
- 2020
- 2021
- 2023
- a
- ικανότητα
- ακαδημαϊκής
- προσιτός
- απέναντι
- προστιθέμενη
- αντιφατική
- πρακτορείο
- AI
- αλγόριθμος
- Όλα
- ήδη
- Αν και
- αναλυτής
- Αναλυτές
- analytics
- και
- Άλλος
- εμφανίζομαι
- Εμφανίστηκε
- ΕΙΝΑΙ
- AS
- συσχετισμένη
- At
- προσοχή
- συγγραφέας
- συγγραφείς
- Μωρό
- φόντο
- υπόβαθρα
- φράγμα
- βασίζονται
- BE
- επειδή
- να γίνει
- πριν
- ξεκίνησε
- αρχίζουν
- Αρχή
- είναι
- Πιστεύω
- πιστεύοντας
- όφελος
- ΚΑΛΎΤΕΡΟΣ
- Καλύτερα
- βιοϊατρικής
- χτισμένο
- by
- CAN
- ικανός
- περιπτώσεις
- Κύτταρα
- προκλήσεις
- αλλαγή
- φθηνά
- φθηνότερο
- εξαπάτησης
- Χριστόφορος
- CO
- την καταπολέμηση της
- Ελάτε
- εμπορικός
- συνήθως
- Εταιρείες
- αποζημίωση
- υπολογιστή
- Computer Vision
- που παράγεται από υπολογιστή
- έννοια
- έννοιες
- Ανησυχία
- συμπέρασμα
- ΕΠΙΒΕΒΑΙΩΜΕΝΟΣ
- περιεχόμενο
- θα μπορούσε να
- δημιουργία
- δημιουργία
- Ρεύμα
- του νταλ
- darpa
- ημερομηνία
- deepfakes
- Άμυνα
- Τμήμα
- περιγράφουν
- καθέκαστα
- προγραμματιστές
- ανάπτυξη
- Ανάπτυξη
- Διάχυση
- παραπληροφόρηση
- εκτοπισμένων
- μακρινός
- Σκύλοι
- πράξη
- κατά την διάρκεια
- ευκολότερη
- εύκολα
- προσπάθεια
- σμυριδόπετρα
- Αιθέρας (ΕΤΗ)
- εκτίμηση
- Even
- πάντα
- απόδειξη
- ακριβώς
- παράδειγμα
- παραδείγματα
- Ανάπτυξη
- εμπειρογνώμονας
- πρόσωπα
- ΑΠΟΤΥΓΧΑΝΩ
- αρκετά
- απομίμηση
- Πτώση
- πασίγνωστη και
- ταχύτερα
- σύντροφος
- λίγοι
- Εικόνα
- Εύρεση
- Όνομα
- σημαίες
- Για
- Δικανικός
- ιατροδικαστική
- σιδηρουργείο
- μορφή
- Βρέθηκαν
- απάτη
- ανεξάρτητος
- από
- χρηματοδότηση
- περαιτέρω
- GAN
- παράγουν
- παράγεται
- παραγωγής
- γενετική
- γενετικά δίκτυα αντιπάλων
- Παραγωγική τεχνητή νοημοσύνη
- γονιδίωμα
- παίρνω
- να πάρει
- Ματιά
- μετάβαση
- καλός
- Πράσινο
- συμβαίνω
- Σκληρά
- Έχω
- βοήθεια
- Τόνισε
- Επιτυχία
- Πως
- Ωστόσο
- HTTPS
- ανθρώπινος
- Κυνήγι
- i
- ιδεών
- εικόνα
- εικόνες
- Επίπτωση
- βελτιωθεί
- in
- Συμπεριλαμβανομένου
- όλο και περισσότερο
- υποδεικνύω
- αρχικά
- παράδειγμα
- ακεραιότητα
- προθέσεις
- ενδιαφέρον
- ανεξάρτητος
- θέματα
- IT
- ΤΟΥ
- Τζένιφερ
- ημερολόγιο
- jpg
- γνωστός
- επιγραφή
- τοπίο
- Γλώσσα
- σε μεγάλο βαθμό
- μεγαλύτερος
- Αργά
- αργότερο
- ξεκίνησε
- ΜΑΘΑΊΝΩ
- μάθει
- Μου αρέσει
- Πιθανός
- Περιωρισμένος
- ματιά
- μοιάζει
- κοιτάζοντας
- που
- διευθυντής
- χειραγωγείται
- Χειρισμός
- πολοί
- χάρτη
- Μάζα
- ύλη
- μηχανισμός
- Εικόνες / Βίντεο
- ιατρικών
- Μεταδεδομένα
- μέθοδος
- Μικροσκοπία
- MidJourney
- ενδέχεται να
- μοντέλα
- μοριακός
- στιγμή
- χρήματα
- περισσότερο
- πλέον
- κίνηση
- Μουσική
- Φυσικό
- Φυσική γλώσσα
- δίκτυο
- δίκτυα
- Νέα
- επόμενη
- ΝΙΗ
- αντικειμένων
- of
- Παλιά
- on
- ογκολογία
- ONE
- λειτουργία
- ΑΛΛΑ
- περιγράφει
- παραγωγή
- Χαρτί
- χαρτιά
- μέρος
- εξαρτήματα
- Το παρελθόν
- ομότιμων
- φάση
- Εικόνες
- Πλάτων
- Πληροφορία δεδομένων Plato
- Πλάτωνα δεδομένα
- Δημοφιλής
- θέτει
- δυναμικού
- δύναμη
- κυρίως
- παρουσία
- παρουσιάζονται
- τύπος
- αρκετά
- προηγουμένως
- πιθανώς
- διαδικασια μας
- παράγει
- Παράγεται
- Προϊόντα
- Δάσκαλος
- Πρόγραμμα
- Προγράμματα
- Πρωτεΐνες
- πρωτότυπο
- δημοσιεύει
- δημοσιεύθηκε
- εκδότης
- Εκδότες
- σκοποί
- ποιότητα
- ταχέως
- RE
- πραγματικός
- ρεαλιστικός
- συνειδητοποίησα
- λαμβάνω
- Red
- κάντε ΕΓΓΡΑΦΗ
- επανειλημμένες
- Εκθέσεις
- αντιπροσώπευση
- ευυπόληπτος
- έρευνα
- ερευνητές
- Αποτελέσματα
- ανασκόπηση
- αξιολόγηση
- s
- Είπε
- Sam
- ίδιο
- σάρωση
- σάρωσης
- σενάριο
- Σκηνές
- συστήματα
- Επιστήμη
- Επιστημονική έρευνα
- επιστήμονες
- έκταση
- προσυμπτωματικού ελέγχου
- Αναζήτηση
- δευτερόλεπτα
- φαινόταν
- σηματοφόρος
- Σειρές
- σειρά
- παρουσιάζεται
- Δείχνει
- υπογράψουν
- σημαντικά
- Σημάδια
- απλά
- αφού
- Ντετέκτιβ
- λογισμικό
- μερικοί
- Πηγή
- συγκεκριμένες
- εκπρόσωπος
- Spot
- σταθερός
- στατιστικός
- Ακόμη
- Πάλη
- μελέτες
- Μελέτη
- επιτυχία
- τέτοιος
- υποτιθεμένος
- ύποπτος
- sydney
- σύστημα
- συστήματα
- Τεχνολογία
- ότι
- Η
- τους
- Τους
- τους
- Αυτοί
- πράγμα
- απειλή
- Μέσω
- ώρα
- προς την
- σήμερα
- πολύ
- εργαλεία
- κορυφή
- Τρένο
- αληθής
- Στροφή
- Τουίτερ
- τύποι
- πανταχού παρών
- υπό
- μοναδικός
- πανεπιστήμιο
- Πανεπιστήμιο του Σίδνεϊ
- us
- χρήση
- ποικιλία
- Ve
- όραμα
- περπάτημα
- Απόβλητα
- τρόπους
- Δυτικός
- Τι
- Ποιό
- ενώ
- Ο ΟΠΟΊΟΣ
- ευρέως
- θα
- με
- Εργασία
- θα
- γραφή
- χρόνια
- zephyrnet