Στην Google, διατηρούμε α Πρόγραμμα επιβράβευσης ευπάθειας για να τιμήσει τις εξωτερικές συνεισφορές αιχμής για την αντιμετώπιση ζητημάτων σε ιδιοκτησίες Ιστού που ανήκουν στην Google και θυγατρικές της Alphabet. Για να συμβαδίσουμε με τις γρήγορες εξελίξεις στις τεχνολογίες τεχνητής νοημοσύνης και να διασφαλίσουμε ότι είμαστε έτοιμοι να αντιμετωπίσουμε τις προκλήσεις ασφάλειας σε α υπεύθυνος Έτσι, πρόσφατα επεκτείναμε τα υπάρχοντά μας Το πρόγραμμα Bug Hunters για την προώθηση της ανακάλυψης και αναφοράς από τρίτους για θέματα και τρωτά σημεία ειδικά για τα συστήματα τεχνητής νοημοσύνης μας. Αυτή η επέκταση είναι μέρος της προσπάθειάς μας να υλοποιήσουμε το εθελοντικές δεσμεύσεις τεχνητής νοημοσύνης που φτιάξαμε στον Λευκό Οίκο τον Ιούλιο.
Για να βοηθήσουμε την κοινότητα ασφαλείας να κατανοήσει καλύτερα αυτές τις εξελίξεις, έχουμε συμπεριλάβει περισσότερες πληροφορίες σχετικά με τα στοιχεία του προγράμματος επιβράβευσης.
Τι υπάρχει στο πεδίο για ανταμοιβές
Στο πρόσφατο μας Έκθεση της κόκκινης ομάδας AI, το οποίο βασίζεται στο Η Red Team της AI της Google ασκήσεις, εντοπίσαμε κοινές τακτικές, τεχνικές και διαδικασίες (TTP) που θεωρούμε πιο σχετικές και ρεαλιστικές για αντιπάλους του πραγματικού κόσμου για χρήση εναντίον συστημάτων AI. Ο παρακάτω πίνακας ενσωματώνει αυτά που μάθαμε για να βοηθήσουμε την ερευνητική κοινότητα να κατανοήσει τα κριτήριά μας για τις αναφορές σφαλμάτων τεχνητής νοημοσύνης και τι περιλαμβάνει το πρόγραμμα ανταμοιβής μας. Είναι σημαντικό να σημειωθεί ότι τα ποσά ανταμοιβής εξαρτώνται από τη σοβαρότητα του σεναρίου επίθεσης και τον τύπο του στόχου που επηρεάζεται (επίσκεψη τη σελίδα κανόνων προγράμματος για περισσότερες πληροφορίες σχετικά με τον πίνακα ανταμοιβών μας).
Άμεσες επιθέσεις: Δημιουργία αντιπάλων προτροπών που επιτρέπουν σε έναν αντίπαλο να επηρεάσει τη συμπεριφορά του μοντέλου και, ως εκ τούτου, την έξοδο, με τρόπους που δεν προοριζόταν από την εφαρμογή. |
Προτρέπετε τις ενέσεις που είναι αόρατες στα θύματα και αλλάζουν την κατάσταση του λογαριασμού του θύματος ή οποιουδήποτε από τα περιουσιακά του στοιχεία. |
|
Προτρέπετε τις ενέσεις σε οποιαδήποτε εργαλεία στα οποία η απόκριση χρησιμοποιείται για τη λήψη αποφάσεων που επηρεάζουν άμεσα τους χρήστες-θύματα. |
||
Προτροπή ή εξαγωγή προοιμίου στην οποία ένας χρήστης μπορεί να εξαγάγει την αρχική προτροπή που χρησιμοποιείται για την εκκίνηση του μοντέλου μόνο όταν υπάρχουν ευαίσθητες πληροφορίες στο εξαγόμενο προοίμιο. |
||
Χρήση ενός προϊόντος για τη δημιουργία παραβατικού, παραπλανητικού ή ανακριβούς περιεχομένου στη δική σας περίοδο σύνδεσης: π.χ. "jailbreaks". Αυτό περιλαμβάνει «παραισθήσεις» και ανακριβείς απαντήσεις. Τα παραγωγικά προϊόντα τεχνητής νοημοσύνης της Google διαθέτουν ήδη ένα αποκλειστικό κανάλι αναφοράς για αυτούς τους τύπους ζητημάτων περιεχομένου. |
Εκτός του πεδίου εφαρμογής |
|
Εξαγωγή δεδομένων εκπαίδευσης: Επιθέσεις που είναι σε θέση να ανασυνθέσουν επιτυχώς επί λέξει παραδείγματα εκπαίδευσης που περιέχουν ευαίσθητες πληροφορίες. Ονομάζεται επίσης συμπέρασμα μέλους. |
Εξαγωγή δεδομένων εκπαίδευσης που αναδομεί στοιχεία που χρησιμοποιούνται στο σύνολο δεδομένων εκπαίδευσης που διαρρέουν ευαίσθητες, μη δημόσιες πληροφορίες. |
|
Εξαγωγή που αναδομεί μη ευαίσθητες/δημόσιες πληροφορίες. |
Εκτός του πεδίου εφαρμογής |
|
Χειρισμός μοντέλων: Ένας εισβολέας μπορεί να αλλάξει κρυφά τη συμπεριφορά ενός μοντέλου έτσι ώστε να μπορεί να ενεργοποιήσει προκαθορισμένες αντιπαλικές συμπεριφορές. |
Αντιθετική έξοδος ή συμπεριφορά που μπορεί να ενεργοποιήσει αξιόπιστα ένας εισβολέας μέσω συγκεκριμένης εισαγωγής σε ένα μοντέλο που ανήκει και διαχειρίζεται η Google ("backdoors"). Μόνο σε εύρος όταν η έξοδος ενός μοντέλου χρησιμοποιείται για την αλλαγή της κατάστασης του λογαριασμού ή των δεδομένων ενός θύματος. |
|
Επιθέσεις στις οποίες ένας εισβολέας χειρίζεται τα δεδομένα εκπαίδευσης του μοντέλου για να επηρεάσει την έξοδο του μοντέλου στη συνεδρία του θύματος σύμφωνα με τις προτιμήσεις του εισβολέα. Μόνο σε εύρος όταν η έξοδος ενός μοντέλου χρησιμοποιείται για την αλλαγή της κατάστασης του λογαριασμού ή των δεδομένων ενός θύματος. |
||
Adversarial Perturbation: Είσοδοι που παρέχονται σε ένα μοντέλο που καταλήγει σε ένα ντετερμινιστικό, αλλά πολύ απροσδόκητο αποτέλεσμα από το μοντέλο. |
Πλαίσια στα οποία ένας αντίπαλος μπορεί αξιόπιστα να προκαλέσει μια εσφαλμένη ταξινόμηση σε έναν έλεγχο ασφαλείας που μπορεί να γίνει κατάχρηση για κακόβουλη χρήση ή αντίθετο κέρδος. |
|
Πλαίσια στα οποία η εσφαλμένη έξοδος ή ταξινόμηση ενός μοντέλου δεν αποτελεί συναρπαστικό σενάριο επίθεσης ή εφικτό μονοπάτι για τη βλάβη της Google ή των χρηστών. |
Εκτός του πεδίου εφαρμογής |
|
Κλοπή/Εξαγωγή μοντέλου: Τα μοντέλα τεχνητής νοημοσύνης συχνά περιλαμβάνουν ευαίσθητη πνευματική ιδιοκτησία, επομένως δίνουμε υψηλή προτεραιότητα στην προστασία αυτών των περιουσιακών στοιχείων. Οι επιθέσεις διείσδυσης επιτρέπουν στους εισβολείς να κλέψουν λεπτομέρειες σχετικά με ένα μοντέλο, όπως η αρχιτεκτονική ή τα βάρη του. |
Επιθέσεις στις οποίες εξάγεται η ακριβής αρχιτεκτονική ή τα βάρη ενός εμπιστευτικού/ιδιόκτητου μοντέλου. |
|
Επιθέσεις στις οποίες η αρχιτεκτονική και τα βάρη δεν εξάγονται με ακρίβεια ή όταν εξάγονται από ένα μη εμπιστευτικό μοντέλο. |
Εκτός του πεδίου εφαρμογής |
|
Εάν βρείτε κάποιο ελάττωμα σε ένα εργαλείο που λειτουργεί με τεχνητή νοημοσύνη διαφορετικό από αυτό που αναφέρεται παραπάνω, μπορείτε να υποβάλετε, υπό την προϋπόθεση ότι πληροί τις προσόντα που αναφέρονται στη σελίδα του προγράμματος μας. |
Σφάλμα ή συμπεριφορά που πληροί σαφώς τα προσόντα μας για έγκυρο ζήτημα ασφάλειας ή κατάχρησης. |
|
Χρησιμοποιώντας ένα προϊόν τεχνητής νοημοσύνης για να κάνετε κάτι δυνητικά επιβλαβές που είναι ήδη δυνατό με άλλα εργαλεία. Για παράδειγμα, η εύρεση μιας ευπάθειας σε λογισμικό ανοιχτού κώδικα (ήδη δυνατή χρησιμοποιώντας δημόσια διαθέσιμη εργαλεία στατικής ανάλυσης) και την παραγωγή της απάντησης σε μια επιβλαβή ερώτηση όταν η απάντηση είναι ήδη διαθέσιμη στο διαδίκτυο. |
Εκτός του πεδίου εφαρμογής |
|
Σύμφωνα με το πρόγραμμά μας, ζητήματα που ήδη γνωρίζουμε δεν είναι κατάλληλα για ανταμοιβή. |
Εκτός του πεδίου εφαρμογής |
|
Πιθανά ζητήματα πνευματικών δικαιωμάτων — ευρήματα στα οποία τα προϊόντα επιστρέφουν περιεχόμενο που φαίνεται να προστατεύεται από πνευματικά δικαιώματα. Τα παραγωγικά προϊόντα τεχνητής νοημοσύνης της Google διαθέτουν ήδη ένα αποκλειστικό κανάλι αναφοράς για αυτούς τους τύπους ζητημάτων περιεχομένου. |
Εκτός του πεδίου εφαρμογής |
Πιστεύουμε ότι η επέκταση του προγράμματος bounty bug στα συστήματα τεχνητής νοημοσύνης θα υποστηρίξει υπεύθυνη καινοτομία AI, και ανυπομονούμε να συνεχίσουμε τη δουλειά μας με την ερευνητική κοινότητα για να ανακαλύψουμε και να διορθώσουμε ζητήματα ασφάλειας και κατάχρησης στις λειτουργίες μας που υποστηρίζονται από AI. Εάν εντοπίσετε ένα πρόβλημα που πληροί τις προϋποθέσεις, μεταβείτε στον ιστότοπο Bug Hunters για να μας στείλετε την αναφορά σφαλμάτων σας και — εάν το ζήτημα κριθεί έγκυρο — ανταμειφθείτε που μας βοηθάτε να διατηρήσουμε τους χρήστες μας ασφαλείς.
- SEO Powered Content & PR Distribution. Ενισχύστε σήμερα.
- PlatoData.Network Vertical Generative Ai. Ενδυναμώστε τον εαυτό σας. Πρόσβαση εδώ.
- PlatoAiStream. Web3 Intelligence. Ενισχύθηκε η γνώση. Πρόσβαση εδώ.
- PlatoESG. Ανθρακας, Cleantech, Ενέργεια, Περιβάλλον, Ηλιακός, Διαχείριση των αποβλήτων. Πρόσβαση εδώ.
- PlatoHealth. Ευφυΐα βιοτεχνολογίας και κλινικών δοκιμών. Πρόσβαση εδώ.
- πηγή: https://www.darkreading.com/vulnerabilities-threats/establishing-reward-criteria-for-reporting-bugs-in-ai-products
- :είναι
- :δεν
- $UP
- 26
- 32
- 33
- 35%
- 36
- 41
- 7
- 8
- 9
- a
- Ικανός
- Σχετικα
- πάνω από
- κατάχρηση
- κατάχρηση
- Σύμφωνα με
- Λογαριασμός
- διεύθυνση
- διευθυνσιοδότηση
- προκαταβολές
- αντιφατική
- επηρεάζουν
- επηρεαστούν
- κατά
- AI
- Μοντέλα AI
- Συστήματα AI
- Τροφοδοτείται από AI
- επιτρέπουν
- ήδη
- Επίσης
- Ποσά
- an
- ανάλυση
- και
- απάντηση
- κάθε
- Εφαρμογή
- αρχιτεκτονική
- ΕΙΝΑΙ
- AS
- Ενεργητικό
- At
- επίθεση
- Επιθέσεις
- διαθέσιμος
- Κερκόπορτες
- βασίζονται
- BE
- συμπεριφορά
- Πιστεύω
- Καλύτερα
- γενναιοδωρία
- πρόγραμμα γενναιοδωρίας
- Έντομο
- bug bounty
- σφάλματα
- αλλά
- by
- που ονομάζεται
- CAN
- προκλήσεις
- αλλαγή
- Κανάλι
- ταξινόμηση
- σαφώς
- Κοινός
- κοινότητα
- συναρπαστικό
- Εξετάστε
- συνεπής
- περιέχουν
- περιεχόμενο
- συνεχίζοντας
- συνεισφορές
- έλεγχος
- πνευματική ιδιοκτησία
- κριτήρια
- αιχμής
- ημερομηνία
- σύνολο δεδομένων
- αποφάσεις
- αφιερωμένο
- εξαρτώμενος
- καθέκαστα
- εξελίξεις
- κατευθείαν
- ανακαλύπτουν
- ανακάλυψη
- do
- κάνει
- e
- προσπάθεια
- στοιχεία
- επιλέξιμες
- εξασφαλίζω
- δημιουργία
- Αιθέρας (ΕΤΗ)
- παράδειγμα
- παραδείγματα
- διήθηση
- επεκτάθηκε
- Επέκταση
- επέκταση
- εξωτερικός
- εκχύλισμα
- εξαγωγή
- εφικτός
- Χαρακτηριστικά
- Εύρεση
- εύρεση
- ευρήματα
- σταθερός
- ελάττωμα
- Εξής
- Για
- Προς τα εμπρός
- Προώθηση
- Βρέθηκαν
- από
- FT
- Κέρδος
- παράγουν
- γενετική
- Παραγωγική τεχνητή νοημοσύνη
- Go
- βλάψει
- επιβλαβής
- Έχω
- βοήθεια
- βοήθεια
- ως εκ τούτου
- Ψηλά
- υψηλά
- τιμή
- Σπίτι
- HTML
- http
- HTTPS
- προσδιορίζονται
- if
- εφαρμογή
- σημαντικό
- in
- ανακριβής
- περιλαμβάνουν
- περιλαμβάνονται
- περιλαμβάνει
- ενσωματώνει
- επιρροή
- πληροφορίες
- αρχικός
- εισαγωγή
- είσοδοι
- διανοούμενος
- πνευματικής ιδιοκτησίας
- προορίζονται
- σε
- αόρατος
- ζήτημα
- θέματα
- IT
- αντικειμένων
- ΤΟΥ
- jpg
- Ιούλιος
- Διατήρηση
- Ξέρω
- διαρροή
- μάθει
- Εισηγμένες
- ματιά
- που
- διατηρήσουν
- κάνω
- πληροί
- ιδιότητα του μέλους
- αποπλανητικός
- μοντέλο
- μοντέλα
- περισσότερο
- πλέον
- σημείωση
- of
- συχνά
- on
- διαδικτυακά (online)
- αποκλειστικά
- ανοίξτε
- ανοικτού κώδικα
- λειτουργεί
- or
- ΑΛΛΑ
- δικός μας
- παραγωγή
- δική
- ανήκει
- μέρος
- μονοπάτι
- Μέρος
- Πλάτων
- Πληροφορία δεδομένων Plato
- Πλάτωνα δεδομένα
- σας παρακαλούμε
- δυνατός
- ενδεχομένως
- ακριβώς
- έτοιμος
- παρόν
- Ακμή
- προτεραιότητα
- διαδικασίες
- που παράγουν
- Προϊόν
- Προϊόντα
- Πρόγραμμα
- προτρέπει
- ιδιότητες
- περιουσία
- προστατεύονται
- προστασία
- παρέχεται
- δημοσίως
- προσόντα
- προκριματικά
- ερώτηση
- γρήγορα
- RE
- πραγματικό κόσμο
- ρεαλιστικός
- πρόσφατα
- Red
- αναφέρουν
- Αναφορά
- Εκθέσεις
- έρευνα
- έρευνα Κοινότητα
- απάντησης
- απαντήσεις
- Αποτελέσματα
- απόδοση
- Ανταμοιβή
- σε συνδυασμό με ένα μοναδικό πρόγραμμα ανταμοιβής
- κανόνες
- s
- ένα ασφαλές
- σενάριο
- έκταση
- ασφάλεια
- στείλετε
- ευαίσθητος
- Συνεδρίαση
- σειρά
- αυστηρότητα
- So
- λογισμικό
- κάτι
- Πηγή
- συγκεκριμένες
- Κατάσταση
- Ακόμη
- υποβάλουν
- Επιτυχώς
- τέτοιος
- υποστήριξη
- συστήματα
- τραπέζι
- τακτική
- στόχος
- τεχνικές
- Τεχνολογίες
- από
- ότι
- Η
- Το κράτος
- τους
- Αυτοί
- αυτοί
- τρίτους
- αυτό
- προς την
- εργαλείο
- εργαλεία
- Εκπαίδευση
- ενεργοποιούν
- τύπος
- τύποι
- καταλαβαίνω
- Απροσδόκητος
- us
- χρήση
- μεταχειρισμένος
- Χρήστες
- Χρήστες
- χρησιμοποιώντας
- έγκυρος
- Ve
- μέσω
- Θύμα
- θύματα
- Επίσκεψη
- εθελοντικώς
- Θέματα ευπάθειας
- ευπάθεια
- Τρόπος..
- τρόπους
- we
- ιστός
- Ιστοσελίδα : www.example.gr
- ήταν
- Τι
- Τι είναι
- πότε
- Ποιό
- άσπρο
- Λευκός Οίκος
- Wikipedia
- θα
- με
- Εργασία
- εσείς
- Σας
- zephyrnet