Drones, αυτοκίνητα που οδηγούν μόνα τους και ανθρωποειδή ρομπότ «διαβάζουν» το περιβάλλον μέσω οπτικών πληροφοριών. Όμως, τι γίνεται αν κάποιος τους «περάσει» επιβλαβείς εντολές;Preprint σημαίνει ότι τα αποτελέσματα είναι προκαταρκτικά και μπορεί να αλλάξουν μετά από επιστημονικό έλεγχο (peer review).Τρεις περιπτώσεις για να ξεγελαστεί η τεχνητή νοημοσύνηΓιατί τα Large Vision-Language Models είναι ευάλωτα σε εξωτερικές εντολέςΗ οπτική prompt injection δεν απαιτεί απαραίτητα hacking λογισμικού. Μπορεί να γίνει με “αθώα” φυσικά αντικείμενα, όπως μια πινακίδα.CHAI: “Κατάληψη εντολών” (Command Hijacking) σε embodied AIΑποτελέσματα: υψηλά ποσοστά επιτυχίας στην εξαπάτησηΠίνακας: Ποσοστά επιτυχίας του CHAI ανά σενάριοΡομπο-αυτοκίνητο μπορεί να ξεγελαστεί με πινακίδεςΤι δείχνουν τα ευρήματα για την ασφάλεια της embodied AIΣε προσομοίωση, το CHAI έφτασε έως 95,5%
Η πολιτική εμπιστοσύνης από τη μεριά των εταιρειώνΠου οφείλεται ο κίνδυνος στην πράξηChecklist άμυνας για ομάδες ασφαλείας (fleet operators & κατασκευαστές)Πίνακας: Μέτρα μετριασμού και τι προστατεύουν
Μέτρο
Τι μειώνει
Πρακτική εφαρμογή
Policy gating (κανόνες ασφαλείας πάνω από το LVLM)
Αυθαίρετες/επικίνδυνες ενέργειες από “εντολές”
Ποτέ παραβίαση ΚΟΚ, πάντα ελάχιστη ρίσκο-ενέργεια
Sensor fusion & επιβεβαίωση με χάρτες
Εξάρτηση από μία μόνο κάμερα/εικόνα
Αν το κείμενο λέει “στρίψε”, ο χάρτης/λωρίδες πρέπει να το επιτρέπουν
Adversarial training με φυσικές πινακίδες
Ευαισθησία σε prompt-like οπτικά μοτίβα
Dataset με κακόβουλες/παραπλανητικές πινακίδες, αυτοκόλλητα, οθόνες
| Μέτρο | Τι μειώνει | Πρακτική εφαρμογή |
|---|---|---|
| Policy gating (κανόνες ασφαλείας πάνω από το LVLM) | Αυθαίρετες/επικίνδυνες ενέργειες από “εντολές” | Ποτέ παραβίαση ΚΟΚ, πάντα ελάχιστη ρίσκο-ενέργεια |
| Sensor fusion & επιβεβαίωση με χάρτες | Εξάρτηση από μία μόνο κάμερα/εικόνα | Αν το κείμενο λέει “στρίψε”, ο χάρτης/λωρίδες πρέπει να το επιτρέπουν |
| Adversarial training με φυσικές πινακίδες | Ευαισθησία σε prompt-like οπτικά μοτίβα | Dataset με κακόβουλες/παραπλανητικές πινακίδες, αυτοκόλλητα, οθόνες |
Τέλος, σε επίπεδο κανονιστικής συμμόρφωσης, έχει αξία να καθιερωθούν δοκιμές τύπου “οπτικού penetration test” πριν από την εμπορική ανάπτυξη στόλων robotaxi: όχι μόνο για το αν «βλέπουν» σωστά τα σήματα, αλλά για το αν μπορούν να αγνοήσουν πειστικές, κακόβουλες οδηγίες.
Όσο τα αυτόνομα συστήματα πλησιάζουν την καθημερινή χρήση, η ασφάλεια δεν είναι απλώς ζήτημα ατυχημάτων — είναι και ζήτημα ανθεκτικότητας απέναντι σε χειραγώγηση σε δημόσιους χώρους.

