Anthropic: Νέο μοντέλο AI με περιορισμούς σε κυβερνοασφάλεια και βιολογία

economy

Η Anthropic PBC προχωρά στην ευρεία διάθεση μιας έκδοσης του Mythos, η οποία θα μπλοκάρεται από την εκτέλεση εργασιών κυβερνοασφάλειας, λίγους μήνες αφότου είχε προειδοποιήσει ότι το ισχυρό μοντέλο τεχνητής νοημοσύνης θα μπορούσε να εντοπίζει και να εκμεταλλεύεται ευπάθειες σε κρίσιμα λογισμικά. Το νέο μοντέλο, με την ονομασία Fable 5, αναμένεται να κυκλοφορήσει την Τρίτη με δικλίδες ασφαλείας που θα το εμποδίζουν να απαντά σε ορισμένους τύπους ερωτημάτων, μεταξύ των οποίων εκείνα που σχετίζονται με την κυβερνοασφάλεια και τη βιολογία. Σε αυτές τις περιπτώσεις, η Anthropic ανέφερε ότι το chatbot Claude θα δρομολογεί τις απαντήσεις μέσω ενός διαφορετικού μοντέλου, που ονομάζεται Opus 4.8. Η Anthropic διαθέτει επίσης το ίδιο μοντέλο, χωρίς ορισμένα από τα προστατευτικά μέτρα, ως νέα έκδοση του Mythos με την ονομασία Mythos 5. Το μοντέλο αυτό θα είναι διαθέσιμο στις ομάδες που μπορούν να χρησιμοποιούν την έκδοση με δυνατότητες κυβερνοασφάλειας μέσω μιας πρωτοβουλίας που ονομάζεται Project Glasswing. Την περασμένη εβδομάδα, η Anthropic πρόσθεσε 150 ακόμη οργανισμούς στη λίστα των εταιρειών που έχουν πρόσβαση στο Mythos, ανεβάζοντας τον συνολικό αριθμό σε περίπου 200. Το Mythos έχει βρεθεί στο επίκεντρο της στρατηγικής της εταιρείας με έδρα το Σαν Φρανσίσκο τους τελευταίους μήνες, καθώς η Anthropic κινείται προς την αρχική δημόσια προσφορά της. Η εταιρεία έλαβε την ασυνήθιστη απόφαση να περιορίσει την πρόσβαση στο μοντέλο σε επιλεγμένους συνεργάτες, επικαλούμενη ανησυχίες ότι μπορεί να εντοπίζει και να εκμεταλλεύεται ευπάθειες «σε κάθε μεγάλο λειτουργικό σύστημα και σε κάθε μεγάλο πρόγραμμα περιήγησης στο διαδίκτυο, όταν του ζητηθεί από χρήστη να το κάνει». Όπως και οι ανταγωνιστές της, ωστόσο, η Anthropic εργάζεται επίσης για την ανάπτυξη μοντέλων με μεγαλύτερες δυνατότητες σε μια σειρά από κερδοφόρες εργασίες, όπως ο προγραμματισμός, τα χρηματοοικονομικά και η κυβερνοασφάλεια. «Θέλαμε να διασφαλίσουμε ότι, για χρήσεις που δεν σχετίζονται με την κυβερνοασφάλεια, θα δίναμε πραγματικά προτεραιότητα στην ασφαλή κυκλοφορία του Fable το συντομότερο δυνατό», δήλωσε η Νταϊάν Πεν, επικεφαλής διαχείρισης έργων στην έρευνα και τα εργαστήρια της Anthropic. «Γι’ αυτό διαθέτουμε πρώτα αυτό το μέρος του Fable, ενώ συνεχίζουμε να εργαζόμαστε πάνω στις γενικές χρήσεις που σχετίζονται με την κυβερνοασφάλεια». Το Fable 5 έχει σχεδιαστεί ώστε να είναι καλύτερο στον προγραμματισμό και σε άλλες επαγγελματικές εργασίες, ιδιαίτερα στην επίλυση δύσκολων προβλημάτων για μεγαλύτερο χρονικό διάστημα σε σχέση με προηγούμενα μοντέλα, σύμφωνα με την εταιρεία. Σε δοκιμή του νέου λογισμικού, η εταιρεία πληρωμών Stripe κατάφερε να ολοκληρώσει μέσα σε μία ημέρα μια εκτεταμένη εργασία μηχανικής λογισμικού, η οποία χειροκίνητα θα απαιτούσε δύο μήνες εργασίας από μια ομάδα, σύμφωνα με την Anthropic. Η εταιρεία ανέφερε επίσης ότι μια υπόθεση που δημιούργησε το Mythos σχετικά με έναν νέο μηχανισμό μιας πρωτεΐνης του E. coli επιβεβαιώθηκε σε ερευνητική εργασία από εργαστήριο που μελετούσε το ίδιο ζήτημα. Για να ελέγξει αν οι δικλίδες ασφαλείας του Fable 5 άντεχαν, η Anthropic δήλωσε ότι πραγματοποίησε εξωτερικό πρόγραμμα bug bounty, με στόχο τον εντοπισμό τρόπων παράκαμψης των περιορισμών του μοντέλου, δηλαδή jailbreak. Σε περισσότερες από 1.000 ώρες δοκιμών, οι ομάδες red teaming δεν εντόπισαν καθολικά jailbreaks. Η Πεν ανέφερε ότι η Anthropic θα συνεχίσει να αυξάνει τον αριθμό των ομάδων που έχουν πρόσβαση στην έκδοση του Mythos με δυνατότητες κυβερνοασφάλειας μέσω του Project Glasswing και θα εξετάσει «άλλες προσεγγίσεις» ώστε έμπιστοι συνεργάτες να αποκτούν πρόσβαση για χρήσεις κυβερνοασφάλειας. Διαβάστε επίσης Airbus: Κίνδυνος να χαθεί ο στόχος παραγωγής για τα A320 λόγω έλλειψης κινητήρων Reuters: H οικογένεια Τραμπ κέρδισε 2,3 δις από τα crypto αλλά χιλιάδες επενδυτές καταστράφηκαν JPMorgan: Η ισχυρή κερδοφορία κρατά ζωντανό το ράλι στη Wall Street