Grok 3: Ο χρηματιστηριακός σεισμός της Τεχνητής Νοημοσύνης

του Αλέξανδρου Σχισμένου

Ο σκιώδης Πρόεδρος των ΗΠΑ, Ήλον Μασκ αποκάλυψε χθες, Τρίτη 18 Φεβρουαρίου 2025, το τελευταίο μοντέλο Παραγωγικής Τεχνητής Νοημοσύνης της εταιρείας του xAI, το Grok 3 [που περιλαμβάνει ένα chatbot, δύο μοντέλα λογισμού και έναν ψηφιακό βοηθό έρευνας], με τον ισχυρισμό ότι μιμείται τον “ανθρώπινο συλλογισμό”. Τροφοδοτείται από τον υπερυπολογιστή xAI Colossus, με 200.000 μονάδες επεξεργασίας γραφικών [GPU] και έχει προ-εκπαίδευση 1.000.000 ωρών GPU. Βρίσκεται στο Μέμφις και το σύστημα καταναλώνει 18.927.058 λίτρα νερό ημερησίως για ψύξη. Κατασκευάστηκε σε διάστημα λιγότερο από οκτώ μήνες και περιλαμβάνει μεγάλες ενεργειακές εγκαταστάσεις για το ενεργοβόρο ψηφιακό σύστημα. Χρηματοδοτείται από τον πιο πλούσιο ρατσιστή του πλανήτη.

Από ό,τι δείχνουν οι πρώτες εκτιμήσεις, το μοντέλο είναι λίγο καλύτερο από τα ανταγωνιστικά της OpenAI και των Κινέζων σε κάποιες εργασίες, λίγο χειρότερο σε κάποιες άλλες, δηλαδή δεν ανατρέπει ριζικά τις ισορροπίες του ανταγωνισμού με κάποιο αγεφύρωτο τεχνολογικό προβάδισμα, αλλά τις επιταχύνει, μέσω της μαζικής κλιμάκωσης. Σίγουρα έχει πολύ ισχυρή υποστήριξη, οικονομική και πολιτική και σίγουρα έχει μία ισχυρή βάση τροφοδοτών στους χρήστες του X – twitter

Το ζήτημα λοιπόν είναι πως το νέο μοντέλο δίνει την εντύπωση μιας πιο περίπλοκης και ακριβούς νοημοσύνης καθώς η εκτεταμένη χρήση συνθετικών δεδομένων [που παράγονται ψηφιακά] σε σχέση με τα πραγματικά δεδομένα [που προέρχονται από τον φυσικό κόσμο] δημιουργεί περίπλοκες αποκρίσεις κυμαινόμενης ακρίβειας. Έτσι, φαίνεται ότι το μοντέλο επιτυγχάνει υψηλότερα σκορ από τους ανταγωνιστές του σε μαθηματικά προβλήματα και στην παραγωγή λογισμικού κώδικα, όπως στο μαθηματικό τεστ ορόσημων [benchmark] που ονομάζεται AIME 2025 ή σε ορόσημα προγραμματισμού.

Ωστόσο, δεν επιλύει βασικά προβλήματα όπως τις ενδεχόμενες “ψευδαισθήσεις” και δεν είναι εξασφαλισμένη η ακρίβεια των αποκρίσεών του. Όπως παρατηρεί η Amanda Caswell:

“Ενώ οι απαντήσεις είναι γενικά καλά δομημένες και κατατοπιστικές, υπάρχουν τομείς στους οποίους το chatbot θα μπορούσε να βελτιωθεί. Για παράδειγμα, εάν οι χρήστες επιλέξουν να χρησιμοποιήσουν το Grok-3 για ακαδημαϊκούς ή επαγγελματικούς ερευνητικούς σκοπούς, το chatbot εξακολουθεί να χρειάζεται εξακρίβωση των γεγονότων. Έπρεπε να το κάνω αυτό κατά τη διάρκεια αυτού του πειράματος επειδή το Grok δεν παρέθετε πάντα τις πηγές. αν και συχνά αναφέρεται σε μεγάλα ιδρύματα όπως η NASA, δεν παραπέμπει απευθείας σε μια συγκεκριμένη βάση δεδομένων.”

Η Caswell δοκίμασε το Grok 3 με μία σειρά προτροπών που είχαν να κάνουν με επιστημονικές ερωτήσεις, σχετικά με την κλιματική αλλαγή και την κβαντική διεμπλοκή. Πρόκειται για περίπλοκα ζητήματα όπου ενδεχόμενες ανακρίβειες ή παρανοήσεις να απαιτούν εξακρίβωση από ειδικευμένους επιστήμονες και, συνεπώς, αυξάνεται η πιθανότητα διάδοσης και πολλαπλασιασμού της παραπληροφόρησης. Εάν στη συλλογιστική διαδικασία ή την τελική απόκριση της ΤΝ για ένα περίπλοκο επιστημονικό ζήτημα έστω μία πληροφορία είναι ανακριβής ή ψευδής, σαφώς οι συνέπειες μπορεί να είναι μεγάλες, ανάλογα με το βαθμό εμπιστοσύνης που δίνουν οι χρήστες στη μηχανή.

Και η συγκεκριμένη μηχανή είναι επιρρεπής και σε απλά λάθη. Όπως αναφέρει ο καθηγητής Gary Marcus, το Grok 3 απέτυχε να βρει τη σωστή χθεσινή ημερομηνία, παρόλο που αποτελεί διαθέσιμο διαδικτυακά δεδομένο:

Μα, ακόμη σοβαρότερο, αποδεικνύεται ένα λάθος που οφείλεται σε “ψευδαίσθηση” και προέκυψε από μια απλή αναζήτηση πληροφοριών για μια πόλη της Μοντάνα, το Billings. Το σύστημα πληροφόρησε τον χρήστη πως στην πόλη του έγινε μεγάλος, καταστρεπτικός σεισμός στις 10 Φεβρουαρίου 2025. Όταν ο χρήστης, που γνώριζε ότι δεν έγινε σεισμός, ζήτησε διευκρινίσεις, η ΤΝ του απάντησε ότι η 10η Φεβρουαρίου βρίσκεται στο μέλλον και ότι στατιστικά θα μπορούσε να έχει γίνει σεισμός.

Είναι αστείο, διότι στην Μοντάνα δεν χρειάστηκε να ανησυχήσουν. Ας σκεφτούμε όμως κάτι παρόμοιο να συμβαίνει στη χώρα μας, όσον αφορά την τρέχουσα σεισμική δραστηριότητα μεταξύ Σαντορίνης και Αμοργού. Και πράγματι, στα ψηφιακά κοινωνικά δίκτυα κυκλοφόρησε μια ανάλογη παραπληροφόρηση από πρόγραμμα Τεχνητής Νοημοσύνης, το ChatGPT της OpenAI.

Την 11η Φεβρουαρίου 2025, υπήρξαν στο facebook δύο πηγές πληροφόρησης:

1) Επισήμως οι σεισμολόγοι Ευθύμιος Λέκκας, Πρόεδρος του ΟΑΣΠ, και Κώστας Παπαζάχος, εκπρόσωπος των σεισμολογικών επιτροπών, ο Προέδρος του ΤΕΕ Γ. Στασινός και ο διευθύνων σύμβουλος της ΚΤΥΠ Θ. Γιάνναρης, δήλωσαν ότι στο ρήγμα της Ανύδρου η τρέχουσα σεισμική δραστηριότητα δεν επηρεάζει τα δύο ηφαίστεια.

2) Σε ανώνυμο προφίλ στο fb διεξήχθη άλλη έρευνα, με το ChatGPT. Αντιγράφω:

“Σύμφωνα με το ChatGPT, η παραπάνω ανάλυση βασίζεται σε ιστορικά δεδομένα και επιστημονικές αρχές που σχετίζονται με ηφαιστειακή δραστηριότητα, χωρίς να λαμβάνει υπόψη τις εκτιμήσεις των ελληνικών Αρχών. Συμπέρασμα: παρότι το φαινόμενο της Σαντορίνης συνιστά προδήλως εκρηκτική φάση του ηφαιστείου παρά ταύτα η κυβέρνηση δε λαμβάνει μέτρα προληπτικής εκκένωσης.”

Τι λέτε; Θα προτιμούσατε να ληφθούν αυτομάτως μέτρα εκκένωσης βάσει της Τεχνητής Νοημοσύνης ή να συνεχίσουμε να χρηματοδοτούμε την επιστημονική ανθρώπινη νοημοσύνη; Ποιος θα λάβει παρόμοιες αποφάσεις και με τι κίνητρα και ποια πληροφόρηση στο μέλλον;

Σίγουρα αυτά τα αποτελέσματα θα βελτιωθούν, όσο οι χρήστες ανατροφοδοτούν το σύστημα, αλλά μάλλον ο σεισμός που προκάλεσε το Grok 3 στα χρηματιστήρια είναι τεχνητός. Η μαζική κλιμάκωση με τις εκατοντάδες χιλιάδες συνδεδεμένες μονάδες επεξεργασίας δεν φαίνεται να οδηγεί πιο κοντά στην αλήθεια παρά τις εντυπώσεις. Αλλά τι άλλο είναι τα χρηματιστήρια πέρα από ανταγωνισμό εντυπώσεων; Αρκεί η προειδοποίηση για την ανάγκη επαλήθευσης των αποτελεσμάτων της ΤΝ προκειμένου να αποτραπούν οι ανεξέλεγκτες και επιδραστικές πολιτικές χρήσεις της; Το ζήτημα δεν είναι μόνο θέμα αποτελεσματικότητας του συστήματος είναι η επιρροή του συστήματος στις αποτελεσματικές αποφάσεις εκτός του.

Οπότε τα άμεσα αποτελέσματά του Grok 3, πέρα από το βαρύ περιβαλλοντικό αποτύπωμα που αφήνουν οι ενεργοβόρες υποδομές του, είναι η επιτάχυνση και εξαγρίωση του ανταγωνισμού, η διακύμανση των τιμών, η διακύμανση των μετοχών αλλά και η πολιτικοποίηση και απορρύθμιση του ανταγωνισμού, καθώς η πρόσβαση του Μασκ σε ευαίσθητα δεδομένα υπερβαίνει την εμπορική διάθεση.

Η Γενική Τεχνητή Νοημοσύνη [AGI] που υποτίθεται πως πράγματι θα μιμείται τον ανθρώπινο συλλογισμό παραμένει χίμαιρα.