Η General Intuition, μια startup που εκπαιδεύει τεχνητή νοημοσύνη μέσα από βιντεοπαιχνίδια, συγκέντρωσε 320 εκατομμύρια δολάρια σε νέο γύρο χρηματοδότησης, με την αποτίμησή της να φτάνει τα 2,3 δισεκατομμύρια δολάρια. Η επένδυση επιβεβαιώνει τα προηγούμενα ρεπορτάζ του TechCrunch και ανεβάζει τη συνολική χρηματοδότηση της εταιρείας στα 454 εκατομμύρια δολάρια.
Ο γύρος ηγήθηκε από την Khosla Ventures, με συμμετοχή των General Catalyst, Jeff Bezos, Eric Schmidt, Nico Rosberg, καθώς και ερευνητών από τα Google DeepMind και MIT. Το μεγαλύτερο μέρος των κεφαλαίων θα διατεθεί για την επέκταση της υπολογιστικής ισχύος, με τη General Intuition να έχει ήδη συμφωνία με την CoreWeave.
Από τα παιχνίδια στον πραγματικό κόσμο
Η General Intuition προήλθε από την Medal, την εταιρεία του CEO Pim de Witte που επιτρέπει στους παίκτες να ανεβάζουν και να μοιράζονται στιγμιότυπα από παιχνίδια. Οι εκατοντάδες εκατομμύρια ώρες gameplay που συγκεντρώθηκαν αποτέλεσαν το αρχικό σύνολο δεδομένων για την εκπαίδευση του μοντέλου της εταιρείας στη χωροχρονική συλλογιστική — την κατανόηση του πώς να κινείται κανείς στον χώρο και τον χρόνο.
Ωστόσο, το κρίσιμο συστατικό δεν ήταν τα ίδια τα πλάνα του παιχνιδιού, αλλά οι ετικέτες δράσης που ήταν ενσωματωμένες σε αυτά: αρχεία που καταγράφουν ακριβώς ποια κουμπιά πάτησε ένας παίκτης και πότε. Οι περισσότεροι ανταγωνιστές, σύμφωνα με τον de Witte, προσπαθούν να εξάγουν δράσεις από το βίντεο μόνο, κάτι που θεωρεί ανεπαρκές.
«Το βλέπουμε ως το επόμενο στάδιο της μελλοντικής προεκπαίδευσης», δήλωσε ο de Witte. «Έχουμε ένα ενιαίο μοντέλο που μπορεί να ανταποκριθεί σε πληροφορίες από το Fortnite στην οθόνη και να αναλάβει δράση, αλλά και σε δυναμικές του πραγματικού κόσμου με τρόπο που ένα LLM δεν θα μπορούσε ποτέ».
Το ίδιο «μυαλό» για παιχνίδια και ρομπότ
Κατά τη διάρκεια της επίσκεψης του TechCrunch στα γραφεία της εταιρείας στη Νέα Υόρκη, ο de Witte έδειξε πώς το ίδιο μοντέλο ΤΝ που έπαιζε Fortnite επί 100 συνεχόμενες ώρες τροφοδοτούσε ταυτόχρονα ένα τετράποδο ρομπότ που κινούνταν στον χώρο. Χρειάστηκαν μόλις οκτώ λεπτά δεδομένων από τον πραγματικό κόσμο για να προσαρμοστεί το μοντέλο ΤΝ στο ρομπότ.
Η στρατηγική της General Intuition βασίζεται στη δημιουργία ενός «παγκόσμιου μοντέλου» (world model) — ενός προσομοιωμένου περιβάλλοντος που παράγεται καρέ-καρέ και χρησιμεύει ως χώρος εκπαίδευσης. Από εκατομμύρια ώρες gameplay, το μοντέλο έμαθε ότι οι τοίχοι είναι τοίχοι, οι σκάλες είναι για αναρρίχηση και οι σκιές μακραίνουν καθώς κινείται ο ήλιος.
Ηθική και αποστολή
Ο de Witte έχει χαράξει μια σαφή γραμμή για το πώς θα χρησιμοποιηθεί η τεχνολογία της General Intuition: Κανένας πράκτορας ΤΝ δεν θα χρησιμοποιηθεί για να βλάψει ανθρώπους. Ο περιορισμός αυτός στη στρατιωτική χρήση έρχεται σε μια περίοδο που η Silicon Valley στρέφεται όλο και περισσότερο προς την πολεμική βιομηχανία.
Παράλληλα, η εταιρεία λάνσαρε την πλατφόρμα Nerve, μια αγορά εργασίας που επιτρέπει στους παίκτες να κερδίζουν χρήματα χρησιμοποιώντας τον υπάρχοντα εξοπλισμό τους. Οι χρήστες ξεκινούν με σήμανση δεδομένων και μπορούν σταδιακά να προχωρήσουν σε τηλεχειρισμό ρομπότ και άλλες εργασίες.
«Δεν πρόκειται να φτιάξουμε μια εταιρεία αυτοοδηγούμενων αυτοκινήτων», είπε ο de Witte. «Θα κάνουμε δέκα φορές πιο εύκολο για τον επόμενο να φτιάξει μια εταιρεία αυτοοδηγούμενων αυτοκινήτων».
Ο Vinod Khosla, ο οποίος ηγήθηκε του γύρου, δήλωσε ότι τα ιδιόκτητα δεδομένα της General Intuition είναι αυτά που την έφεραν ως εδώ. «Αν κοιτάξετε τα LLM, όταν εμφανίστηκε η συλλογιστική, ήταν ένα κβαντικό άλμα», είπε ο Khosla. «Στα world models, νομίζω ότι το κβαντικό άλμα είναι η εμφάνιση της διαίσθησης στην ΤΝ, μιας ικανότητας που μοιάζει με ανθρώπινη διαίσθηση. Τα δεδομένα ανθρώπινης δράσης και αντίδρασης που έχουμε στα παιχνίδια είναι το κλειδί για την εμφάνιση της διαίσθησης».