Η Google DeepMind παρουσιάζει το DiffusionGemma: Ένα μοντέλο τεχνητής νοημοσύνης που τρέχει τοπικά με τετραπλάσια ταχύτητα

Η Google DeepMind κυκλοφορεί το DiffusionGemma, ένα επαναστατικό μοντέλο τεχνητής νοημοσύνης που χρησιμοποιεί τεχνική διάχυσης για την παράλληλη παραγωγή κειμένου, προσφέροντας τετραπλάσια ταχύτητα σε συσκευές τοπικής επεξεργασίας και ανοίγοντας νέους ορίζοντες για την αυτόνομη τεχνητή νοημοσύνη.

Το DiffusionGemma αποτελεί μια επαναστατική προσέγγιση στη δημιουργία κειμένου με τεχνητή νοημοσύνη, που απομακρύνεται από τις παραδοσιακές μεθόδους και προσφέρει τετραπλάσια απόδοση σε συσκευές τοπικής επεξεργασίας.

Η βασική καινοτομία του DiffusionGemma έγκειται στην εφαρμογή της τεχνικής διάχυσης (diffusion), γνωστή κυρίως από τη δημιουργία εικόνων, στη παραγωγή κειμένου. Ενώ τα παραδοσιακά μοντέλα τεχνητής νοημοσύνης λειτουργούν αυτοπαλινδρομικά (autoregressive), παράγοντας κείμενο από αριστερά προς τα δεξιά έναν token κάθε φορά, το DiffusionGemma λειτουργεί παράλληλα, παράγοντας ολόκληρα μπλοκ κειμένου ταυτόχρονα.

Αυτή η προσέγγιση μετατοπίζει το σημείο συμφόρησης από το εύρος ζώνης μνήμης στον υπολογιστικό πόρο, επιτρέποντας τη δημιουργία έως και 256 token παράλληλα. Η Google ισχυρίζεται ότι αυτό προσφέρει μετρήσιμη βελτίωση σε μη γραμμικές εργασίες όπως η επεξεργασία εν σχήματι, η μοριακή αλληλουχία και η μαθηματική γραφική παράσταση.

Τεχνικά χαρακτηριστικά και επιδόσεις

Το DiffusionGemma είναι ένα μοντέλο Μείγματος Ειδικών (Mixture of Experts - MoE) με συνολικά 26 δισεκατομμύρια παραμέτρους, από τις οποίες μόνο 3,8 δισεκατομμύρια ενεργοποιούνται κατά τη συμπερασματολογία (inference). Αυτό σημαίνει ότι χωράει στη διαθέσιμη μνήμη RAM 18 GB μιας κορυφαίας GPU.

Σε δοκιμές με κάρτα γραφικών RTX 5090, το DiffusionGemma παράγει περίπου 700 token ανά δευτερόλεπτο. Με έναν επιταχυντή τεχνητής νοημοσύνης Nvidia H100, η απόδοση ξεπερνά τα 1.000+ token ανά δευτερόλεπτο, περίπου τετραπλάσια απόδοση σε σύγκριση με παρόμοια αυτοπαλινδρομικά μοντέλα Gemma.

Εφαρμογές και πρακτικές δυνατότητες

Η παράλληλη επεξεργασία κειμένου κάνει το DiffusionGemma ιδιαίτερα αποτελεσματικό σε εργασίες που απαιτούν αυτοδιόρθωση μεγάλων συνόλων token. Ένα ενδιαφέρον παράδειγμα είναι η επίλυση Σουντόκου, μια εργασία ιδιαίτερα προκλητική για τα παραδοσιακά μοντέλα τεχνητής νοημοσύνης, καθώς κάθε token εξαρτάται από μελλοντικά token.

Το DiffusionGemma διαθέτει τη δυνατότητα συνεχούς αυτοδιόρθωσης μεγάλων συνόλων token, κάτι που κάνει τέτοιου είδους μη γραμμικές εργασίες πιο εύκολες και αποτελεσματικές.

Γιατί η διάχυση δεν χρησιμοποιείται στα κύρια μοντέλα Gemini;

Αν η τεχνική διάχυσης είναι τόσο γρήγορη, τίθεται το ερώτημα γιατί η Google δεν την εφαρμόζει στα μεγάλα μοντέλα Gemini που τρέχουν στο cloud. Η εταιρεία έχει πραγματοποιήσει πειράματα με αυτήν την προσέγγιση, αλλά υπάρχουν ορισμένα μειονεκτήματα:

Υψηλότερο ποσοστό σφαλμάτων: Στα μοντέλα διάχυσης εικόνων, ένα εσφαλμένα προβλεπόμενο pixel δεν καταστρέφει την εικόνα. Στο κείμενο όμως, ένα αντίστοιχο σφάλμα μπορεί να κάνει ένα μπλοκ token ανούσιο και να απαιτήσει επανεκκίνηση της διαδικασίας.
Αποδοτικότητα σε σύντομα αποτελέσματα: Τα μοντέλα διάχυσης σπαταλούν πόρους όταν το επιθυμητό αποτέλεσμα είναι μόνο λίγα token, καθώς πρέπει να εκτελέσουν πολλή περισσότερη παράλληλη εργασία για να φτάσουν σε, ας πούμε, πέντε token.

Εξοικονόμηση πόρων και βελτιστοποίηση

Το κέρδος στην αποδοτικότητα για τοπική επεξεργασία κάνει αυτήν την προσέγγιση ιδιαίτερα ελκυστική για πειραματισμό. Στο cloud, τα αυτοπαλινδρομικά μοντέλα μπορούν να ομαδοποιήσουν μεγάλο αριθμό υπολογιστικών εργασιών από πολλούς χρήστες, ενώ η υψηλής ταχύτητας μνήμη (HBM) που χρησιμοποιείται σε τέτοια συστήματα μπορεί να μετακινήσει δεδομένα πολύ πιο αποτελεσματικά.

Αντίθετα, η τοπική τεχνητή νοημοσύνη αντιμετωπίζει σπατάλη υπολογιστικών κύκλων λόγω χαμηλότερου εύρους ζώνης μνήμης και χρόνου αδράνειας. Τα μοντέλα διάχυσης μπορούν να κάνουν πιο αποτελεσματική χρήση του διαθέσιμου υπολογιστικού δυναμικού.

Πρόσφατα, η Google άρχισε επίσης να εφαρμόζει προγνωστικά συστήματα πολλαπλών token (Multi-Token Prediction - MTP), που χρησιμοποιούν υπολογιστικούς κύκλους που διαφορετικά θα χαραμίζονταν για να προβλέψουν πιθανά token και να αυξήσουν την ταχύτητα. Ωστόσο, η τεχνική διάχυσης αποδεικνύεται ακόμα πιο γρήγορη από τις εκδόσεις MTP του Gemma.

Το μέλλον της τοπικής τεχνητής νοημοσύνης

Η κυκλοφορία του DiffusionGemma σηματοδοτεί ένα σημαντικό βήμα προς την εκτέλεση ισχυρών βοηθών τεχνητής νοημοσύνης απευθείας σε συσκευές καταναλωτών, χωρίς εξαρτήσεις από το cloud. Αυτό ανοίγει νέους ορίζοντες για:

Αυτόνομες εφαρμογές τεχνητής νοημοσύνης
Βελτιωμένη απόκριση σε πραγματικό χρόνο
Μειωμένη εξάρτηση από τη σύνδεση δικτύου
Ενισχυμένη ιδιωτικότητα και ασφάλεια δεδομένων

Το DiffusionGemma είναι διαθέσιμο ως ανοιχτού κώδικα μοντέλο, στηριζόμενο στην οικογένεια Gemma 4, και προσφέρει μια πειστική απόδειξη ότι η παράλληλη επεξεργασία κειμένου μέσω τεχνικών διάχυσης μπορεί να επαναπροσδιορίσει το τοπίο της τοπικής τεχνητής νοημοσύνης.

Κατεβάστε το Toggle app

Η Google DeepMind παρουσιάζει το DiffusionGemma: Ένα μοντέλο τεχνητής νοημοσύνης που τρέχει τοπικά με τετραπλάσια ταχύτητα

Share this article

Toggle Tech Team