Η Inception, μια νεοσύστατη εταιρεία στο Πάλο Άλτο, που ιδρύθηκε από τον καθηγητή Επιστήμης Υπολογιστών του Stanford, Στεφάνο Έρμον, ισχυρίζεται ότι έχει δημιουργήσει ένα καινοτόμο μοντέλο τεχνητής νοημοσύνης που χρησιμοποιεί τεχνολογία "διάχυσης". Αυτό το καινοτόμο μοντέλο αναφέρεται ως ένα μοντέλο μεγάλης γλώσσας βάσει διάχυσης, ή "DLM" για συντομία. Αυτή τη στιγμή, τα γεννητικά μοντέλα τεχνητής νοημοσύνης που συγκεντρώνουν τη μεγαλύτερη προσοχή μπορούν να κατηγοριοποιηθούν σε δύο κύριους τύπους: μοντέλα μεγάλης γλώσσας (LLMs) και μοντέλα διάχυσης. Τα LLMs, που σχεδιάζονται με αρχιτεκτονική μετασχηματιστή, εξειδικεύονται στην παραγωγή κειμένων. Αντίθετα, τα μοντέλα διάχυσης, η τεχνολογία πίσω από πλατφόρμες ΤΝ όπως η Midjourney και η Sora της OpenAI, επικεντρώνονται κυρίως στη δημιουργία εικόνων, βίντεο και ήχου. Σύμφωνα με την Inception, το μοντέλο της συνδυάζει τις δυνατότητες των συμβατικών LLMs—όπως η παραγωγή κώδικα και η απαντητική διαδικασία—με σημαντικά ενισχυμένη ταχύτητα και χαμηλότερο κόστος υπολογισμού. Ο Έρμον δήλωσε στο TechCrunch ότι έχει μακροχρόνια ερευνήσει την εφαρμογή των μοντέλων διάχυσης στην παραγωγή κειμένου στο εργαστήριο έρευνάς του στο Stanford. Η δουλειά του προήλθε από την παρατήρηση ότι τα παραδοσιακά LLMs λειτουργούν με πιο αργό ρυθμό σε σύγκριση με τις τεχνολογίες διάχυσης. Με τα LLMs, εξήγησε ο Έρμον, “δεν μπορείς να παράγεις τη δεύτερη λέξη μέχρι να παραχθεί η πρώτη, και η τρίτη λέξη δεν μπορεί να παραχθεί μέχρι να ολοκληρωθούν οι πρώτες δύο. ” Αναζητώντας μια προσέγγιση για να εφαρμόσει μηχανισμούς διάχυσης στην παραγωγή κειμένου, ο Έρμον παρατήρησε ότι, σε αντίθεση με τα LLMs που λειτουργούν σειριακά, τα μοντέλα διάχυσης ξεκινούν με μια χονδρική προσέγγιση της εξόδου (για παράδειγμα, μια εικόνα) και επεξεργάζονται τα δεδομένα εκτενώς σε μία μόνο διαδικασία. Ο Έρμον θεωρησε ότι η παραγωγή και η τροποποίηση σημαντικών μπλοκ κειμένου παράλληλα θα μπορούσε να είναι εφικτή χρησιμοποιώντας μοντέλα διάχυσης.
Μετά από αρκετά χρόνια έρευνας, αυτός και ένας από τους φοιτητές του επιτεύχθηκαν μια σημαντική ανακάλυψη, την οποία κατέγραψαν σε μια ερευνητική εργασία που δημοσιεύθηκε πέρυσι. Αναγνωρίζοντας τη δυνατότητα αυτού του επιτεύγματος, ο Έρμον ίδρυσε την Inception το περασμένο καλοκαίρι, φέρνοντας μαζί του πρώην φοιτητές, τον Αδίτγια Γκρόβερ, καθηγητή στο UCLA, και τον Βολοντίμιρ Κουλέσοφ από το Πανεπιστήμιο Κορνέλ για να ηγηθούν από κοινού της επιχείρησης. Ενώ ο Έρμον επέλεξε να μην αποκαλύψει συγκεκριμένες λεπτομέρειες χρηματοδότησης για την Inception, το TechCrunch έχει μάθει ότι το Mayfield Fund είναι ένας από τους επενδυτές της. Η Inception έχει ήδη κλείσει συμβάσεις με διάφορους πελάτες, συμπεριλαμβανομένων ανώνυμων εταιρειών Fortune 100, καλύπτοντας τις επείγουσες απαιτήσεις τους για χαμηλότερη καθυστέρηση ΤΝ και ενισχυμένη ταχύτητα, σύμφωνα με τον Έρμον. “Τα μοντέλα μας μπορούν να εκμεταλλεύονται τα GPUs σημαντικά πιο αποτελεσματικά, ” δήλωσε ο Έρμον, αναφερόμενος στις μονάδες επεξεργασίας γραφικών που χρησιμοποιούνται συνήθως για την εκτέλεση παραγωγικών μοντέλων. “Πιστεύω ότι αυτό είναι μετασχηματιστικό και θα αλλάξει τον τρόπο που αναπτύσσονται τα μοντέλα γλώσσας. ” Η εταιρεία παρέχει API μαζί με επιλογές για εγκατάσταση σε χώρους και συσκευές edge, υποστήριξη βελτίωσης μοντέλων και μια σειρά έτοιμων προς χρήση DLMs προσαρμοσμένων για διάφορες εφαρμογές. Η Inception ισχυρίζεται ότι τα DLMs της μπορούν να λειτουργούν έως και 10 φορές πιο γρήγορα από τα παραδοσιακά LLMs με κόστος επίσης 10 φορές χαμηλότερο. Ένας εκπρόσωπος της εταιρείας ενημέρωσε το TechCrunch, “Το ‘μικρό’ μοντέλο κωδικοποίησής μας ισούται με την απόδοση του [GPT-4o mini της OpenAI] αλλά λειτουργεί με περισσότερη από 10 φορές ταχύτητα. Το ‘mini’ μοντέλο μας ξεπερνά τις μικρές εναλλακτικές ανοιχτού κώδικα όπως το [Llama 3. 1 8B της Meta], επιτυγχάνοντας πάνω από 1. 000 tokens ανά δευτερόλεπτο. ”
Το Επαναστατικό Μοντέλο Τεχνητής Νοημοσύνης του Inception: Μια Συνδυαστική Προσέγγιση της Διασποράς και της Γλωσσικής Τεχνολογίας
Το μάρκετινγκ κατά της Τεχνητής Νοημοσύνης κάποτε φαινόταν σαν μια ιδιωτική διαδικτυακή τάση, αλλά έχει πλέον γίνει καθολική τάση εν μέσω της αντεπίθεσης κατά της AI στη διαφήμιση, σηματοδοτώντας αυθεντικότητα και ανθρώπινη σύνδεση.
Η τεχνολογία Deepfake έχει προχωρήσει ραγδαία τα τελευταία χρόνια, οδηγώντας σε αξιοσημείωτες βελτιώσεις στην παραγωγή εξαιρετικά ρεαλιστικών χειραγωγημένων βίντεο.
Η Microsoft ενισχύει τη δέσμευσή της στην καινοτομία της τεχνητής νοημοσύνης υπό την οραματική ηγεσία του Διευθύνοντος Συμβούλου Satya Nadella.
Τώρα μπορείτε να κάνετε ερωτήσεις πολύ συγκεκριμένες στους μεγάλους γλωσσικούς μονάδες (LLM)—όπως να ζητήσετε υποστήριξηαρχιτεκτονικής μέσα σε μια συγκεκριμένη περιορισμένη περιοχή αγορών—και να λαμβάνετε σαφείς, πλούσιες σε περιεχόμενο απαντήσεις, όπως: «Εδώ είναι τρεις επιλογές κοντά σας που ταιριάζουν στα κριτήριά σας.
Η C3.ai, Inc.
Z.ai, προηγουμένως γνωστή ως Zhipu AI, είναι μια κορυφαία κινεζική τεχνολογική εταιρεία που ειδικεύεται στην τεχνητή νοημοσύνη.
Ο Τζέισον Λέμκιν ηγήθηκε του γύρου χρηματοδότησης αρχικού κεφαλαίου μέσω του SaaStr Fund στην εντυπωσιακή Owner.com, μια πλατφόρμα με τεχνητή νοημοσύνη που μεταμορφώνει τον τρόπο λειτουργίας μικρών εστιατορίων.
Launch your AI-powered team to automate Marketing, Sales & Growth
and get clients on autopilot — from social media and search engines. No ads needed
Begin getting your first leads today