lang icon En
April 19, 2025, 3:56 p.m.
2158

Οι ερευνητές του MIT αναπτύσσουν αποτελεσματική μέθοδο για δημιουργία κωδικών χωρίς σφάλματα με χρήση μεγάλων γλωσσικών μοντέλων

Brief news summary

Οι ερευνητές του MIT και συνεργαζόμενοι φορείς ανέπτυξαν μια καινοτόμο μέθοδο για την βελτίωση των μεγάλων γλωσσικών μοντέλων (LLMs) στη δημιουργία σφαλμάτων χωρίς, δομικά έγκυρου κώδικα και συμβολικών εξόδων. Σε αντίθεση με τις παραδοσιακές τεχνικές που ελέγχουν τα αποτελέσματα αφού ολοκληρωθούν —κινδυνεύοντας με σπατάλη υπολογιστικής ισχύος— ή ελέγχουν σταδιακά, αλλά ενδέχεται να διαστρεβλώσουν τα προοριζόμενα νοήματα, αυτή η προσέγγιση χρησιμοποιεί μεθόδους διαδοχικού Monte Carlo για πιθανοκρατική καθοδήγηση των LLMs προς την παραγωγή μερικών εξόδων που είναι και συντακτικά σωστά και σημασιολογικά ουσιαστικά. Αυτή η δυναμική καθοδήγηση βελτιώνει την αποδοτικότητα, επιτρέποντας σε μικρότερα LLMs να υπερέχουν μεγαλύτερων σε εργασίες όπως ο προγραμματισμός σε Python, η δημιουργία ερωτημάτων SQL, ο σχεδιασμός μορίων και ο ρομποτικός προγραμματισμός. Σημαντικά, η μέθοδος ενσωματώνει γνώσεις εμπειρογνωμόνων χωρίς να απαιτεί επαναεκπαίδευση του μοντέλου. Πέρα από τον κώδικα, δίνει τη δυνατότητα σε μη ειδικούς να εμπλακούν φυσικά με την τεχνητή νοημοσύνη σε πολύπλοκα ερωτήματα, ανάλυση δεδομένων και επιστημονική ανακάλυψη, διασφαλίζοντας ότι τα αποτελέσματα που παράγονται από την AI είναι έγκυρα και ουσιαστικά. Με επικεφαλής τον João Loula, Benjamin LeBrun και Li Du, η έρευνα θα παρουσιαστεί στο Διεθνές Συνέδριο για τις Αναπαραστάσεις της Μάθησης, με υποστήριξη από το MIT Quest for Intelligence και το πρόγραμμα Καναδικών Chairs για την Τεχνητή Νοημοσύνη CIFAR.

Οι προγραμματιστές μπορούν να χρησιμοποιήσουν μεγάλα γλωσσικά μοντέλα (LLMs) για να παράγουν κώδικα υπολογιστών πιο γρήγορα, αλλά αυτό ωφελεί μόνο εάν ο κώδικας συμμορφώνεται με τους κανόνες της γλώσσας προγραμματισμού και τρέχει χωρίς σφάλματα. Οι υπάρχοντες τρόποι να διασφαλιστεί ότι ο κώδικας που δημιουργείται από LLM ακολουθεί τους κανόνες της γλώσσας συχνά αλλοιώνουν την προϋπάρχουσα νοηματική τους ή είναι πολύ αργοί για πολύπλοκες εργασίες. Ερευνητές από το MIT και άλλα ιδρύματα ανέπτυξαν μια νέα προσέγγιση που καθοδηγεί αυτόματα ένα LLM να παράγει κείμενο χωρίς σφάλματα και σύμφωνα με τους κανόνες, όπως κώδικα σε μια συγκεκριμένη γλώσσα προγραμματισμού. Η μέθοδός τους κατανέμει πιθανά στατιστικά μεγαλύτερη προσπάθεια σε outputs που έχουν μεγαλύτερες πιθανότητες να είναι έγκυρα και ακριβή, απορρίπτοντας τα λιγότερο ελπιδοφόρα νωρίς, βελτιώνοντας έτσι την υπολογιστική αποδοτικότητα. Χάρη σε αυτά τα οφέλη στην αποδοτικότητα, η αρχιτεκτονική των ερευνητών επέτρεψε σε μικρότερα LLM να ξεπεράσουν πολύ μεγαλύτερα μοντέλα στην παραγωγή ακριβών, καλά δομημένων outputs σε εφαρμογές πραγματικού κόσμου όπως η μοριακή βιολογία και η ρομποτική. Μελλοντικά, αυτή η προσέγγιση θα μπορούσε να δώσει τη δυνατότητα και σε μη ειδικούς να ελέγχουν περιεχόμενο που παράγει η ΤΝ, π. χ. , επιχειρηματίες να γράφουν πολύπλοκες ερωτήσεις σε βάσεις δεδομένων SQL απλά χρησιμοποιώντας φυσική γλώσσα. Ο João Loula, μεταπτυχιακός φοιτητής στο MIT και συν-συγγραφέας, σημειώνει: «Αυτή η εργασία έχει επιπτώσεις πέραν της έρευνας. Μπορεί να βελτιώσει βοηθούς προγραμματισμού, αναλύσεις δεδομένων με τεχνητή νοημοσύνη και εργαλεία επιστημονικής ανακάλυψης, διασφαλίζοντας ότι τα outputs της AI παραμένουν χρήσιμα και σωστά». Η διεθνής ομάδα περιλαμβάνει επίσης τους συν-συγγραφείς Benjamin LeBrun (Mila), Li Du (Johns Hopkins), και τους επικεφαλής επιστήμονες Vikash Mansinghka (MIT), Alexander K. Lew (Yale), Tim Vieira (ETH Zurich), και Timothy J. O’Donnell (McGill/Mila), μεταξύ άλλων. Η έρευνά τους θα παρουσιαστεί στο Διεθνές Συνέδριο για τις Παραστάσεις Μάθησης. **Επιβολή Δομής και Νόηματος** Μια κοινή μέθοδος ελέγχου της δομής και του νοήματος μέσω παραγωγής κειμένου περιλαμβάνει τη διασταύρωση ολόκληρου του output (π. χ. , κώδικα) για εγκυρότητα· αν αποτύχει, ο χρήστης πρέπει να ξεκινήσει ξανά, αυξάνοντας το κόστος των υπολογισμών.

Εναλλακτικά, μπορεί να ελεγχθεί τμηματικά, αλλά η διόρθωσή του βήμα-βήμα κινδυνεύει να απομακρυνθεί από την αρχική πρόθεση, μειώνοντας την ακρίβεια. «Είναι πιο εύκολο να επιβάλεις δομή παρά νόημα», εξηγεί ο Loula. «Μπορούμε γρήγορα να ελέγξουμε αν το output ακολουθεί μια γλώσσα προγραμματισμού, ενώ η επικύρωση του νοήματος απαιτεί την εκτέλεση του κώδικα. Η εργασία μας αντιμετωπίζει και τα δύο είδη πληροφορίας». Οι ερευνητές ενσωματώνουν εξειδικευμένες γνώσεις στο LLM ώστε να το κατευθύνουν προς outputs που έχουν μεγαλύτερες πιθανότητες να πληρούν δομικούς περιορισμούς και να αντανακλούν το επιθυμητό νόημα. «Δεν εκπαιδεύουμε εκ νέου το LLM, αλλά σχεδιάζουμε γνώσεις ειδικών σε συνδυασμό με τη υπάρχουσα γνώση του LLM», λέει ο Mansinghka, συγκρίνοντας τη μεθοδολογία τους με τις παραδοσιακές τεχνικές κλιμάκωσης βαθιάς μάθησης. Χρησιμοποιούν τεχνικές με ακολουθίες Monte Carlo, που επιτρέπουν πολλαπλές παράλληλες γενιές από το LLM να ανταγωνίζονται. Οι outputs λαμβάνουν βάρη που ποσοτικοποιούν την πιθανότητα δομικής και σημασιολογικής ορθότητας· το μοντέλο εστιάζει στις υψηλότερα ζυγισμένες εξόδους, απορρίπτοντας τις άλλες σταδιακά. Ουσιαστικά, το LLM συνεργάζεται με ένανExpert που επιβλέπει τις επιλογές του, διασφαλίζοντας τη συμμόρφωσή του με το δομημένο και νοηματικό πλαίσιο που έχει καθοριστεί από τον χρήστη, με καθοδήγηση από διαδικασίες επαλήθευσης που ορίζει ο χρήστης. «Αναπτύξαμε τα μαθηματικά ώστε, υπό οποιουσδήποτε περιορισμούς, να επιτυγχάνεται σωστή ζύγιση, διασφαλίζοντας ότι τα τελικά outputs είναι σωστά», προσθέτει ο Loula. **Ενδυνάμωση Μικρότερων Μοντέλων** Δοκιμάζοντας το πλαίσιο σε εργασίες όπως ο προγραμματισμός σε Python, η δημιουργία ερωτήσεων σε SQL, ο σχεδιασμός μοριακών δομών και ο προγραμματισμός ρομπότ, η μέθοδος αποδείχθηκε πιο ακριβής και υπολογιστικά αποδοτική από τις υπάρχουσες τεχνικές. Για παράδειγμα, ένα μικρό ανοιχτού κώδικα μοντέλο Python ξεπέρασε ένα εμπορικό μοντέλο περισσότερο από διπλάσιο μεγέθους. «Είμαστε ενθουσιασμένοι που βοηθάμε μικρά μοντέλα να υπερέχουν του βάρους τους», σχολιάζει ο Loula. Μελλοντικά, οι ερευνητές στοχεύουν στο να ελέγχουν μεγαλύτερα τμήματα του παραγόμενου κειμένου, αντί για μικρά κομμάτια, και στη συνολική μάθηση ώστε να βελτιώνονται στην ακρίβεια μέσω αυτού του καθοδηγούμενου ελέγχου εξόδου. Η προσέγγισή τους έχει τη δυναμική να βοηθήσει χρήστες που δεν έχουν τεχνική κατάρτιση, σε συνδυασμό με αυτοματοποιημένα μοντέλα δεδομένων και ερωτήματα που παράγουν βάσεις δεδομένων. Ο Mansinghka οραματίζεται την ανάλυση δεδομένων με βοήθεια μηχανής, όπου οι χρήστες διαλόγου με λογισμικό που μοντελοποιεί με ακρίβεια το νόημα των δεδομένων και των ερωτημάτων τους. Ο O’Donnell προσθέτει: «Η αποτύπωση λέξεων σε κατανομές πάνω σε συγκεκριμένα νοήματα σε στενά συμβολικά πεδία αποτελεί ένα μικρό αλλά σημαντικό βήμα προς την αντιμετώπιση πιο βαθιών γλωσσικών και γνωστικών προκλήσεων σχετικά με το πώς οι μηχανές επικοινωνούν για τον κόσμο». Αυτή η έρευνα υποστηρίζεται εν μέρει από το Πρόγραμμα AI Chairs του Καναδά CIFAR, το MIT Quest for Intelligence και την Convergent Research.


Watch video about

Οι ερευνητές του MIT αναπτύσσουν αποτελεσματική μέθοδο για δημιουργία κωδικών χωρίς σφάλματα με χρήση μεγάλων γλωσσικών μοντέλων

Try our premium solution and start getting clients — at no cost to you

I'm your Content Creator.
Let’s make a post or video and publish it on any social media — ready?

Language

Hot news

Dec. 23, 2025, 1:26 p.m.

15 Τρόποι που άλλαξε η Πώληση φέτος στην εποχή τη…

Τις τελευταίες 18 μήνες, η Ομάδα SaaStr έχει εμβαθύνει στην τεχνητή νοημοσύνη και τις πωλήσεις, με μια σημαντική επιτάχυνση να ξεκινάει από τον Ιούνιο του 2025.

Dec. 23, 2025, 1:23 p.m.

GPT-5 της OpenAI: Όσα Ξέρουμε Μέχρι Τώρα

Η OpenAI ετοιμάζεται να κυκλοφορήσει το GPT-5, την επόμενη μεγάλη εξέλιξη στη σειρά των μεγάλων μοντέλων γλώσσας, με την κυκλοφορία να αναμένεται στις αρχές του 2026.

Dec. 23, 2025, 1:20 p.m.

Τεχνητή Νοημοσύνη στο SEO: Μετασχηματισμός της Δη…

Τεχνητή νοημοσύνη (ΤΝ) διαμορφώνει ταχύτατα τον τομέα της δημιουργίας και βελτιστοποίησης περιεχομένου στον τομέα του βελτιστοποίησης μηχανών αναζήτησης (SEO).

Dec. 23, 2025, 1:20 p.m.

Οι λύσεις βιντεοδιάσκεψης με τεχνητή νοημοσύνη βε…

Η μετάβαση στην απομακρυσμένη εργασία έχει επισημάνει την κρίσιμη ανάγκη για αποτελεσματικά εργαλεία επικοινωνίας, οδηγώντας στην ανάπτυξη λύσεων βίντεο-διάσκεψης με τεχνητή νοημοσύνη που επιτρέπουν αδιάλειπτη συνεργασία σε αποστάσεις.

Dec. 23, 2025, 1:17 p.m.

Αγορά Τεχνητής Νοημοσύνης στην Ιατρική: Μέγεθος, …

Επισκόπηση Η Παγκόσμια Αγορά Τεχνητής Νοημοσύνης στην Ιατρική αναμένεται να φτάσει περίπου τα 156,8 δισεκατομμύρια δολάρια ΗΠΑ μέχρι το 2033, από 13,7 δισεκατομμύρια δολάρια το 2023, με ισχυρό ετήσιο ρυθμό ανάπτυξης (CAGR) 27,6% από το 2024 έως το 2033

Dec. 23, 2025, 9:30 a.m.

Ο Danny Sullivan της Google και ο John Mueller σχ…

Ο Τζον Μούλερ από την Google φιλοξένησε τον Ντάνι Σάλβιν, επίσης από την Google, στο podcast Search Off the Record για να συζητήσουν »Ιδέες για το SEO και το SEO για την ΤΝ«.

Dec. 23, 2025, 9:26 a.m.

Η Lexus δοκιμάζει την γενετική Τεχνητή Νοημοσύνη …

Σύντομη Εισαγωγή: Η Lexus ξεκίνησε μια εορταστική διαφημιστική καμπάνια που δημιουργήθηκε με χρήση γενετικής τεχνητής νοημοσύνης, σύμφωνα με δελτίο Τύπου

All news

AI Company

Launch your AI-powered team to automate Marketing, Sales & Growth

and get clients on autopilot — from social media and search engines. No ads needed

Begin getting your first leads today