lang icon En
May 10, 2025, 5:50 p.m.
4317

Οι AI Chatbots αντιμετωπίζουν διαρθρωτικά προβλήματα πλάνης που επηρεάζουν την αξιοπιστία τους

Brief news summary

Οι πρόσφατες εξελίξεις στους AI chatbots από εταιρείες όπως η OpenAI και η Google, που επικεντρώνονται στη βελτίωση της λογικής και της ακρίβειας, έχουν παράδοξα αυξήσει τα περιστατικά αυταπάτης—καταστάσεις όπου τα μοντέλα παράγουν ψευδείς ή παραπλανητικές πληροφορίες και αποτυγχάνουν να ακολουθήσουν σωστά τις οδηγίες. Για παράδειγμα, τα νεότερα μοντέλα της OpenAI, o3 και o4-mini, εμφανίζουν ποσοστά αυταπάτης 33% και 48%, σε σύγκριση με 16% για το παλαιότερο μοντέλο o1, με παρόμοιες τάσεις στα μοντέλα όπως το DeepSeek-R1. Παρόλες αυτές τις προκλήσεις, η OpenAI δηλώνει ότι τα συστατικά της λογικής δεν ευθύνονται και συνεχίζει να εργάζεται για τη μείωση των αυταπατών. Το ζήτημα αυτό είναι ιδιαίτερα κρίσιμο σε πεδία όπως η έρευνα, η νομική συμβουλευτική και η εξυπηρέτηση πελατών, όπου οι ανακριβείς πληροφορίες μπορούν να έχουν σοβαρές συνέπειες. Οι αξιολογήσεις από τη Vectara δείχνουν ελάχιστες διαφορές στη συχνότητα αυταπάτης ανάμεσα σε μοντέλα που βασίζονται στη λογική και σε εκείνα που δεν έχουν τέτοια δομή, αν και τα δεδομένα παραμένουν περιορισμένα. Οι ειδικοί προειδοποιούν ότι ο όρος «αυταπάτη» απλοποιεί υπερβολικά πολύπλοκα προβλήματα που αντιμετωπίζουν εξάρτηση από παρωχημένα ή αναξιόπιστα δεδομένα. Λόγω των συνεχών ανακριβειών, κάποιοι προτείνουν τον περιορισμό της χρήσης AI chatbots σε σενάρια όπου η επαλήθευση των πληροφοριών είναι απλούστερη από την αυτόνομη επιβεβαίωση δεδομένων. Συνολικά, οι αυταπάτες παραμένουν ένα μεγάλο άλυτο πρόβλημα στους γλωσσικούς μοντέλους τεχνητής νοημοσύνης.

Οι AI chatbots κορυφαίων εταιρειών τεχνολογίας όπως η OpenAI και η Google έχουν δεχθεί πρόσφατα βελτιώσεις στη λογική τους, προκειμένου να ενισχύσουν την αξιοπιστία των απαντήσεών τους. Ωστόσο, πρόσφατες δοκιμές αποκαλύπτουν ότι ορισμένα νεότερα μοντέλα παρουσιάζουν χειρότερη απόδοση σε σύγκριση με προηγούμενες εκδοχές, εμφανίζοντας το φαινόμενο που ονομάζεται «παραληρηματικές αντιδράσεις» — σφάλματα όπου τα chatbots παράγουν ψευδείς πληροφορίες ή δίνουν απαντήσεις που είναι τεκμηριωμένα σωστές αλλά άσχετες ή μη σύμφωνες με τις οδηγίες. Το ζήτημα αυτό παραμένει από την αρχή των μεγάλων γλωσσικών μοντέλων (LLMs), όπως το ChatGPT της OpenAI και το Gemini της Google, και φαίνεται απίθανο να λυθεί πλήρως. Ένα τεχνικό δελτίο της OpenAI έδειξε ότι τα μοντέλα o3 και o4-mini, που κυκλοφόρησαν τον Απρίλιο, είχαν σημαντικά υψηλότερα ποσοστά παραληρηματικών αντιδράσεων σε σύγκριση με το παλαιότερο o1, το οποίο κυκλοφόρησε στα τέλη του 2024: το o3 είχε ποσοστό 33%, το o4-mini 48%, ενώ το o1 είχε 16%, όταν συνοψίζανε δημοσίως διαθέσιμα δεδομένα. Ομοίως, η κατάταξη της Vectara στην κορυφαία λίστα που παρακολουθεί τα ποσοστά παραληρημάτων διαπίστωσε ότι μερικά μοντέλα λογικής — συμπεριλαμβανομένου και του DeepSeek-R1 — παρουσίασαν σημαντικές αυξήσεις στα παραληρηματικά φαινόμενα σε σχέση με τις προγενέστερες εκδόσεις, παρά το ότι χρησιμοποιούν πολύβημα λογική προτού δώσουν απάντηση. Η OpenAI υποστηρίζει ότι οι διαδικασίες λογικής δεν είναι εγγενώς υπεύθυνες για την αύξηση των παραληρημάτων και δραστηριοποιείται στην έρευνα για τον τρόπο μείωσης αυτών των φαινομένων σε όλα τα μοντέλα. Η διατήρηση των παραληρημάτων απειλεί διάφορες εφαρμογές: μοντέλα που συχνά παράγουν ψευδή στοιχεία εμποδίζουν την έρευνα και την υποστήριξη, νομικοί βοηθοί bot που παραθέτουν ανύπαρκτες υποθέσεις ενέχουν κινδύνους νομικών λαθών, και τα bots εξυπηρέτησης πελατών με παρωχημένες πληροφορίες προκαλούν λειτουργικά προβλήματα. Αρχικά, οι εταιρείες τεχνητής νοημοσύνης ανέμεναν ότι τα παραληρηματικά φαινόμενα θα μειώνονταν με τον χρόνο, καθώς οι πρώτες ενημερώσεις των μοντέλων έδειχναν βελτιώσεις. Ωστόσο, τα τελευταία υψηλότερα επίπεδα παραληρημάτων ακυρώνουν αυτή την προσδοκία, ανεξαρτήτως της λογικής εμπλοκής. Η κατάταξη της Vectara δείχνει ότι τα ποσοστά παραληρημάτων είναι περίπου ίδια σε μοντέλα με λογική και χωρίς λογική από την OpenAI και τη Google, αν και οι ακριβείς αριθμοί είναι λιγότερο σημαντικοί από τις σχετικές θέσεις στην κατάταξη.

H Google αρνήθηκε να σχολιάσει. Ωστόσο, τέτοιες κατατάξεις έχουν περιορισμούς. Αναμειγνύουν διαφορετικούς τύπους παραληρημάτων: για παράδειγμα, το ποσοστό 14, 3% του DeepSeek-R1 αποτελείται κυρίως από «αθώες» περιπτώσεις — απαντήσεις λογικά ορθές και τεκμηριωμένες αλλά που λείπουν από το πηγαίο κείμενο. Επιπλέον, η αξιολόγηση αποκλειστικά με βάση την περίληψη κειμένου δεν αντικατοπτρίζει απαραίτητα τη συχνότητα παραληρημάτων σε άλλες εργασίες, καθώς τα LLMs δεν έχουν σχεδιαστεί ειδικά για περίληψη. Η Emily Bender από το Πανεπιστήμιο της Ουάσιγκτον επισημαίνει ότι αυτά τα μοντέλα προβλέπουν πιθανά επόμενα λόγια, αντί να επεξεργάζονται πληροφορίες για να κατανοούν πραγματικά το κείμενο, καθιστώντας τον όρο «παραληρηματικό» τόσο παραπλανητικό όσο και ανθρωπομορφικό. Η Bender επικρίνει τον όρο «παραληρηματικό» καθώς υπονοεί ότι τα σφάλματα είναι ανωμαλίες σε συστήματα γενικά αξιόπιστα και αποδίδει ανθρώπινη αντίληψη στην AI, που δεν «αισθάνεται» με κανέναν τρόπο. Ο Arvind Narayanan του Πανεπιστημίου Princeton προσθέτει ότι τα μοντέλα κάνουν λάθη επίσης επειδή βασίζονται σε αναξιόπιστα ή ξεπερασμένα δεδομένα, και το να προσθέσεις απλώς περισσότερα δεδομένα εκπαίδευσης ή υπολογιστική ισχύ δεν έχει λύσει αυτά τα προβλήματα. Κατά συνέπεια, η δυσκολία στην κατασκευή AI με ελάχιστα σφάλματα μπορεί να είναι μόνιμη πραγματικότητα. Ο Narayanan προτείνει να χρησιμοποιούνται τέτοια μοντέλα μόνο όταν η επαλήθευση γεγονότων είναι πιο γρήγορη από την πρωτότυπη έρευνα, ενώ η Bender συνιστά να αποφεύγεται η εξάρτηση από AI chatbots για επαληθεύσιμες πληροφορίες.


Watch video about

Οι AI Chatbots αντιμετωπίζουν διαρθρωτικά προβλήματα πλάνης που επηρεάζουν την αξιοπιστία τους

Try our premium solution and start getting clients — at no cost to you

I'm your Content Creator.
Let’s make a post or video and publish it on any social media — ready?

Language

Hot news

Dec. 12, 2025, 1:42 p.m.

Η Disney στέλνει προειδοποίηση για παύση και αποχ…

Η Εταιρεία Disney έχει ξεκινήσει μια σημαντική νομική ενέργεια εναντίον της Google, εκδίδοντας μια επιστολή διακοπής και αποχής, κατηγορώντας το τεχνολογικό γίγαντα ότι παραβίασε το περιεχόμενο προστατευόμενων πνευματικών δικαιωμάτων της Disney κατά τη διάρκεια της εκπαίδευσης και ανάπτυξης γενετικών μοντέλων τεχνητής νοημοσύνης (AI) χωρίς να παρέχει αποζημίωση.

Dec. 12, 2025, 1:35 p.m.

Τεχνητή Νοημοσύνη και το Μέλλον της Βελτιστοποίησ…

Καθώς η τεχνητή νοημοσύνη (AI) προχωρά και ολοένα και περισσότερο ενσωματώνεται στο ψηφιακό μάρκετινγκ, η επιρροή της στη βελτιστοποίηση μηχανών αναζήτησης (SEO) γίνεται ιδιαίτερα σημαντική.

Dec. 12, 2025, 1:33 p.m.

Τεχνητή Νοημοσύνη: MiniMax και Zhipu AI Σχέδιο γι…

Η MiniMax και η Zhipu AI, δύο κορυφαίες εταιρείες τεχνητής νοημοσύνης, ετοιμάζονται σύμφωνα με αναφορές να προχωρήσουν στο χρηματιστήριο του Χονγκ Κονγκ ήδη από τον Ιανουάριο του επόμενου έτους.

Dec. 12, 2025, 1:31 p.m.

Η OpenAI διορίζει τη Διευθύνουσα Σύμβουλο της Sla…

Η Ντενίζ Ντάσερ, Διευθύνουσα Σύμβουλος της Slack, πρόκειται να παραιτηθεί από τη θέση της για να αναλάβει Διευθύνουσα Σύμβουλος Εσόδων στην OpenAI, την εταιρεία πίσω από το ChatGPT.

Dec. 12, 2025, 1:30 p.m.

Τεχνικές Σύνθεσης Βίντεο με Τεχνητή Νοημοσύνη βελ…

Ο κινηματογραφικός κλάδος βιώνει μια σημαντική μεταμόρφωση καθώς τα στούντιο ολοένα και περισσότερο ενσωματώνουν τεχνικές σύνθεσης βίντεο τεχνητής νοημοσύνης (ΑΙ) για να βελτιώσουν τις ροές εργασίας μεταπαραγωγής.

Dec. 12, 2025, 1:24 p.m.

19 καλύτερα εργαλεία τεχνητής νοημοσύνης για τα κ…

Η Τεχνητή Νοημοσύνη (ΤΝ) αναμορφώνει το μάρκετινγκ στα μέσα κοινωνικής δικτύωσης προσφέροντας εργαλεία που απλοποιούν και βελτιώνουν την αλληλεπίδραση με το κοινό.

Dec. 12, 2025, 9:42 a.m.

AI Influencers στα Κοινωνικά Δίκτυα: Ευκαιρίες κα…

Η εμφάνιση influencerς που παράγονται από τεχνητή νοημοσύνη στα μέσα κοινωνικής δικτύωσης σηματοδοτεί μια σημαντική αλλαγή στο ψηφιακό περιβάλλον, προκαλώντας ευρέως διαδεδομένους συζητήσεις σχετικά με την αυθεντικότητα των διαδικτυακών αλληλεπιδράσεων και τα ηθικά ζητήματα που συνδέονται με αυτές τις εικονικές προσωπικότητες.

All news

AI Company

Launch your AI-powered team to automate Marketing, Sales & Growth

and get clients on autopilot — from social media and search engines. No ads needed

Begin getting your first leads today