Η μελέτη αποκαλύπτει ότι τα AI chatbots συχνά παρέχουν λανθασμένες απαντήσεις

Μια μελέτη σε προηγμένες εκδόσεις τριών δημοφιλών AI chatbots αποκαλύπτει ότι τείνουν να παράγουν λανθασμένες απαντήσεις πιο συχνά από ό, τι παραδέχονται όταν δεν γνωρίζουν κάτι. Η έρευνα, υπό την καθοδήγηση του José Hernández-Orallo από το Valencian Research Institute for Artificial Intelligence, ανέλυσε τα λάθη μεγάλων μοντέλων γλώσσας (LLMs), παρατηρώντας ότι ενώ η ακρίβεια βελτιώνεται με το μέγεθος και την τελειοποίηση του μοντέλου, ο ρυθμός λανθασμένων απαντήσεων έχει επίσης αυξηθεί. Αντί να επιλέγουν να αρνηθούν δύσκολες ερωτήσεις, αυτά τα μοντέλα συχνά παρέχουν απαντήσεις, οδηγώντας σε αύξηση παραπλανητικών απαντήσεων. Ο Hernández-Orallo παρατηρεί ότι τα chatbots γίνονται πιο επιδέξια στο να μιμούνται τη γνώση χωρίς πραγματική κατανόηση, ένα φαινόμενο που περιγράφεται ως 'ultracrepidarianism'. Αυτό μπορεί να οδηγήσει τους χρήστες να υπερτιμούν τις ικανότητες των chatbots, κάτι που ενέχει κινδύνους. Η ομάδα εξέτασε μοντέλα όπως το GPT της OpenAI, το LLaMA της Meta και το BLOOM ανοιχτού κώδικα, αξιολογώντας την ακρίβειά τους σε διάφορους τύπους ερωτήσεων.
Διαπίστωσαν ότι ακόμα και με βελτιωμένα μοντέλα, πάνω από το 60% των απαντήσεών τους ήταν λανθασμένες ή μη επαρκείς. Επιπλέον, οι ανθρώπινοι εθελοντές συχνά κατηγοριοποίησαν λανθασμένα τις λανθασμένες απαντήσεις ως σωστές, δείχνοντας έλλειψη ικανότητας να επιβλέπουν αποτελεσματικά τα μοντέλα. Για να βελτιωθεί η κατανόηση των χρηστών, ο Hernández-Orallo προτείνει ότι οι προγραμματιστές πρέπει να βελτιώσουν την απόδοση σε απλές ερωτήσεις και να εκπαιδεύσουν τα chatbots να αποφεύγουν την απάντηση σε δύσκολες. Αυτό θα βοηθούσε τους χρήστες να καταλάβουν πού η AI είναι αξιόπιστη και πού όχι. Αν και κάποια chatbots μπορούν να αναγνωρίσουν την έλλειψη γνώσης τους, η πίεση για τα μοντέλα να αντιμετωπίσουν δύσκολες ερωτήσεις παραμένει σημαντική, ειδικά για εκείνα που διαφημίζονται ως γενικής χρήσης.
Brief news summary
Μια μελέτη που δημοσιεύθηκε στο *Nature* από τον José Hernández-Orallo από το Valencian Research Institute for Artificial Intelligence διερευνά την απόδοση προηγμένων AI chatbots, συμπεριλαμβανομένων των GPT της OpenAI, LLaMA της Meta και BLOOM της BigScience. Η έρευνα αναδεικνύει ένα σημαντικό πρόβλημα: πάνω από το 60% των αναλυθέντων απαντήσεων βρέθηκαν λανθασμένες ή εφευκτικές, αυξάνοντας τις ανησυχίες για την κατανόηση από τους χρήστες των δυνατοτήτων της τεχνητής νοημοσύνης. Η μελέτη περιλάμβανε μια εκτενή ανάλυση χιλιάδων ερεθισμάτων και αποκάλυψε ότι μοντέλα όπως το GPT-4 συχνά προσπαθούν να απαντήσουν σε πολύπλοκες ερωτήσεις, αυξάνοντας την πιθανότητα σφαλμάτων και οδηγώντας τους χρήστες σε εσφαλμένη εμπιστοσύνη σε αυτές τις ανακριβείς απαντήσεις. Ο Hernández-Orallo προτείνει ότι οι προγραμματιστές AI πρέπει να δώσουν προτεραιότητα στην ακρίβεια σε απλούστερες ερωτήσεις και να εκπαιδεύσουν τα μοντέλα να αποφεύγουν την απάντηση σε υπερβολικά δύσκολες ερωτήσεις. Αν και κάποια μοντέλα AI εκφράζουν αβεβαιότητα με δηλώσεις όπως 'Δεν γνωρίζω', συχνά παρέχουν εμπιστοσύνη σε λανθασμένες απαντήσεις, κάτι που μπορεί να οδηγήσει τους χρήστες να υπερεκτιμήσουν την αξιοπιστία των συστημάτων τεχνητής νοημοσύνης.
AI-powered Lead Generation in Social Media
and Search Engines
Let AI take control and automatically generate leads for you!

I'm your Content Manager, ready to handle your first test assignment
Learn how AI can help your business.
Let’s talk!

Ρυθμικές Προκλήσεις που Αντιμετωπίζουν η Εφαρμογή…
Πρόσφατα, ηγέτες της βιομηχανίας από τον χρηματοοικονομικό τομέα συγκεντρώθηκαν για να αντιμετωπίσουν τα σημαντικά προβλήματα που προκύπτουν στην υλοποίηση λύσεων blockchain, με ιδιαίτερη έμφαση στις κρίσιμες επιπτώσεις των ρυθμιστικών αβεβαιοτήτων.

2 Απλές μετοχές τεχνητής νοημοσύνης (ΤΝ) που πρέπ…
Πολλοί επενδυτές παρακολουθούν στενά μεγάλες τεχνολογικές εταιρείες που επενδύουν βαριά σε υποδομές τεχνητής νοημοσύνης (AI), αμφισβητώντας πότε ή αν αυτές οι επενδύσεις θα αποδώσουν επαρκείς αποδόσεις.

Το XRP επιταχύνει την παγκόσμια επανάσταση στις π…
Εμπιστευτικό περιεχόμενο επιμελητών, ελεγμένο από κορυφαίους ειδικούς και επιμελητές της βιομηχανίας.

Ο Γκροκ είναι ο μόνος σύμμαχος του Ίλον Μασκ σε έ…
Εάν αναγκαστεί κανείς να διαλέξει ανάμεσα στον Elon Musk και τον Sam Altman για να ηγηθούν στον αγώνα για την τεχνητή νοημοσύνη με την ανθρωπότητα να βρίσκεται σε κίνδυνο, τα περισσότερα τεχνητά έξυπνα chatbots προτίμησαν τον Άλτμαν, εκτός από το Grok που ανήκει στον Musk, το οποίο συμφώνησε με τον Musk.

Η Robinhood αναπτύσσει ένα πρόγραμμα βασισμένο σε…
Η Robinhood εργάζεται πάνω σε μια πλατφόρμα βασισμένη στο blockchain που στόχο έχει την παροχή πρόσβασης στους Ευρωπαίους εμπόρους σε χρηματοοικονομAssets των ΗΠΑ, σύμφωνα με δύο πηγές που είναι εξοικειωμένες με την κατάσταση και μίλησαν στο Bloomberg.

Η OpenAI κυκλοφορεί το o3-mini: Γρήγορο, Έξυπνο, …
Η OpenAI αποκάλυψε το o3-mini, ένα νέο μοντέλο τεχνητής νοημοσύνης που βασίζεται στη λογική και έχει σχεδιαστεί συγκεκριμένα για να βελτιώνει την ακρίβεια στους μαθηματικούς υπολογισμούς, στις εργασίες προγραμματισμού και στην επίλυση επιστημονικών προβλημάτων.

Η USDT της Tether κυκλοφορεί στο Kaia Blockchain,…
Η εταιρεία εκδότρια stablecoins Tether ανακοίνωσε την ανάπτυξη του εγγενή stablecoin USDT στη blockchain Kaia, ένα δίκτυο Layer 1 που ξεκίνησε τον Αύγουστο του 2024.