Την Πέμπτη, η OpenAI παρουσίασε μια ερευνητική προεπισκόπηση του "Operator", ενός εργαλείου αυτοματοποίησης διαδικτύου που λειτουργεί με βάση ένα νέο μοντέλο τεχνητής νοημοσύνης που ονομάζεται Computer-Using Agent (CUA). Αυτό το εργαλείο επιτρέπει στους χρήστες να ελέγχουν υπολογιστές μέσω μιας οπτικής διεπαφής, εκτελώντας εργασίες αλληλεπιδρώντας με στοιχεία της οθόνης όπως κουμπιά και πεδία κειμένου, παρόμοια με τη συμπεριφορά των ανθρώπων. Αυτή τη στιγμή, ο Operator είναι διαθέσιμος στους συνδρομητές του μηνιαίου σχεδίου ChatGPT Pro των 200 δολαρίων στο operator. chatgpt. com, με σχέδια να επεκταθεί η πρόσβαση και σε Plus, Team και Enterprise χρήστες στο μέλλον. Η OpenAI σκοπεύει να ενσωματώσει αυτές τις δυνατότητες στο ChatGPT και να παρέχει το CUA μέσω ενός API για προγραμματιστές. Ο Operator παρακολουθεί το περιεχόμενο της οθόνης σε πραγματικό χρόνο, εκτελώντας εντολές μέσω προσομοιωμένων ενέργειών πληκτρολογίου και ποντικιού. Αναλύει στιγμιότυπα οθόνης για να κατανοήσει την κατάσταση του υπολογιστή, κάτι που του επιτρέπει να παίρνει αποφάσεις για κλικ, πληκτρολόγηση και κύλιση αναλόγως. Αυτή η κυκλοφορία ευθυγραμμίζεται με μια τάση που παρατηρείται μεταξύ των τεχνολογικών εταιρειών που εξερευνούν "δραστήρια" συστήματα τεχνητής νοημοσύνης ικανά να ενεργούν εκ μέρους των χρηστών. Η Google παρουσίασε το Project Mariner τον Δεκέμβριο του 2024 για αυτοματοποιημένες διαδικτυακές εργασίες, ενώ η Anthropic λάνσαρε ένα εργαλείο που ονομάζεται "Computer Use" τον Οκτώβριο του 2024 για παρόμοιους σκοπούς. Ο Simon Willison, ερευνητής στην AI, σημείωσε ότι η διεπαφή του Operator θυμίζει την επίδειξη Claude Computer Use της Anthropic, η οποία διαθέτει ένα πάνελ συνομιλίας μαζί με μια διαδραστική οπτική διεπαφή. Ο CUA λειτουργεί συλλαμβάνοντας στιγμιότυπα οθόνης, αναλύοντας τα για να αξιολογήσει τα δεδομένα των εικονοστοιχείων με τις ικανότητες όρασης του GPT-4o, αποφασίζοντας για τις απαραίτητες ενέργειες και εκτελώντας εικονικές εισόδους. Αυτός ο βρόχος ανατροφοδότησης του επιτρέπει να διορθώνει λάθη και να διαχειρίζεται σύνθετες εργασίες σε διάφορες εφαρμογές.
Κατά τη διάρκεια της χρήσης, ένα μικροσκοπικό παράθυρο προγράμματος περιήγησης εμφανίζει τις ενέργειες του Operator. Παρά τις δυνατότητές του, η τεχνολογία εξακολουθεί να εξελίσσεται και έχει περιορισμούς, διαπρέποντας σε επαναλαμβανόμενες διαδικτυακές εργασίες αλλά δυσκολευόμενη με άγνωστες διεπαφές και πολύπλοκες επεξεργασίες κειμένου—αναφέροντας μόλις 40 τοις εκατό ποσοστό επιτυχίας σε εσωτερικές δοκιμές. Ο Operator πέτυχε ποσοστό επιτυχίας 87 τοις εκατό στο benchmark WebVoyager αλλά έπεσε στο 58, 1 τοις εκατό στο benchmark WebArena για εκπαίδευση εκτός σύνδεσης. Η απόδοσή του στο benchmark OSWorld ήταν 38, 1 τοις εκατό. Η OpenAI αναζητά ανατροφοδότηση από τους χρήστες για να βελτιώσει τη λειτουργικότητα του συστήματος, κατανοώντας ότι το CUA δεν θα είναι αξιόπιστο σε όλα τα σενάρια και σχεδιάζει να βελτιώσει την πολυμορφία του με την πάροδο του χρόνου. Η ιδιωτικότητα και η ασφάλεια είναι βασικές ανησυχίες, δεδομένου ότι ο Operator μπορεί να παρακολουθεί και να ελέγχει τις δραστηριότητες των χρηστών. Η OpenAI έχει εφαρμόσει μέτρα ασφαλείας που απαιτούν επιβεβαίωση από τον χρήστη για ευαίσθητες ενέργειες, με περιορισμούς περιήγησης που έχουν οριστεί ώστε να αποτρέπεται η πρόσβαση σε ορισμένες κατηγορίες ιστοσελίδων, όπως τυχερά παιχνίδια και περιεχόμενο ενηλίκων. Η OpenAI ενσωματώνει επίσης πραγματική μέτρηση για την πρόληψη προσπαθειών υπονόμευσης, αν και ο Willison εξέφρασε σκεπτικισμό για την μακροπρόθεσμη ασφάλειά της λόγω των πιθανών νέων απειλών. Παρά τις προληπτικές ενέργειες, η OpenAI παραδέχεται στα έγγραφά της ότι οι προκλήσεις παραμένουν λόγω των πολυσύνθετων μοντέλων και των εξελισσόμενων απειλών. Οι ανησυχίες για την ιδιωτικότητα προκύπτουν από το γεγονός ότι ο Operator στέλνει στιγμιότυπα οθόνης στους cloud servers της OpenAI; οι χρήστες ενθαρρύνονται να εμπιστεύονται τα μέτρα ιδιωτικότητας της εταιρείας, τα οποία επιτρέπουν την αποκλειστική συμμετοχή δεδομένων για την εκπαίδευση μοντέλων, διαγραφή δεδομένων με ένα κλικ και διαχείριση συνεδριών για ευαίσθητες εργασίες. Ο Willison συμβούλεψε τους χρήστες να ξεκινούν νέες συνεδρίες για ξεχωριστές εργασίες για να προστατεύσουν τα διαπιστευτήρια τους και τους προειδοποίησε να είναι προσεκτικοί όταν παρέχουν λεπτομέρειες πληρωμής, προτείνοντας μια γρήγορη καθαριότητα αμέσως μετά από αυτές τις ενέργειες.
Η OpenAI λανσάρει το 'Operator': Ένα νέο εργαλείο αυτοματοποίησης ιστού που χρησιμοποιεί AI.
AIMM: Ένα Καινοτόμο Πλαίσιο με Τεχνητή Νοημοσύνη για την Ανίχνευση Market Manipulation μέσω Κοινωνικών Δικτύων Στο ταχέως μεταβαλλόμενο περιβάλλον του χρηματιστηριακού εμπορίου σήμερα, τα κοινωνικά δίκτυα έχουν αναδειχθεί ως βασική δύναμη διαμόρφωσης των αγορών
Η εταιρεία νομικής τεχνολογίας Filevine έχει εξαγοράσει την Pincites, μια εταιρεία που χρησιμοποιεί τεχνητή νοημοσύνη για την αναθεώρηση και αναδιαμόρφωση συμβάσεων, ενισχύοντας το αποτύπωμά της στον εταιρικό και εμπορικό δίκαιο καθώς και προωθώντας τη στρατηγική της εστίαση στην τεχνητή νοημοσύνη.
Η τεχνητή νοημοσύνη (ΤΝ) αναδιαμορφώνει γρήγορα τον τομέα της βελτιστοποίησης μηχανών αναζήτησης (SEO), παρέχοντας στους ψηφιακούς διαφημιστές καινοτόμα εργαλεία και νέες ευκαιρίες για να βελτιώσουν τις στρατηγικές τους και να επιτύχουν ανώτερα αποτελέσματα.
Οι εξελίξεις στην τεχνητή νοημοσύνη έχουν διαδραματίσει καθοριστικό ρόλο στην καταπολέμηση της παραπληροφόρησης, καθιστώντας δυνατή τη δημιουργία εξελιγμένων αλγορίθμων που ανιχνεύουν τις deepfakes—παραποιημένα βίντεο όπου το αρχικό περιεχόμενο αλλοιώνεται ή αντικαθίσταται, με σκοπό να παραπλανήσουν τους θεατές και να διασπείρουν ψευδείς πληροφορίες.
Η άνοδος της Τεχνητής Νοημοσύνης έχει μεταμορφώσει τις πωλήσεις αντικαθιστώντας τα μακρά κύκλου και χειροκίνητες παρακολουθήσεις με γρήγορους, αυτοματοποιημένους συστήμ�...
Στον ταχέως εξελισσόμενο χώρο της τεχνητής νοημοσύνης (ΤΝ) και του μάρκετινγκ, πρόσφατες σημαντικές εξελίξεις διαμορφώνουν τον κλάδο, εισάγοντας τόσο νέες ευκαιρίες όσο και προκλήσεις.
Η δημοσίευση ανέφερε ότι η εταιρεία βελτίωσε το «περιθώριο υπολογισμού» της, ένα εσωτερικό μέτρο που αντιπροσωπεύει το τμήμα των εσόδων που απομένει μετά την κάλυψη των εξόδων λειτουργικών μοντέλων για τους πληρωμένους χρήστες των εταιρικών και καταναλωτικών προϊόντων της.
Launch your AI-powered team to automate Marketing, Sales & Growth
and get clients on autopilot — from social media and search engines. No ads needed
Begin getting your first leads today