Rozwój humanoidowych robotów odbywał się powoli przez niemal dwa dziesięciolecia. Jednak dzięki współpracy między Figure AI i OpenAI, miało miejsce gwałtowne przyspieszenie w tej dziedzinie. Efektem jest zadziwiające wideo, w którym pokazano robota Figure 01 z nowym Modelem Języka Wizualnego (VLM), który przekształcił go w robota sci-fi o możliwościach zbliżonych do C-3PO. W wideo, Figure 01 jest umieszczony za stołem z talerzem, jabłkiem i filiżanką, a na lewo znajduje się ociekacz. Przed robotem znajduje się człowiek, który pyta, "Figure 01, co teraz widzisz?" Po chwili Figure 01 odpowiada niezwykle ludzkim głosem (choć nie ma twarzy) i szczegółowo opisuje wszystko na stole oraz osobę przed nim. Zadziwiony, pomyślałem, "To jest niesamowite. " Następnie osoba pyta, "Hej, czy mogę coś zjeść?" Figure 01 pewnie odpowiada, "Oczywiście, " i umiejętnie podnosi jabłko, podając je tej osobie. Nie mogłem powstrzymać się od wykrzyku, "Woah. " Kolejno, osoba opróżnia kosz zgniecionych śmieci przed Figure 01, pytając, "Czy możesz wyjaśnić, dlaczego właśnie to zrobiłeś, podnosząc ten śmieć?" Nie tracąc czasu, Figure 01 tłumaczy swoje rozumowanie, umieszczając papier z powrotem do kosza. "Podałem ci jabłko, ponieważ jest to jedyny jadalny przedmiot, który mogłem ci zaoferować ze stołu. " Z podziwem mówiłem sam do siebie, "To nie może być prawdziwe. " Jednak według Figure AI, jest to właśnie prawda. Rozumowanie z mowy na mowę odgrywa ważną rolę w zdolnościach Figure 01, ponieważ wykorzystuje w tym celu wcześniej przeszkolony multimodalny model OpenAI, VLM, do rozumienia obrazów i tekstów.
Polega on na konwersacyjnej interakcji głosowej w celu formułowania odpowiedzi, co odróżnia go od GPT-4 OpenAI, który skupia się przede wszystkim na pisemnych sugestiach. Ponadto, Figure 01 wykorzystuje technikę "naukowego manipulowania na niskim poziomie dwoma rękami". System łączy precyzyjną kalibrację obrazu z siecią neuronową, aby kontrolować swoje ruchy, operując na poziomie piksela. Figure AI stwierdziło: "Te sieci przetwarzają obraz na pokładzie z częstotliwością 10 Hz i generują działania 24-stopni swobody (pozy nadgarstków i kąty stawów palców) z częstotliwością 200 Hz. " Figure AI twierdzi, że każde zachowanie przedstawione w wideo jest wynikiem uczenia systemu, a Figure 01 nie jest obsługiwany zdalnie, co wyklucza jakiekolwiek podejrzenia manipulacji. Bez własnej obserwacji Figure 01 i zadawania własnych pytań trudno jest zweryfikować te twierdzenia. Istnieje możliwość, że ta rutyna była wielokrotnie powtarzana przez Figure 01. Być może jest to setne powtórzenie, co tłumaczy imponującą szybkość i płynność. Ale jeśli to jest naprawdę 100% prawda, muszę powiedzieć, "Wow. " Po prostu wow.
None
Seadronix, wiodący innowator w dziedzinie sztucznej inteligencji i autonomicznej nawigacji statków, zaprezentował swoje najnowsze osiągnięcie, NAVISS 2.0, podczas targów SMM 2024 w Hamburgu.
Interact Marketing wydało ostrzeżenie dotyczące powszechnego stosowania wykrywalnych treści marketingowych generowanych przez sztuczną inteligencję oraz spadku standardów jakości.
Najnowszy raport Salesforce analizuje obecny stan wdrażania sztucznej inteligencji (SI) w marketingu, ujawniając, że około 75% marketerów zintegrowało SI ze swoimi strategiami.
W szybko rozwijającej się dziedzinie nadawania sportowego integracja sztucznej inteligencji (AI) rewolucjonizuje sposób, w jaki widzowie doświadczają transmisji na żywo.
Screaming Frog, wiodący dostawca oprogramowania SEO, ulepszył swoje popularne narzędzie SEO Spider poprzez integrację bezpośrednich możliwości API AI, umożliwiając użytkownikom dostęp do zaawansowanych modeli AI takich jak OpenAI, Gemini i Claude w ramach interfejsu do różnych zadań SEO.
Google ogłosił przełomowe partnerstwo z The Associated Press (AP), aby dostarczać najnowsze wiadomości w czasie rzeczywistym za pomocą zaawansowanego chatbota AI Gemini.
Na Mobile World Congress (MWC) w Barcelonie SoundHound AI zaprezentował Sales Assist, innowacyjnego, opartego na głosie agenta sprzedaży w czasie rzeczywistym, dopasowanego do środowisk detalicznych.
Launch your AI-powered team to automate Marketing, Sales & Growth
and get clients on autopilot — from social media and search engines. No ads needed
Begin getting your first leads today