lang icon En
March 13, 2024, 8 p.m.
2757

None

Brief news summary

None

Rozwój humanoidowych robotów odbywał się powoli przez niemal dwa dziesięciolecia. Jednak dzięki współpracy między Figure AI i OpenAI, miało miejsce gwałtowne przyspieszenie w tej dziedzinie. Efektem jest zadziwiające wideo, w którym pokazano robota Figure 01 z nowym Modelem Języka Wizualnego (VLM), który przekształcił go w robota sci-fi o możliwościach zbliżonych do C-3PO. W wideo, Figure 01 jest umieszczony za stołem z talerzem, jabłkiem i filiżanką, a na lewo znajduje się ociekacz. Przed robotem znajduje się człowiek, który pyta, "Figure 01, co teraz widzisz?" Po chwili Figure 01 odpowiada niezwykle ludzkim głosem (choć nie ma twarzy) i szczegółowo opisuje wszystko na stole oraz osobę przed nim. Zadziwiony, pomyślałem, "To jest niesamowite. " Następnie osoba pyta, "Hej, czy mogę coś zjeść?" Figure 01 pewnie odpowiada, "Oczywiście, " i umiejętnie podnosi jabłko, podając je tej osobie. Nie mogłem powstrzymać się od wykrzyku, "Woah. " Kolejno, osoba opróżnia kosz zgniecionych śmieci przed Figure 01, pytając, "Czy możesz wyjaśnić, dlaczego właśnie to zrobiłeś, podnosząc ten śmieć?" Nie tracąc czasu, Figure 01 tłumaczy swoje rozumowanie, umieszczając papier z powrotem do kosza. "Podałem ci jabłko, ponieważ jest to jedyny jadalny przedmiot, który mogłem ci zaoferować ze stołu. " Z podziwem mówiłem sam do siebie, "To nie może być prawdziwe. " Jednak według Figure AI, jest to właśnie prawda. Rozumowanie z mowy na mowę odgrywa ważną rolę w zdolnościach Figure 01, ponieważ wykorzystuje w tym celu wcześniej przeszkolony multimodalny model OpenAI, VLM, do rozumienia obrazów i tekstów.

Polega on na konwersacyjnej interakcji głosowej w celu formułowania odpowiedzi, co odróżnia go od GPT-4 OpenAI, który skupia się przede wszystkim na pisemnych sugestiach. Ponadto, Figure 01 wykorzystuje technikę "naukowego manipulowania na niskim poziomie dwoma rękami". System łączy precyzyjną kalibrację obrazu z siecią neuronową, aby kontrolować swoje ruchy, operując na poziomie piksela. Figure AI stwierdziło: "Te sieci przetwarzają obraz na pokładzie z częstotliwością 10 Hz i generują działania 24-stopni swobody (pozy nadgarstków i kąty stawów palców) z częstotliwością 200 Hz. " Figure AI twierdzi, że każde zachowanie przedstawione w wideo jest wynikiem uczenia systemu, a Figure 01 nie jest obsługiwany zdalnie, co wyklucza jakiekolwiek podejrzenia manipulacji. Bez własnej obserwacji Figure 01 i zadawania własnych pytań trudno jest zweryfikować te twierdzenia. Istnieje możliwość, że ta rutyna była wielokrotnie powtarzana przez Figure 01. Być może jest to setne powtórzenie, co tłumaczy imponującą szybkość i płynność. Ale jeśli to jest naprawdę 100% prawda, muszę powiedzieć, "Wow. " Po prostu wow.


Watch video about

None

Try our premium solution and start getting clients — at no cost to you

I'm your Content Creator.
Let’s make a post or video and publish it on any social media — ready?

Language

Hot news

Feb. 25, 2026, 5:38 a.m.

Seadronix prezentuje NAVISS 2.0 – system nawigacj…

Seadronix, wiodący innowator w dziedzinie sztucznej inteligencji i autonomicznej nawigacji statków, zaprezentował swoje najnowsze osiągnięcie, NAVISS 2.0, podczas targów SMM 2024 w Hamburgu.

Feb. 25, 2026, 5:27 a.m.

Interact Marketing ostrzega przed ryzykami związa…

Interact Marketing wydało ostrzeżenie dotyczące powszechnego stosowania wykrywalnych treści marketingowych generowanych przez sztuczną inteligencję oraz spadku standardów jakości.

Feb. 25, 2026, 5:24 a.m.

75% marketerów już wdrożyło sztuczną inteligencję…

Najnowszy raport Salesforce analizuje obecny stan wdrażania sztucznej inteligencji (SI) w marketingu, ujawniając, że około 75% marketerów zintegrowało SI ze swoimi strategiami.

Feb. 25, 2026, 5:22 a.m.

Analiza wideo z AI ulepsza doświadczenie w relacj…

W szybko rozwijającej się dziedzinie nadawania sportowego integracja sztucznej inteligencji (AI) rewolucjonizuje sposób, w jaki widzowie doświadczają transmisji na żywo.

Feb. 25, 2026, 5:19 a.m.

Screaming Frog SEO Spider integruje sztuczną inte…

Screaming Frog, wiodący dostawca oprogramowania SEO, ulepszył swoje popularne narzędzie SEO Spider poprzez integrację bezpośrednich możliwości API AI, umożliwiając użytkownikom dostęp do zaawansowanych modeli AI takich jak OpenAI, Gemini i Claude w ramach interfejsu do różnych zadań SEO.

Feb. 25, 2026, 5:14 a.m.

Google współpracuje z AP, aby dostarczać wiadomoś…

Google ogłosił przełomowe partnerstwo z The Associated Press (AP), aby dostarczać najnowsze wiadomości w czasie rzeczywistym za pomocą zaawansowanego chatbota AI Gemini.

Feb. 24, 2026, 9:20 a.m.

SoundHound AI uruchamia asystenta sprzedażowego d…

Na Mobile World Congress (MWC) w Barcelonie SoundHound AI zaprezentował Sales Assist, innowacyjnego, opartego na głosie agenta sprzedaży w czasie rzeczywistym, dopasowanego do środowisk detalicznych.

All news

AI Company

Launch your AI-powered team to automate Marketing, Sales & Growth

and get clients on autopilot — from social media and search engines. No ads needed

Begin getting your first leads today