March 13, 2024, 8 p.m.

None

Brief news summary

None

Rozwój humanoidowych robotów odbywał się powoli przez niemal dwa dziesięciolecia. Jednak dzięki współpracy między Figure AI i OpenAI, miało miejsce gwałtowne przyspieszenie w tej dziedzinie. Efektem jest zadziwiające wideo, w którym pokazano robota Figure 01 z nowym Modelem Języka Wizualnego (VLM), który przekształcił go w robota sci-fi o możliwościach zbliżonych do C-3PO. W wideo, Figure 01 jest umieszczony za stołem z talerzem, jabłkiem i filiżanką, a na lewo znajduje się ociekacz. Przed robotem znajduje się człowiek, który pyta, "Figure 01, co teraz widzisz?" Po chwili Figure 01 odpowiada niezwykle ludzkim głosem (choć nie ma twarzy) i szczegółowo opisuje wszystko na stole oraz osobę przed nim. Zadziwiony, pomyślałem, "To jest niesamowite. " Następnie osoba pyta, "Hej, czy mogę coś zjeść?" Figure 01 pewnie odpowiada, "Oczywiście, " i umiejętnie podnosi jabłko, podając je tej osobie. Nie mogłem powstrzymać się od wykrzyku, "Woah. " Kolejno, osoba opróżnia kosz zgniecionych śmieci przed Figure 01, pytając, "Czy możesz wyjaśnić, dlaczego właśnie to zrobiłeś, podnosząc ten śmieć?" Nie tracąc czasu, Figure 01 tłumaczy swoje rozumowanie, umieszczając papier z powrotem do kosza. "Podałem ci jabłko, ponieważ jest to jedyny jadalny przedmiot, który mogłem ci zaoferować ze stołu. " Z podziwem mówiłem sam do siebie, "To nie może być prawdziwe. " Jednak według Figure AI, jest to właśnie prawda. Rozumowanie z mowy na mowę odgrywa ważną rolę w zdolnościach Figure 01, ponieważ wykorzystuje w tym celu wcześniej przeszkolony multimodalny model OpenAI, VLM, do rozumienia obrazów i tekstów.

Polega on na konwersacyjnej interakcji głosowej w celu formułowania odpowiedzi, co odróżnia go od GPT-4 OpenAI, który skupia się przede wszystkim na pisemnych sugestiach. Ponadto, Figure 01 wykorzystuje technikę "naukowego manipulowania na niskim poziomie dwoma rękami". System łączy precyzyjną kalibrację obrazu z siecią neuronową, aby kontrolować swoje ruchy, operując na poziomie piksela. Figure AI stwierdziło: "Te sieci przetwarzają obraz na pokładzie z częstotliwością 10 Hz i generują działania 24-stopni swobody (pozy nadgarstków i kąty stawów palców) z częstotliwością 200 Hz. " Figure AI twierdzi, że każde zachowanie przedstawione w wideo jest wynikiem uczenia systemu, a Figure 01 nie jest obsługiwany zdalnie, co wyklucza jakiekolwiek podejrzenia manipulacji. Bez własnej obserwacji Figure 01 i zadawania własnych pytań trudno jest zweryfikować te twierdzenia. Istnieje możliwość, że ta rutyna była wielokrotnie powtarzana przez Figure 01. Być może jest to setne powtórzenie, co tłumaczy imponującą szybkość i płynność. Ale jeśli to jest naprawdę 100% prawda, muszę powiedzieć, "Wow. " Po prostu wow.

News source

Watch video about

None

Try our premium solution and start getting clients — at no cost to you

I'm your Content Creator.
Let’s make a post or video and publish it on any social media — ready?

Language

None

Brief news summary

News source

Watch video about

Try our premium solution and start getting clients — at no cost to you

I'm your Content Creator.
Let’s make a post or video and publish it on any social media — ready?

Hot news

Ucząc się, kiedy zakończyć rozmowę sprzedażową

Techniki sztucznej inteligencji rewolucjonizują m…

Wideo tworzone przez sztuczną inteligencję zyskuj…

Modele AI generują dezinformacje o kandydatach na…

Super Bowlowa reklama Svedki stworzona przez sztu…

Narzędzia do automatycznego streszczania wideo op…

Artisan AI rozwija autonomiczne agenty AI do auto…

AI Company

Sales

Marketing

None

Brief news summary

News source

Watch video about

Try our premium solution and start getting clients — at no cost to you

I'm your Content Creator. Let’s make a post or video and publish it on any social media — ready?

Hot news

Ucząc się, kiedy zakończyć rozmowę sprzedażową

Techniki sztucznej inteligencji rewolucjonizują m…

Wideo tworzone przez sztuczną inteligencję zyskuj…

Modele AI generują dezinformacje o kandydatach na…

Super Bowlowa reklama Svedki stworzona przez sztu…

Narzędzia do automatycznego streszczania wideo op…

Artisan AI rozwija autonomiczne agenty AI do auto…

AI Company

Your News is ready

Your article is ready

Generating video takes longer than text.

Join our community of experts

Reasons why you should be part of the experts community

Welcome to Neuron Expert!

Check your email

Launch Your AI-Powered Business

AI Marketing Across All Social Media

AI Sales Manager + CRM

Support

Content Maker

Topic

Specify the topic (Optional)

Link (Optional)

Learn how to craft press releases, create unique social media posts, write SEO-optimized articles for websites, and produce videos, all from a single source

I'm your Content Creator.
Let’s make a post or video and publish it on any social media — ready?