None
Brief news summary
NoneBadania wykazały, że szkolenie modeli AI w myśleniu przed udzieleniem odpowiedzi może znacząco zwiększyć ich zdolności do rozumowania. Tradycyjnie, chatboty AI, takie jak ChatGPT, nie rozważają swoich odpowiedzi ani nie przewidują różnych możliwości rozmowy. Jednak nowa metoda szkolenia o nazwie "Quiet-STaR" nakazuje systemom AI generowanie wielu wewnętrznych racjonalizacji przed udzieleniem odpowiedzi na pytanie. Poprzez połączenie tych prognoz, AI może zaoferować najlepszą odpowiedź, którą można zweryfikować przez uczestnika ludzkiego.
Ta metoda pozwala również AI uczyć się poprzez odrzucanie nieprawidłowych racjonalizacji, co umożliwia przewidywanie przyszłych rozmów i uczenie się na bieżąco. Algorytm Quiet-STaR został zastosowany do Mistral 7B, otwartoźródłowego modelu językowego, co dało wynik testu rozumowania równy 47, 2%, co stanowi znaczącą poprawę w porównaniu z wynikiem przed szkoleniem, który wyniósł 36, 3%. AI wciąż ma trudności z niektórymi zadaniami, takimi jak test matematyczny, ale jego wyniki podwoiły się z 5, 9% do 10, 9%. Ten podejście zapowiada zwiększenie zdolności rozumowania modeli AI i zbliżenie luki między systemami opartymi na sieciach neuronowych a rozumowaniem zbliżonym do ludzkiego.
Watch video about
None
Try our premium solution and start getting clients — at no cost to you