Новий метод. Вчені з’ясували, що передбачуване навчання допомагає роботам краще опановувати складні рухи
Роботи, які навчалися на впорядкованих і передбачуваних прикладах, значно краще виконували складні завдання з маніпулювання предметами, ніж роботи, які отримували різноманітніші, але менш послідовні дані.
Про це пише видання Interesting Engineering.
Такого висновку дійшли дослідники з Нью-Йоркського університету Тандон та Інституту робототехніки й ШІ.
Дослідження ставить під сумнів поширене припущення, що більша різноманітність навчальних даних завжди покращує навчання роботів. Науковці вважають, що для складних завдань важливішою може бути послідовність прикладів.
Багато сучасних роботів навчаються методом наслідування, копіюючи дії людей. Однак збирання таких даних для завдань, які потребують точних рухів пальців і складної взаємодії з предметами, залишається непростим. Тому дослідники використали алгоритми планування рухів, які автоматично створювали навчальні приклади у фізичних симуляціях.
Під час роботи команда помітила проблему. Популярні алгоритми швидкого дослідження випадкових дерев (RRT) знаходили рішення, але вони надто сильно відрізнялися одне від одного. Через це роботам було складніше зрозуміти, яку саме поведінку потрібно повторювати.
Керівник дослідження Хуайцзян Чжу пояснив, що такі алгоритми добре знаходять способи розв’язання задачі, але коли кожне рішення виглядає по-іншому, системі навчання важко визначити, яку модель поведінки слід наслідувати.
Щоб вирішити проблему, вчені створили нові підходи до планування рухів, які генерують більш послідовні приклади. Один із методів орієнтувався на стабільне просування до мети, інший використовував набір заздалегідь визначених рухів для зменшення відмінностей між прикладами.
Ефективність підходу перевірили на двох складних завданнях. У першому два роботизовані маніпулятори мали повернути великий циліндр на 180 градусів, постійно змінюючи хват. У другому роботизована рука перекочувала куб у долоні, щоб досягти заданого положення.
Роботи, навчені на більш послідовних прикладах, показали значно кращі результати. У завданні з двома маніпуляторами система досягла майже ідеальної точності після навчання лише на 100 демонстраціях.
Після цього дослідники перенесли отримані навички із симуляції на реальне обладнання без додаткового перенавчання. Робот із двома маніпуляторами успішно виконав 90% спроб, а роботизована рука впоралася приблизно з 62% завдань.
Автори дослідження зазначають, що результати підтверджують тенденцію до поєднання алгоритмів планування рухів і машинного навчання. Також робота демонструє, що більша кількість даних не завжди означає кращий результат — іноді добре структуровані приклади можуть бути кориснішими за великі набори непослідовних даних.
Источник: techno.nv.ua