Исследователи, поддерживаемые основателем Tesla Inc Элоном Маском и финансистом Силиконовой долины Сэмом Альтманом, нашли новый способ использования программного обеспечения для обучения человекоподобные роботизированные руки новым задачам, открытие, которое в конечном итоге может сделать более экономичным обучение роботов тем, что легко для людей.
Исследователи из OpenAI, некоммерческой исследовательской группы по искусственному интеллекту, основанной в 2015 году, заявили 30 июля, что они научили роботизированную руку вращать буквенный многоцветный блок, пока желательная сторона блока не будет смотреть вверх.
Задача простая. Но цель эксперимента была в том, узнать, как рука овладеет навыками: все обучение происходило в программном симуляции, а затем с относительной легкостью передавалось в физический мир.
Это решает проблему для роботизированных рук, которые выглядят как кулак робота из фантастического фильма «Терминатор» 1980-х годов. Сборка таких манипуляторов была коммерчески доступны годами, но у инженеров были большие сложности с программированием. Инженеры могут писать конкретный компьютерный код для каждой новой задачи, и каждый раз требуется дорогостоящая новая программа. Или роботы могут быть оснащены программным обеспечением, которое позволяет им «учиться» через физическую подготовку.
Физическая подготовка занимает месяцы или годы и имеет свои проблемы - например, если рука робота бросает заготовку, человеку нужно поднять ее и вернуть обратно. Это тоже дорого. Исследователи пытались разбить эти годы физической подготовки и распределить их на несколько компьютеров для моделирования программного обеспечения, которое может выполнять обучение в течение нескольких часов или дней без помощи человека.
Физическая подготовка занимает месяцы или годы и имеет свои проблемы - например, если рука робота роняет заготовку, человеку нужно поднять ее и вернуть обратно. Это тоже дорого. Исследователи пытались разбить эти годы физической подготовки и распределить их на несколько компьютеров для моделирования программного обеспечения, которое может выполнять обучение в течение нескольких часов или дней без помощи человека.
Кен Гольдберг, профессор Калифорнийского университета в Калифорнии в Беркли, не участвовавший в исследовании, просмотрел на OpenAI, назвал работу OpenAI выпущенной в понедельник «важным результатом» в том, чтобы приблизиться к этой цели.
Ключевым достижением в исследовании OpenAI была передача опыта от обучения программному обеспечению робота в реальном мире, преодоление того, что исследователи OpenAI называют «пробелом в реальности» между симуляцией и физическими задачами. Исследователи вводили случайный шум в симуляцию программного обеспечения, делая виртуальный мир руки робота достаточно грязным, чтобы его не одурачивали неожиданным в реальном мире.