
Фото — Google.
Розробники використали мовні моделі, за допомогою яких робот розуміє не тільки прості завдання, як наприклад «Принеси, будь ласка, яблуко», а й складніші: «Я щойно тренувався. Принесеш мені перекусити та випити, щоб відновитися?».
Проте іноді робот міг поводитися нелогічно. Наприклад, коли з’являється запит «Я пролив свій напій, чи можете ви допомогти?», мовна модель відповідає: «Ви можете спробувати використати пилосос» або вибачається, ніби сам розлив: «Вибачте, я не хотів це розлити».
Результати покращилися, коли інженери навчили систему розпізнавати запит, який трансформує його в набір завдань, що нагадує вибір реплік у якійсь компʼютерній грі. Також автори переналаштували робота так, щоб він навчався на власних помилках.
Перші результати показали, що системі вдається обрати правильну послідовність дій у 84% випадків та успішно виконати їх у 74%. У порівнянні з попередніми налаштуваннями це зменшує ризик помилки на 50%. У майбутньому розробники планують адаптувати отримані знання для досліджень, які поєднують роботизоване навчання з розширеними мовними моделями.