Компанія ByteDance, що володіє TikTok, представила систему, яка виконує роль «мозку» для роботів. Вона дозволяє виконувати побутові завдання, такі як розвішування одягу або прибирання зі столу.
GR-3 — велика мовна модель типу «зір-язик-дія», яка дає змогу ботам виконувати команди природною мовою та виконувати універсальні завдання з незнайомими предметами. Вони можуть працювати в нових умовах або з абстрактними поняттями, пов'язаними з розмірами та просторовими відносинами.
В опублікованому на сайті відеоролику продемонстровано, як лабораторний дворукий робот ByteMini може вставляти вішалку в сорочку і розміщувати її на стійці.
🚀🚀🚀 Коли-небудь замислювалися, що потрібно, щоб роботи виконували реальні домашні завдання? Довгострокове виконання, спритність з деформованими об'єктами та узагальнення невидимих об'єктів — знайомтеся з GR-3, новою моделлю Vision-Language-Action (VLA) від ByteDance Seed!
GR-3 є узагальнювальним… pic.twitter.com/zECRjaXC0J
— Сяо Ма (@yusufma555) 22 липня 2025 року
У окремому технічному звіті команда повідомила, що бот справляється з одягом з короткими рукавами, хоча «всі предмети в навчальних даних були з довгими».
Завдяки GR-3 робот може виконувати команди щодо вибору конкретної речі з кількох та розміщувати її у заданому місці.
Система здатна розпізнавати об'єкт не лише за назвою, а й за розміром (, наприклад, «велика тарілка» ) або за просторовою ознакою (, наприклад, «зліва» ). Вона може повністю виконати завдання «прибрати обідній стіл» за єдиним командою.
Для навчання моделі ByteDance використовувала багатокомпонентний підхід, який включає:
спільне навчання на великих масивах даних у форматі «зображення-текст»;
дообучення на інформації про траєкторії дій людини, зібраних за допомогою VR-пристроїв;
налаштування методом наслідування на даних про рухи андроїда.
«Ми сподіваємося, що GR-3 стане кроком до створення універсальних роботів, здатних допомагати людям у повсякденному житті», — йдеться в заяві команди.
Нагадаємо, у січні стартап Perplexity AI заявив про намір придбати американський TikTok. Фірма надіслала ByteDance пропозицію об'єднати Perplexity, TikTok U.S. та нових партнерів по капіталу в єдину юридичну структуру.
Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
ByteDance представила ІІ-«мозок» для роботів
ByteDance представила ІІ-«мозок» для роботів
Компанія ByteDance, що володіє TikTok, представила систему, яка виконує роль «мозку» для роботів. Вона дозволяє виконувати побутові завдання, такі як розвішування одягу або прибирання зі столу.
GR-3 — велика мовна модель типу «зір-язик-дія», яка дає змогу ботам виконувати команди природною мовою та виконувати універсальні завдання з незнайомими предметами. Вони можуть працювати в нових умовах або з абстрактними поняттями, пов'язаними з розмірами та просторовими відносинами.
В опублікованому на сайті відеоролику продемонстровано, як лабораторний дворукий робот ByteMini може вставляти вішалку в сорочку і розміщувати її на стійці.
🚀🚀🚀 Коли-небудь замислювалися, що потрібно, щоб роботи виконували реальні домашні завдання? Довгострокове виконання, спритність з деформованими об'єктами та узагальнення невидимих об'єктів — знайомтеся з GR-3, новою моделлю Vision-Language-Action (VLA) від ByteDance Seed!
У окремому технічному звіті команда повідомила, що бот справляється з одягом з короткими рукавами, хоча «всі предмети в навчальних даних були з довгими».
Завдяки GR-3 робот може виконувати команди щодо вибору конкретної речі з кількох та розміщувати її у заданому місці.
Система здатна розпізнавати об'єкт не лише за назвою, а й за розміром (, наприклад, «велика тарілка» ) або за просторовою ознакою (, наприклад, «зліва» ). Вона може повністю виконати завдання «прибрати обідній стіл» за єдиним командою.
Для навчання моделі ByteDance використовувала багатокомпонентний підхід, який включає:
Нагадаємо, у січні стартап Perplexity AI заявив про намір придбати американський TikTok. Фірма надіслала ByteDance пропозицію об'єднати Perplexity, TikTok U.S. та нових партнерів по капіталу в єдину юридичну структуру.