バイトダンスはロボット用のAI「脳」を発表しました

バイトダンスがロボット用のAI「脳」を発表

TikTokを運営するByteDanceは、ロボットの「脳」として機能するシステムを発表しました。このシステムは、衣類を干したり、テーブルの掃除をしたりといった日常的な作業を実行することができます。

GR-3は、「視覚-言語-行動」タイプの大規模言語モデルであり、ボットが自然言語の指示に従い、未知のオブジェクトに対して普遍的なタスクを実行することを可能にします。これらは、新しい条件下またはサイズや空間的関係に関連する抽象的な概念で作業することができます。

公開されたウェブサイトのビデオでは、ラボ用の二手ロボットByteMiniがシャツにハンガーを挿入し、それをスタンドに置く様子が示されています。

🚀🚀🚀 ロボットが現実の家庭作業をこなすために必要なものは何か考えたことがありますか? 長期的な実行、変形可能な物体の巧妙さ、そして見えない物体の一般化 — GR-3、ByteDance Seedの新しいビジョン-言語-アクション (VLA) モデルをご紹介します!

GR-3は一般化可能です...pic.twitter.com/zECRjaXC0J

— Xiao Ma (@yusufma555) 2025年7月22日

別の技術レポートで、チームはボットが半袖の服を扱えると報告しましたが、「トレーニングデータのすべてのアイテムは長袖でした」。

GR-3のおかげで、ロボットは複数の中から特定の物を選ぶ指示を実行し、それを指定された場所に配置できます。

システムは、名前だけでなく、サイズ(例えば、「大きな皿」)や空間的特徴(例えば、「左」)によってもオブジェクトを認識することができます。「食卓を片付ける」というタスクを一つのコマンドで完全に実行することができます。

モデルのトレーニングのために、ByteDanceは次のような多コンポーネントアプローチを使用しました:

  • 大規模データセットにおける「画像-テキスト」形式の共同学習;
  • 人間の行動軌跡に関する情報をVRデバイスを用いて収集したデータで再学習する;
  • アンドロイドの動きに関するデータを用いた模倣による設定。

「私たちは、GR-3が人々の日常生活を助けることができる汎用ロボットの創造への第一歩になることを期待しています」とチームの声明に述べられています。

1月にスタートアップのPerplexity AIがアメリカのTikTokを買収する意向を表明したことを思い出してください。同社はByteDanceに、Perplexity、TikTok U.S.、および新しい資本パートナーを1つの法的構造に統合する提案を送信しました。

原文表示
このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております(表明・保証をするものではありません)。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。
  • 報酬
  • コメント
  • 共有
コメント
0/400
コメントなし
いつでもどこでも暗号資産取引
qrCode
スキャンしてGateアプリをダウンロード
コミュニティ
日本語
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)