AIウォッチ／ロボット・マルチモーダル

ロボット・マルチモーダル7本

ロボット・世界モデル 4本

人型ロボットの動画は、見ていて楽しい。走る。踊る。箱を持つ。たまに転ぶ。それだけで未来っぽい。

一人用から多人数へ広がる世界モデルの意味を、NVIDIA×清華の研究から読む。

世界モデルが具身知能の本丸になる理由を、智元 GE 2.0 の事例から整理する。

ロボットを売った後に賢くする、中国型の学習ループと日本の部品優位を並べて読む。

画像生成モデルの話は、すぐに絵のうまさに流れる。肌がきれい。文字が読める。構図が安定した。ベンチで勝った。

写真一枚と音声から話す人間を作るオープンソースデジタルヒューマンを、日本のアバター文化と並べる。

一言からビジュアル一式を作るクリエイティブAgentを、制作ワークフローの変化として読む。