AIウォッチ / ロボット・マルチモーダル
人型ロボットの動画は、見ていて楽しい。走る。踊る。箱を持つ。たまに転ぶ。それだけで未来っぽい。
一人用から多人数へ広がる世界モデルの意味を、NVIDIA×清華の研究から読む。
世界モデルが具身知能の本丸になる理由を、智元 GE 2.0 の事例から整理する。
ロボットを売った後に賢くする、中国型の学習ループと日本の部品優位を並べて読む。
画像生成モデルの話は、すぐに絵のうまさに流れる。肌がきれい。文字が読める。構図が安定した。ベンチで勝った。
写真一枚と音声から話す人間を作るオープンソースデジタルヒューマンを、日本のアバター文化と並べる。
一言からビジュアル一式を作るクリエイティブAgentを、制作ワークフローの変化として読む。