AIウォッチ / AIコーディング & エージェント
Code Arena の順位と35時間タスクから、中国モデルのコーディング能力を冷静に読む。
SWE-bench と「全テスト通過でのみ報酬」という訓練思想から、修正特化モデルの意味を整理する。
オープンウェイトの巨大MoEが、コーディングでクローズドモデルに並ぶ意味を読む。
MiniMax M2.7 を入口に、中国のオープンなコーディングAIが群れで出てきた構造を見る。