AIウォッチ / AI工程・実装

AI工程・実装4本

AIコーディング & エージェント2026.05.30

テストが全部通って初めて褒められるAI ―― Kimi-Dev に学ぶ「コードを直すモデル」の作り方

SWE-bench と「全テスト通過でのみ報酬」という訓練思想から、修正特化モデルの意味を整理する。

AI工程・実装2026.05.30

旗艦モデルが「毎秒400トークン」で喋り出した ―― 智谱 GLM-5.1 高速版の中身

毎秒400トークンの裏側にある、推論エンジンと運用インフラの競争を見る。

AI工程・実装2026.05.30

「賢さ」より「燃費」で勝負するモデル ―― 阶跃の Step 3.7 Flash が面白い

速さ・安さ・Agent実戦性能から、モデル競争が「燃費」へ移る流れを読む。

AI工程・実装2026.05.30

中国の「自前のチップ」で、1.6兆パラメータのモデルを鍛え直した話

国産チップで巨大モデルの後訓練を安定して回す、地味だが重いインフラの進展。