AIウォッチ / 推論・コスト最適化

推論・コスト最適化2本

AI工程・実装2026.05.30

「賢さ」より「燃費」で勝負するモデル ―― 阶跃の Step 3.7 Flash が面白い

速さ・安さ・Agent実戦性能から、モデル競争が「燃費」へ移る流れを読む。

AI工程・実装2026.05.30

旗艦モデルが「毎秒400トークン」で喋り出した ―― 智谱 GLM-5.1 高速版の中身

毎秒400トークンの裏側にある、推論エンジンと運用インフラの競争を見る。