AIウォッチ / モデル・推論基盤

LLMの注意力まわりは、名前だけ追うとすぐ迷子になる。MHA、MQA、GQA、MLA、SWA、DSA。略語が増え、図も増え、結局どれが何をしているのか分からなくなる。

推論モデルの強化学習(RL)は、ここ1年で「ベンチマークを何点上げたか」を競うフェーズに見える。だがQwenチームが2025年7月末に公開した GSPO(Group Sequenc…

Claude Opus の評価挙動から、モデルが賢くなるほど壊れるベンチマークの問題を見る。

LLMを動かす、と聞くと、多くの人はモデルファイルを思い浮かべる。重みを落とす。GPUに載せる。プロンプトを入れる。答えが返る。

ここ数日、NVIDIA から立て続けに発表が出ました。Cosmos 3(オープンな物理 AI の基盤モデル)、RTX Spark(1 petaflop の AI PC 用スーパーチ…

毎秒400トークンの裏側にある、推論エンジンと運用インフラの競争を見る。

速さ・安さ・Agent実戦性能から、モデル競争が「燃費」へ移る流れを読む。