AIウォッチ / モデル・LLM

モデル・LLM2本

モデル・LLM深掘り2026.06.01

注意力の進化は、KVキャッシュをどこまで削れるかの歴史だ

LLMの注意力まわりは、名前だけ追うとすぐ迷子になる。MHA、MQA、GQA、MLA、SWA、DSA。略語が増え、図も増え、結局どれが何をしているのか分からなくなる。

モデル・LLM深掘り2026.05.31

GRPOはなぜ長時間学習で崩壊するのか――Qwenが出した「系列単位」の答え、GSPO

推論モデルの強化学習(RL)は、ここ1年で「ベンチマークを何点上げたか」を競うフェーズに見える。だがQwenチームが2025年7月末に公開した GSPO(Group Sequenc…