「無料で落とせるモデル」が、コーディングで GPT-5.5 に並んだ ―― Kimi K2.6 を読む
オープンウェイトの巨大MoEが、コーディングでクローズドモデルに並ぶ意味を読む。
少し前まで、こう言うのが常識でした。「オープンソースの AI モデルは、無料で使えるのは良いが、本当に強いのは結局 OpenAI や Anthropic のクローズドなやつだ」と。
その常識に、はっきり穴を空けたモデルがあります。中国 Moonshot AI(月之暗面)が2026年4月20日に公開した Kimi K2.6 です。重みがダウンロードできる(オープンウェイト、Modified MIT ライセンス)のに、コーディングで GPT-5.5 に並んだ ―― これは「安いから使う」段階を越えて、「強いから使う」段階に入ったことを意味します。技術の中身を見ていきます。
まず、数字を正確に
中核のベンチマークから。
- SWE-bench Verified:80.2%。これは GitHub の実在の issue を実際に直せた率で、コーディング能力の中でも一番現実に近い指標です。80%台というのは、少し前までトップのクローズドモデルだけが届いていた領域です。
- SWE-bench Pro:58.6%。より難しいサブセットで、ここで GPT-5.5 と同点。
- ツール使用ありの Humanity’s Last Exam では 54.0% でリード。
「中国のオープンモデルが、最難関のコーディング評価で、GPT-5.5 と肩を並べた」――この一行は、誇張ではなく、複数の独立検証で確認できる事実になっています。
アーキテクチャ ―― 「1兆パラメータなのに、動かしやすい」仕掛け
技術的に面白いのは、その構造です。総パラメータは 1兆。普通なら「そんな巨大モデル、個人や中小企業には動かせない」と思うところですが、ここに MoE(Mixture-of-Experts) の妙があります。
K2.6 は 384 個のエキスパート(専門家サブネットワーク)を持ち、1トークンを処理するとき、そのうち 8個+共有1個だけが起動します。結果、総パラメータは1兆でも、実際に毎回計算に使われるのは320億(32B)パラメータぶんだけ。つまり「知識の総量は1兆ぶん持っているのに、推論コストは32Bモデル並み」という、いいとこ取りの設計です。
ほかにも、61層の Transformer、Multi-head Latent Attention(メモリ効率の良い注意機構)、SwiGLU 活性化、256K トークンのコンテキスト窓。一つ一つは派手ではありませんが、「巨大な知識量を、現実的なコストで回す」ための、堅実な選択の積み重ねです。
そして価格。API で 入力 100万トークンあたり $0.60、出力 $2.50(キャッシュヒット時は入力 $0.15)。クローズドのトップモデルと比べると、桁が一つ違うレベルの安さで、「コーディングのコストを88%削減できる」という主張も出ています。強さと安さが同時に来た、というのが K2.6 の衝撃の本体です。
一番の見どころ ―― 「300体の分身が、12時間働く」
K2.6 で私が一番注目したのは、賢さでも安さでもなく、Agent Swarm(エージェントの群れ)という能力です。
これは、一つのタスクに対して、最大300体の並列サブエージェントが、4000ステップの協調作業を同時に実行できる、というもの。前世代 K2.5 は「100体・1500ステップ」だったので、一気に3倍に拡張されています。そして、単一タスクで12時間連続稼働できる。
なぜこれが効くのか。大きなソフトウェア開発タスク ―― 例えば「このリポジトリ全体をリファクタリングして」 ―― は、一本の長い思考では処理しきれません。人間のチームなら、複数のエンジニアが分担して、並行して進めますよね。Agent Swarm は、それを AI 一体の中で再現しようとしている。300体の分身がタスクを分け合い、4000ステップにわたって協調し、半日かけて一つの大仕事を仕上げる。
「賢く一問一答する AI」から「チームのように分担して長時間働く AI」へ。前回紹介した Qwen3.7-Max の「35時間タスク」とも通じる、コーディングAIの主戦場が”持久力と並列性”に移っていることの、もう一つの強い証拠だと思います。
個人的な見方
このニュースの本質は、「また中国のモデルが強くなった」ではありません。「コーディングにおいて、オープンウェイトがクローズドに追いついた」という、業界全体の地殻変動です。
日本のエンジニアにとって、これは実利のある話です。これまで AI コーディングは、OpenAI や Anthropic の API に課金して使うのが基本でした。でも K2.6 は、重みが公開されていて、Modified MIT で商用利用でき、自社環境でも動かせる。データを外に出せない案件、コストを徹底的に抑えたい案件、自社コードで fine-tune したい案件 ―― これまでクローズド API では難しかった領域に、トップ級の選択肢が一つ増えた、ということです。
もちろん、ベンチマークの数字には自社・関連発表ぶんも含まれ、実運用での評価はこれからの部分もあります(そこは差し引いて読んでください)。それでも、「無料で落とせるモデルが、GPT-5.5 と並ぶコーディング力を持つ」という事実は、AI コーディングを日常的に使う私たちにとって、選択肢の地図を確実に書き換える出来事だと思います。中国 AI を「すごい」で眺めるのではなく、ダウンロードして、自分の現場で試せる――それが今のフェーズです。
(ベンチマーク数値・Agent Swarm の仕様・価格は Moonshot の公開情報および各種報道ベースで、独立検証が進行中の項目もあります。)
―― AI未来編集室「AIウォッチ」
← 一覧へ