AIコーディング & エージェント深掘り4分で読めます

「無料で落とせるモデル」が、コーディングで GPT-5.5 に並んだ ―― Kimi K2.6 を読む

この記事の読み方
オープンウェイトの巨大MoEが、コーディングでクローズドモデルに並ぶ意味を読む。

少し前まで、こう言うのが常識でした。「オープンソースの AI モデルは、無料で使えるのは良いが、本当に強いのは結局 OpenAI や Anthropic のクローズドなやつだ」と。

その常識に、はっきり穴を空けたモデルがあります。中国 Moonshot AI（月之暗面）が2026年4月20日に公開した Kimi K2.6 です。重みがダウンロードできる（オープンウェイト、Modified MIT ライセンス）のに、コーディングで GPT-5.5 に並んだ ―― これは「安いから使う」段階を越えて、「強いから使う」段階に入ったことを意味します。技術の中身を見ていきます。

まず、数字を正確に

中核のベンチマークから。

SWE-bench Verified：80.2%。これは GitHub の実在の issue を実際に直せた率で、コーディング能力の中でも一番現実に近い指標です。80%台というのは、少し前までトップのクローズドモデルだけが届いていた領域です。
SWE-bench Pro：58.6%。より難しいサブセットで、ここで GPT-5.5 と同点。
ツール使用ありの Humanity’s Last Exam では 54.0% でリード。

「中国のオープンモデルが、最難関のコーディング評価で、GPT-5.5 と肩を並べた」――この一行は、誇張ではなく、複数の独立検証で確認できる事実になっています。

アーキテクチャ ―― 「1兆パラメータなのに、動かしやすい」仕掛け

技術的に面白いのは、その構造です。総パラメータは 1兆。普通なら「そんな巨大モデル、個人や中小企業には動かせない」と思うところですが、ここに MoE（Mixture-of-Experts） の妙があります。

K2.6 は 384 個のエキスパート（専門家サブネットワーク）を持ち、1トークンを処理するとき、そのうち 8個＋共有1個だけが起動します。結果、総パラメータは1兆でも、実際に毎回計算に使われるのは320億（32B）パラメータぶんだけ。つまり「知識の総量は1兆ぶん持っているのに、推論コストは32Bモデル並み」という、いいとこ取りの設計です。

ほかにも、61層の Transformer、Multi-head Latent Attention（メモリ効率の良い注意機構）、SwiGLU 活性化、256K トークンのコンテキスト窓。一つ一つは派手ではありませんが、「巨大な知識量を、現実的なコストで回す」ための、堅実な選択の積み重ねです。

そして価格。API で 入力 100万トークンあたり $0.60、出力 $2.50（キャッシュヒット時は入力 $0.15）。クローズドのトップモデルと比べると、桁が一つ違うレベルの安さで、「コーディングのコストを88%削減できる」という主張も出ています。強さと安さが同時に来た、というのが K2.6 の衝撃の本体です。

一番の見どころ ―― 「300体の分身が、12時間働く」

K2.6 で私が一番注目したのは、賢さでも安さでもなく、Agent Swarm（エージェントの群れ）という能力です。

これは、一つのタスクに対して、最大300体の並列サブエージェントが、4000ステップの協調作業を同時に実行できる、というもの。前世代 K2.5 は「100体・1500ステップ」だったので、一気に3倍に拡張されています。そして、単一タスクで12時間連続稼働できる。

なぜこれが効くのか。大きなソフトウェア開発タスク ―― 例えば「このリポジトリ全体をリファクタリングして」 ―― は、一本の長い思考では処理しきれません。人間のチームなら、複数のエンジニアが分担して、並行して進めますよね。Agent Swarm は、それを AI 一体の中で再現しようとしている。300体の分身がタスクを分け合い、4000ステップにわたって協調し、半日かけて一つの大仕事を仕上げる。

「賢く一問一答する AI」から「チームのように分担して長時間働く AI」へ。前回紹介した Qwen3.7-Max の「35時間タスク」とも通じる、コーディングAIの主戦場が”持久力と並列性”に移っていることの、もう一つの強い証拠だと思います。

個人的な見方

このニュースの本質は、「また中国のモデルが強くなった」ではありません。「コーディングにおいて、オープンウェイトがクローズドに追いついた」という、業界全体の地殻変動です。

日本のエンジニアにとって、これは実利のある話です。これまで AI コーディングは、OpenAI や Anthropic の API に課金して使うのが基本でした。でも K2.6 は、重みが公開されていて、Modified MIT で商用利用でき、自社環境でも動かせる。データを外に出せない案件、コストを徹底的に抑えたい案件、自社コードで fine-tune したい案件 ―― これまでクローズド API では難しかった領域に、トップ級の選択肢が一つ増えた、ということです。

もちろん、ベンチマークの数字には自社・関連発表ぶんも含まれ、実運用での評価はこれからの部分もあります（そこは差し引いて読んでください）。それでも、「無料で落とせるモデルが、GPT-5.5 と並ぶコーディング力を持つ」という事実は、AI コーディングを日常的に使う私たちにとって、選択肢の地図を確実に書き換える出来事だと思います。中国 AI を「すごい」で眺めるのではなく、ダウンロードして、自分の現場で試せる――それが今のフェーズです。

（ベンチマーク数値・Agent Swarm の仕様・価格は Moonshot の公開情報および各種報道ベースで、独立検証が進行中の項目もあります。）

―― AI未来編集室「AIウォッチ」

← 一覧へ