「賢さ」より「燃費」で勝負するモデル ―― 阶跃の Step 3.7 Flash が面白い
速さ・安さ・Agent実戦性能から、モデル競争が「燃費」へ移る流れを読む。
AIモデルの話って、だいたい「どれだけ賢いか」で語られますよね。でも、実際にエージェントを毎日動かしてる人ほど、別のところが気になってるはずです。「これ、トークン代いくらかかるんだ?」「遅くて待ってられない」 ――そっち。
中国の阶跃星辰(StepFun)が5月29日に開源した Step 3.7 Flash は、まさにそこを狙ってきたモデルです。同社自身が「烧钱時代(金を燃やす時代)のためのAgentモデル」と言ってる。賢さの自慢じゃなくて、速くて安くて、ちゃんと動くを看板にしてる。ここが今っぽい。技術の中身を見ていきます。
まず、何が「速い・安い」を支えてるのか
数字から。総パラメータ 198B(196Bの言語バックボーン+1.8Bの視覚エンコーダ)。でも、1トークンを処理するとき実際に動くのは 約11Bだけ。スパースな MoE(Mixture-of-Experts)なので、「知識は198Bぶん持ってるのに、計算は11Bモデル並み」という構造です。
その結果が、最大 毎秒400トークンの生成速度。これがエージェント用途では効きます。エージェントって、一回の応答で終わりじゃなくて、ツールを呼んで、結果を読んで、また考えて…と何十ターンも回す。一回一回が遅いと、全部積み重なって「待ってられない」になる。速度はエージェントにとって、ぜいたく品じゃなくて必需品なんですよね。
価格も出てます。国内プラットフォームで、入力(キャッシュヒット時)100万トークンあたり0.27元。output で8.1元。クローズドのトップモデルと比べると、桁が違う安さです。
そして地味に賢いのが、推論の深さを3段階(低・中・高)で選べること。簡単なタスクは「低」で速く安く、難しいタスクだけ「高」でじっくり。全部に全力を出さない、という割り切りが、コスト意識そのものです。
エージェント実戦ベンチで、DeepSeek を上回った
「安かろう悪かろう」じゃないか?という疑問には、ベンチマークが答えています。
エージェント能力を測る ClawEval-1.1 で 67.07%。これは DeepSeek V4 Flash(57.80%)も DeepSeek V4 Pro(59.80%)も上回る数字です。コーディングの SWE-Bench Pro は 56.26%(前世代 3.5 Flash の 51.3% から向上)、Terminal-Bench 2.1 も 59.55% に伸びている。
しかもこれ、視覚も分かるマルチモーダルモデルです。UI、グラフ、ドキュメント、画像、アプリ画面みたいな「複雑な視覚情報」を読んで、構造化された結果やコード、実行可能なタスクに変換できる。つまり「スクショを見て、その通りに操作するエージェント」みたいな使い方ができる。
ライセンスは Apache 2.0。重みは Hugging Face で公開、256K のコンテキスト。そして Claude Code や OpenClaw、Hermes Agent といった主流のエージェント開発ツールと互換。クラウドでもローカルでも動く。「すぐ自分の環境に挿せる」ところまで含めての公開、というのが今の中国オープンモデルの定番の出し方になってます。
個人的な見方
去年までのモデル競争は、「ベンチマークで何点取った」の殴り合いでした。でも Step 3.7 Flash みたいなモデルが出てくると、潮目が変わってきたのが分かります。競争軸が「賢さ」から「燃費」に移ってる。
理由ははっきりしてて、エージェントが本番(プロダクション)に入り始めたからです。実験室で一回賢く答えるのと、毎日何万回もツールを呼び続けるのは、まったく違うコスト構造になる。後者だと、1トークンの単価と1回の応答速度が、そのままサービスの採算を決める。だから今、各社が「速い・安い・でもちゃんと賢い」を競い始めてる。
日本でエージェントを実装しようとしてる人にとって、これは普通に実利のある話です。トップのクローズドAPIは賢いけど、本番で回し続けるとコストが効いてくる。そこに、Apache 2.0 で自分の環境に置けて、Claude Code とも繋がる、エージェント特化の選択肢が一つ増えた。賢さの上限を借りるんじゃなくて、毎日回せる現実的なエンジンとして見ると、こういうモデルの価値が分かります。
派手な「最強モデル誕生」みたいなニュースの陰で、こういう「燃費のいいモデル」が静かに増えてる。私が最近いちばん見てるのは、そっちです。
(ベンチマーク数値・速度・価格は阶跃星辰の公開情報および各種報道ベースで、独立検証が進行中の項目もあります。)
―― AI未来編集室「AIウォッチ」
← 一覧へ