Agentic OS：技術スタックを下から読む

AIコーディング & エージェント深掘り

Agentic OS 技術スタックを下から読む第0回：エージェント基盤はなぜ OS に近づくのか

この一年で、「エージェント」という言葉の重心が変わった。

モデル・推論基盤深掘り

Agentic OS 技術スタックを下から読む第1回：推論のコストは、黒板で逆算できる

Agentic OS を下から読むなら、最初に見るべきものはモデルの賢さではない。推論の値段と速度である。

モデル・推論基盤深掘り

Agentic OS 技術スタックを下から読む第2回：GPU を遊ばせない ―― 非同期の連続バッチ処理

前回は、推論のコストをどこから見るかを整理した。大きく効いているのは、計算そのものだけではない。重みを読むメモリ帯域、同時に処理するリクエスト数、途中結果を持ち続けるための領域が、生成の速度と費用を決めていた。

モデル・推論基盤深掘り

Agentic OS 技術スタックを下から読む第3回：一枚に載らないモデルを、どう分けて配るか

前回までは、モデルが一枚の GPU に収まっているものとして話を進めてきた。

モデル・推論基盤深掘り

Agentic OS 技術スタックを下から読む第4回：KV キャッシュを小さくする ―― 頭を減らすか、圧縮するか

前回までで、推論コストの見え方を下から見てきた。

モデル・推論基盤深掘り

Agentic OS 技術スタックを下から読む第5回：過去のどこまでを見るか ―― 固定窓と、学習で選ぶ注意

前回は、長文脈の値段を決める KV キャッシュを、モデル構造の側から小さくする方法を見た。

モデル・推論基盤深掘り

Agentic OS 技術スタックを下から読む第6回：層をまたいで使い回す ―― 効率化は、近似との取引である

前回まで、長い文脈を扱うときに何が重くなるのかを見てきた。

モデル・推論基盤深掘り

Agentic OS 技術スタックを下から読む第7回：大半を、もっと軽い仕組みに置き換える ―― ハイブリッドという組み立て

前回まで、長い文脈を扱うときの工夫を見てきた。

モデル・推論基盤深掘り

Agentic OS 技術スタックを下から読む第8回：考える力は、どう教えられたか ―― 検証できる答えで鍛える

ここまで数回は、モデルを効率の側から見てきた。

モデル・推論基盤深掘り

Agentic OS 技術スタックを下から読む第9回：答える時間を、もっと使う ―― 推論時に計算を足す

前回は、考える力をどう鍛えるかを見た。

モデル・推論基盤深掘り

Agentic OS 技術スタックを下から読む第10回：世界モデルとは何か ―― 次の「状態」を予測し、想像の中で試す

第8回では、モデルに考える力をどう鍛えるかを見た。第9回では、答えを出す時間に計算を足すことで、推論を強くする考え方を見た。

AIコーディング & エージェント深掘り

Agentic OS 技術スタックを下から読む第11回：手を動かさせる前に ―― サンドボックスという「縛られた実行環境」

ここまでの回では、主にモデルそのものを見てきた。

AIコーディング & エージェント深掘り

Agentic OS 技術スタックを下から読む第12回：エージェントの記憶 ―― 保存ではなく「なぜそうしたか」を残す

前回は、エージェントに手を動かさせるための実行環境を見た。

AIコーディング & エージェント深掘り

Agentic OS 技術スタックを下から読む第13回：一体から複数へ ―― 難所は「間」にあり、実行ツリーで見る

前回まで見てきたのは、一体のエージェントをどう安全に走らせるかだった。

AIコーディング & エージェント深掘り

Agentic OS 技術スタックを下から読む第14回：段を重ねるほど崩れる ―― 信頼性の崖と、編成の型

前回は、複数のエージェントが動くとき、その難しさは個々の点よりも「間」に出る、という話をした。

AIコーディング & エージェント深掘り

Agentic OS 技術スタックを下から読む第15回：道具の呼び出しは、分散システムへの呼び出しである

前回は、L4 の編成を「長い鎖を短く区切る」ものとして見た。

AIコーディング & エージェント深掘り

Agentic OS 技術スタックを下から読む第16回：注入攻撃 ―― なぜ、データを読むだけで乗っ取られるのか

ここまでの数回で、エージェントを「賢い」だけのものから、「任せられる」ものへ近づけてきた。

AIコーディング & エージェント深掘り

Agentic OS 技術スタックを下から読む第17回：注入をどう防ぐか ―― 指示とデータの、硬い境界

前回は、注入がなぜ効くのかを見た。

Agentic OS 技術スタックを下から読む 第0回：エージェント基盤はなぜ OS に近づくのか

Agentic OS 技術スタックを下から読む 第1回：推論のコストは、黒板で逆算できる

Agentic OS 技術スタックを下から読む 第2回：GPU を遊ばせない ―― 非同期の連続バッチ処理

Agentic OS 技術スタックを下から読む 第3回：一枚に載らないモデルを、どう分けて配るか

Agentic OS 技術スタックを下から読む 第4回：KV キャッシュを小さくする ―― 頭を減らすか、圧縮するか

Agentic OS 技術スタックを下から読む 第5回：過去のどこまでを見るか ―― 固定窓と、学習で選ぶ注意

Agentic OS 技術スタックを下から読む 第6回：層をまたいで使い回す ―― 効率化は、近似との取引である

Agentic OS 技術スタックを下から読む 第7回：大半を、もっと軽い仕組みに置き換える ―― ハイブリッドという組み立て

Agentic OS 技術スタックを下から読む 第8回：考える力は、どう教えられたか ―― 検証できる答えで鍛える

Agentic OS 技術スタックを下から読む 第9回：答える時間を、もっと使う ―― 推論時に計算を足す

Agentic OS 技術スタックを下から読む 第10回：世界モデルとは何か ―― 次の「状態」を予測し、想像の中で試す

Agentic OS 技術スタックを下から読む 第11回：手を動かさせる前に ―― サンドボックスという「縛られた実行環境」

Agentic OS 技術スタックを下から読む 第12回：エージェントの記憶 ―― 保存ではなく「なぜそうしたか」を残す

Agentic OS 技術スタックを下から読む 第13回：一体から複数へ ―― 難所は「間」にあり、実行ツリーで見る

Agentic OS 技術スタックを下から読む 第14回：段を重ねるほど崩れる ―― 信頼性の崖と、編成の型

Agentic OS 技術スタックを下から読む 第15回：道具の呼び出しは、分散システムへの呼び出しである

Agentic OS 技術スタックを下から読む 第16回：注入攻撃 ―― なぜ、データを読むだけで乗っ取られるのか

Agentic OS 技術スタックを下から読む 第17回：注入をどう防ぐか ―― 指示とデータの、硬い境界

Agentic OS 技術スタックを下から読む第0回：エージェント基盤はなぜ OS に近づくのか

Agentic OS 技術スタックを下から読む第1回：推論のコストは、黒板で逆算できる

Agentic OS 技術スタックを下から読む第2回：GPU を遊ばせない ―― 非同期の連続バッチ処理

Agentic OS 技術スタックを下から読む第3回：一枚に載らないモデルを、どう分けて配るか

Agentic OS 技術スタックを下から読む第4回：KV キャッシュを小さくする ―― 頭を減らすか、圧縮するか

Agentic OS 技術スタックを下から読む第5回：過去のどこまでを見るか ―― 固定窓と、学習で選ぶ注意

Agentic OS 技術スタックを下から読む第6回：層をまたいで使い回す ―― 効率化は、近似との取引である

Agentic OS 技術スタックを下から読む第7回：大半を、もっと軽い仕組みに置き換える ―― ハイブリッドという組み立て

Agentic OS 技術スタックを下から読む第8回：考える力は、どう教えられたか ―― 検証できる答えで鍛える

Agentic OS 技術スタックを下から読む第9回：答える時間を、もっと使う ―― 推論時に計算を足す

Agentic OS 技術スタックを下から読む第10回：世界モデルとは何か ―― 次の「状態」を予測し、想像の中で試す

Agentic OS 技術スタックを下から読む第11回：手を動かさせる前に ―― サンドボックスという「縛られた実行環境」

Agentic OS 技術スタックを下から読む第12回：エージェントの記憶 ―― 保存ではなく「なぜそうしたか」を残す

Agentic OS 技術スタックを下から読む第13回：一体から複数へ ―― 難所は「間」にあり、実行ツリーで見る

Agentic OS 技術スタックを下から読む第14回：段を重ねるほど崩れる ―― 信頼性の崖と、編成の型

Agentic OS 技術スタックを下から読む第15回：道具の呼び出しは、分散システムへの呼び出しである

Agentic OS 技術スタックを下から読む第16回：注入攻撃 ―― なぜ、データを読むだけで乗っ取られるのか

Agentic OS 技術スタックを下から読む第17回：注入をどう防ぐか ―― 指示とデータの、硬い境界