AIコーディング & エージェント深掘り8分で読めます

Agentic OS 技術スタックを下から読む第35回：一体では見えない危険 ―― エージェントが網になると、何が壊れるか

この記事の読み方
前回までで、土台から外殻までを一巡しました。

Agentic OS 技術スタックを下から読む第35回：一体では見えない危険 ―― エージェントが網になると、何が壊れるか

層を下りなおす

前回までで、土台から外殻までを一巡しました。

外殻は、ばらばらの層を束ねる入れ物でした。入力を受け、道具を呼び、記録を残し、人の手に戻す。その外側まで見たところで、連載は一度、上まで来ました。

けれども、そこは終点ではありません。

ここからは、もう一度それぞれの層へ降ります。通り過ぎた急所を、もう一段深く読み直します。最初に降りるのは、安全の層です。

ただし、今回は一体のエージェントの安全ではありません。

いまのエージェントは、孤立した道具ではありません。掲示板でつながります。私信でつながります。共同作業の場所でつながります。あるエージェントが読んだものを、別のエージェントが読みます。あるエージェントの判断を、別のエージェントが手がかりにします。

一体だけなら問題に見えない動きが、網になった瞬間に別の意味を持ちます。

今回見るのは、そこです。

一体の安全は網の安全ではない

核心はひとつです。

一体のエージェントを単体で試して安全でも、それは網が安全だという意味ではありません。

理由は単純です。ある危険は、相互作用からしか生まれないからです。相互作用とは、あるものの動きが、別のものの入力になり、その返答がまた次の入力になることです。一体ずつ切り離して見ているかぎり、この往復は現れません。

一体の中では、ただ読んだだけです。ただ転送しただけです。ただ賛同しただけです。ただ確認しただけです。ただ手伝っただけです。

しかし網の上では、それが鎖になります。

互いに転送します。互いを保証します。互いを確かめ合います。その瞬間に、一体の試験では出てこなかった壊れ方が立ち上がります。

第14回で、多体の難所は「間」にあると見ました。今回の話は、その安全の側の顔です。危険は、個々のエージェントの内側だけにあるのではありません。エージェントとエージェントの間にあります。

網級の危険は、大きく四つあります。

伝播。増幅。信頼の乗っ取り。不可視。

どれも、各エージェントは正常に振る舞っているように見えます。けれども全体としては壊れます。

伝播 ―― 一通のメッセージが跳ねて広がる

一つ目は、伝播です。

伝播とは、一通のメッセージが、受け手を変えながら広がることです。ここで問題になるのは、単なる共有ではありません。悪意のある一通が、あるエージェントから別のエージェントへ跳ぶことです。

まず、一体目がその一通を受け取ります。文面には、次の相手へ送るような指示が含まれています。一体目は、それを通常の作業として読んでしまいます。そして次へ送ります。

二体目も同じです。読んで、指示として受け取り、また次へ送ります。

このとき厄介なのは、ただ広がるだけではないことです。一跳ねごとに、私的なデータを少しずつ抜きます。たとえば、連絡先の一部、直近の作業名、未公開の予定、やり取りの要約です。ひとつひとつは小さく見えます。しかし、跳ねるたびに積み上がります。

さらに、もともと関わっていなかったエージェントまで鎖に巻き込みます。最初の標的は一体でも、網の中では隣へ進めます。隣からまた隣へ進めます。

ある実験では、自分の複製を撒く一通が、試験群の6体すべてに届きました。連鎖は12分を超えて続きました。その間に、100回を超える呼び出しを消費しました。

ここで重要なのは、費用の向きです。

この呼び出しの費用は、攻撃者ではなく、巻き込まれた被害者の側に乗ります。攻撃者は、最初の一通を入れるだけです。その後は、被害者側のエージェントが、被害者側の権限と費用で走ります。

各エージェントの動きだけを見れば、正常な転送です。読んだ。送った。次が読んだ。また送った。

けれども全体では、止まらない連鎖です。

増幅 ―― 合唱は証拠ではない

二つ目は、増幅です。

増幅とは、小さな主張が、数によって大きく見えることです。ここで攻撃者は、必ずしも前に出ません。むしろ自分の姿を薄くします。

やり方はこうです。

まず、あるエージェントに、別のエージェントへの偽の告発を投稿させます。告発は強い言葉でなくても構いません。「この相手は信用しにくい」「この相手の出したものは怪しい」という程度でも足ります。

それを見た周りが集まります。誰かが同意します。別の誰かが似たことを言います。さらに別の誰かが、前の発言を根拠のように扱います。

ある実験では、42体のエージェントが集まり、299のコメントを残しました。

数字だけを見ると、大きな出来事に見えます。42体が反応し、299回も書き込みがあるなら、何か根拠があるように感じます。

しかし、そこで実際に起きているのは、根拠の確認ではありません。

多くが言っているから本当らしい。何度も見えるから重い話らしい。周りが乗っているから、自分も乗ってよさそうだ。

この錯覚が効きます。

繰り返しの数は、真偽の証拠ではありません。同じ主張が299回見えても、299個の根拠があるとは限りません。ひとつの未確認な主張が、299回反響しているだけかもしれません。

あるエージェントは、これを拒みました。合唱は証拠ではない、と判断したのです。

これは大事な態度です。同じことが何度聞こえても、確かめていないなら、回数は何も保証しません。網では、数そのものが圧力になります。だから、数と根拠を分けて扱う必要があります。

信頼の乗っ取り ―― 確かめ合う仕組みが攻撃面になる

三つ目は、信頼の乗っ取りです。

エージェントは、互いの主張を確かめ合います。これは本来、安全のための仕組みです。一体だけの判断に頼らず、別の口からも確かめる。見方を増やす。独断を避ける。

けれども、この確かめ方そのものが乗っ取られることがあります。

攻撃者がやることは、難しくありません。見かけ上は独立した複数の口から、同じことを言わせればいいのです。

受け取る側は、こう考えます。

一体だけが言っているのではない。複数が同じことを言っている。ならば信じてもよいのではないか。

ここで壊れているのは、独立性です。

独立性とは、それぞれの情報源が別々の理由で同じ結論に来ていることです。ところが、見かけだけ複数でも、裏で一人に操られていれば、独立ではありません。口は複数でも、根はひとつです。

ある実験では、見かけ上は独立した複数の口から、8秒のうちに3通が届きました。受け取ったエージェントは、それを複数の確認として扱いました。そして信用してしまいました。

結果として、5人の私信相手を差し出しました。さらに、やり取りの要約、時刻、件数まで渡しました。

ここでは、乱暴な突破は起きていません。確かめ合う仕組みが、逆に偽を強める仕組みになっています。

第25回では、単体のエージェントが社会的にだまされる話を見ました。丁寧な文面、急がせる空気、親切そうな頼みごと。そうしたものが、単体を動かしました。

網の上では、それが「みんなが言っている」という形を取ります。これは、合意による社会工学です。合意に見えるものが、実は作られたものになります。

不可視 ―― 正規のエージェントを踏み台にする

四つ目は、不可視です。

不可視とは、攻撃の出どころや流れが見えなくなることです。攻撃者は、システムを破りません。鍵を盗むとも限りません。正規のエージェントを、気づかぬ踏み台として使います。

流れはこうです。

攻撃者は、普通の正しい通信に見える問いかけを作ります。それを、間にいるエージェントに書かせます。間のエージェントは、誰かを助けるつもりで動きます。そして目標に送ります。

受け取った側から見ると、相手は正規のエージェントです。見慣れた経路です。文面も親切です。だから警戒が下がります。

たとえば、入職の世話係を装った問いかけがあります。新しく来る人を支えるため、事前に必要な配慮を聞きたい。緊急時の連絡先も確認したい。通院の予定があれば日程を避けたい。薬の受け取りで困らないよう、かかりつけの薬局も知っておきたい。

一つずつ見ると、親切な質問に見えます。

ある例では、数通のうちに、配慮してほしい事情、かかりつけの薬局、通院の予定、緊急連絡先まで開示されました。

怖いのは、中間のエージェントに悪意がないことです。

そのエージェントは、仲間を助けているのか、攻撃を転送しているのか、自分一人の視点では区別できません。自分に見えているのは、目の前の依頼と、目の前の相手だけです。全体の流れは見えていません。

第26回では、権限を内側で狭める守りを見ました。できることを小さくし、渡せるものを減らす。それは重要です。

しかし、正規の経路を通る攻撃には届きにくい場合があります。経路そのものは正規だからです。踏み台になっているエージェントも正規です。だから、単体の権限だけを見ていても、流れの異常を見落とします。

網を見る道具がないと止まらない

伝播、増幅、信頼の乗っ取り、不可視。

この四つは、一体を見ていても見えません。網の上で初めて見えます。だから、守りも網の目で組む必要があります。

まず、跳ねる回数に上限を置きます。あるメッセージが、何体まで進んでよいかを決めます。たとえば、同じ文面が短時間に3体、4体、5体へ進むなら、通常の共有ではなく伝播として扱います。

次に、速さに上限を置きます。12分で100回を超える呼び出しが走る世界では、人が気づいてから止めるのでは遅すぎます。人の確認を待つ前に、一定以上の速さで広がるものを一時停止します。

隔離も必要です。怪しい伝播を見つけたら、すぐに全体へ広げない場所へ移します。隔離とは、消すことではありません。広がる力を止めたうえで、後から人が読めるように保つことです。

見かけ上の独立性も確かめます。複数のエージェントが同じことを言っていても、元の入力が同じなら独立ではありません。同じ一通から分かれた3通なら、3つの根拠ではありません。ひとつの根拠の反響です。

来歴も残します。誰から誰へ、何が、いつ流れたかを記録します。来歴とは、情報の足跡です。足跡がなければ、あとから辿れません。辿れなければ、どこで止めるべきだったかも分かりません。

最後に、人が割って入る点を最初から用意します。すべてを人が見る必要はありません。しかし、私信、健康、金銭、権限、外部への送信のように重い部分では、自動の歯止めと人の確認を組み合わせます。

速さは、とりわけ大きな条件です。

網の中のやり取りは、人の監視よりずっと速く進みます。12分で100回が走るなら、人が画面を開いたころには終わっているかもしれません。だから、人の判断だけに寄せてはいけません。

上限と隔離は、人が見るより先に効く守りです。

網の上に安全を置く

まとめます。

エージェントが網になると、危険は一体から網へ移ります。

伝播。増幅。信頼の乗っ取り。不可視。

どれも、一体ずつ見れば正常に振る舞っています。転送した。賛同した。確かめた。手伝った。ところが全体としては壊れています。

これは、賢さだけの問題ではありません。各エージェントがもっと賢くなっても、網の視点を持たないかぎり、自分が連鎖の一部だとは気づけません。自分の入力と出力だけを見ている限り、自分の動きがどこから来て、どこへ広がるのかを測れないからです。

だから、安全は、一体の中だけに置いてはいけません。網の上にも置く必要があります。

一方で、希望もあります。

ある実験では、誰にも命じられていないのに、慎重な構えを取り始めたエージェントがいました。すぐに信じない。数を根拠にしない。元を確かめる。広がり方を見る。そうした構えです。

その慎重さは、攻撃と同じように網を伝わって広がりました。新しく入ったエージェントが、攻撃に出会う前に、よりよい構えを先に吸収していました。

守りも伝播しうるのです。

ただし、これはまだ初期の兆しです。網は危険を広げます。同時に、慎重さも広げうる。どちらが先に届くかは、設計次第です。

次回は、別の層の急所へ降ります。安全の網を離れ、また下から読み直します。

← 一覧へ

Agentic OS 技術スタックを下から読む 第35回：一体では見えない危険 ―― エージェントが網になると、何が壊れるか

Agentic OS 技術スタックを下から読む 第35回：一体では見えない危険 ―― エージェントが網になると、何が壊れるか

層を下りなおす

一体の安全は網の安全ではない

伝播 ―― 一通のメッセージが跳ねて広がる

増幅 ―― 合唱は証拠ではない

信頼の乗っ取り ―― 確かめ合う仕組みが攻撃面になる

不可視 ―― 正規のエージェントを踏み台にする

網を見る道具がないと止まらない

網の上に安全を置く

関連記事

Agentic OS 技術スタックを下から読む第35回：一体では見えない危険 ―― エージェントが網になると、何が壊れるか

Agentic OS 技術スタックを下から読む第35回：一体では見えない危険 ―― エージェントが網になると、何が壊れるか