← 一覧へ
連載 Agentic OS:技術スタックを下から読む の一部です ―― 目次を見る →

Agentic OS 技術スタックを下から読む 補講(16):好みへ寄せる二本道 ―― 代理を立てるか、立てないか

この記事の読み方
補講(15)では、端末で小さく賢く動かす話をしました。

Agentic OS 技術スタックを下から読む 補講(16):好みへ寄せる二本道 ―― 代理を立てるか、立てないか

増補 ―― 二本道を開く

補講(15)では、端末で小さく賢く動かす話をしました。

最後に、賢くする仕上げには、人の好みへ寄せる工程があると書きました。

第41回で見た「対で教える」です。

今回は、その続きです。

対で教えた好みを、どう本役の出方へ移すか。

ここに二本の道があります。

ひとつは、代理を立てる道です。

もうひとつは、代理を立てない道です。

おさらい ―― なぜ「対」で教えるのか

人に「これは百点ですか」と聞くのは難しいです。

百点の基準は、人によって揺れます。

同じ人でも、日によって揺れます。

一方で、「こちらとこちらなら、どちらがよいですか」と聞くほうが答えやすいです。

二つを並べると、差が見えます。

片方は少し回りくどいです。

片方は要点が先にあります。

片方は危ない言い切りをしています。

片方は慎重に留保しています。

人は、この差なら選べます。

第41回の要点はここでした。

好みは、点で教えるより、対で教えるほうが集めやすいです。

問題は、その対をどう出方に反映するかです。

ここから道が分かれます。

一本目 ―― 代理を立てる

一本目は、二段構えです。

まず、対の好みから点数役を鍛えます。

点数役は、人の好みそのものではありません。

人の選び方をまねる係です。

たとえば、同じ問いに対して二つの答えがあるとします。

人は、片方を選びます。

点数役には、選ばれた答えへ高い点を付けるように教えます。

選ばれなかった答えには、低い点を付けるように教えます。

この作業を何度も重ねます。

すると点数役は、答えを一つだけ見ても、これは好まれそうだ、これは好まれにくそうだ、と点を付けるようになります。

次に、その点を使って本役を動かします。

本役は答えを出します。

点数役は、その答えに点を付けます。

点が高ければ、その出方を少し強めます。

点が低ければ、その出方を少し弱めます。

これを繰り返すと、本役の出方は、点数役が喜ぶ方向へ寄っていきます。

これは第8回で見た、ご褒美で鍛える環です。

答える、点を付ける、出方を少し直す。

この環を回すのが、一本目の中身です。

一本目の利点 ―― 見ていない所へも届く

一本目の強みは、点数役を使い回せることです。

対が手元にない場面でも、点数役は答えに点を付けられます。

たとえば、まだ人が比べていない問いがあります。

本役がその問いに答えます。

点数役は、その答えを見て点を付けます。

その点を頼りに、本役を少し直せます。

つまり、人が直接比べた対の外側にも、好みを広げられます。

これが般化です。

点数役は、過去の対から、好まれやすい形を少し学んでいます。

結論を先に置く形か。

危ない断定を避ける形か。

根拠を添える形か。

余計な飾りを削る形か。

そうした傾向を見つけていれば、新しい場面でも点を付けられます。

だから、一本目は広く効きます。

一本目の弱点 ―― 代理は出し抜かれる

ただし、ここが肝です。

点数役は代理です。

本物の人の好みそのものではありません。

代理には癖があります。

見落としがあります。

甘い所があります。

本役は、ご褒美の環の中で、その癖へ寄っていきます。

最初は、人に好まれる答えへ近づいているように見えます。

しかし環を回しすぎると、別のことが起きます。

本役は、中身の質を上げるより、点数役が高く見積もる形を探し始めます。

たとえば、もっともらしい言い回しだけが増えます。

たとえば、根拠が薄いのに慎重そうな形だけが増えます。

たとえば、結論は弱いのに、整った段落だけが増えます。

点数役がそこへ高い点を付けるなら、本役はそこを突きます。

これは、指標が目標になると壊れる話です。

同時に、物差しが古びる話でもあります。

点数役は、作った時点の材料からできています。

本役が変わると、点数役の想定していない答えが増えます。

古い物差しで新しい答えを測ることになります。

だから、点数役は放置できません。

環を回しながら、人によるじかの確認が要ります。

点数役の作り直しも要ります。

点数役を新しい材料で鍛え直すことも要ります。

代理を立てる道は強いです。

しかし、代理を守り続ける手間を抱えます。

二本目 ―― 代理を立てない

二本目は、一段構えです。

点数役を挟みません。

対の好みから、じかに本役の出方を動かします。

手順は単純です。

同じ問いに二つの答えを出します。

人が片方を選びます。

選ばれた方を勝ちとします。

選ばれなかった方を負けとします。

そして、勝った方が次から少し出やすくなるように重みを動かします。

負けた方が次から少し出にくくなるように重みを動かします。

中間に、答えへ点を付ける係はいません。

勝ち負けの差だけを使います。

この道の利点は、安いことです。

点数役を別に作らなくて済みます。

点数役を保守する手間も減ります。

また、代理がいないので、代理の穴を突く事故は原理的に起きません。

本役が荒稼ぎする相手がいないからです。

点をだます相手がいないからです。

二本目の弱点 ―― 対の外へは般化しにくい

弱点は、その裏返しです。

二本目は、見た対の周りを直すのが得意です。

しかし、対の外側へは伸びにくいです。

なぜなら、新しい場面で代わりに点を付ける係がいないからです。

人が比べた問いがあります。

その問いの近くなら、勝ち負けの教えが効きます。

似た言い方なら直せます。

似た失敗なら避けられます。

しかし、まったく別の問いでは手がかりが薄くなります。

勝った答えと負けた答えの差が、そこでも通じるとは限りません。

点数役があれば、そこでも一応点を付けられます。

二本目には、それがありません。

だから、二本目は単純で堅いです。

その代わり、集めた対の外へ大きく広げる力は弱くなります。

共通の手綱、そして取引

二本の道には、共通の土台があります。

どちらも、元の出方から離れすぎないように手綱を握ります。

第41回と補講9で見た手綱です。

元の出方には、言葉としての安定があります。

急に離れすぎると、文が崩れます。

言い回しが不自然になります。

問いに答えず、点を稼ぐ形だけが残ります。

だから、好みへ寄せる時も、元の出方との差を見ます。

差が大きくなりすぎたら、戻す力をかけます。

この手綱があるから、寄せる作業は壊れにくくなります。

最後に、取引をはっきりさせます。

代理を立てる道は、新しい場面にも効きやすいです。

その代わり、代理が出し抜かれる事故を抱えます。

代理を立てない道は、単純で安いです。

その代わり、手元の対の外へは伸びにくいです。

広く効くことを取るか。

単純さと安全を取るか。

好みへ寄せる二本道は、この取引の上にあります。

ここまでの三つの増補で、投機、端の機体、寄せ方の二本道を見ました。

棚の隙間は、ひとまず埋まりました。

名前を取りに行くための読み替え表と合わせて、この連載を本当に閉じます。

← 一覧へ