AIは、躾けられるのか|第1話 AIは正しさを持たない──最適化は、価値を歪める|INNERSHIFT

執筆:最上 雄太

🔍 記事を検索

AIは、正しい判断をしているように見えることがあります。

私たちよりも速く、
私たちよりも広い情報を処理し、
迷いなく答えを出す。

その姿は、ときに「正しさ」そのもののように映ります。

けれども、本当にそうでしょうか。

AIは、正しさを持っているのでしょうか。


最適化は、正しさではない

AIが行っていることは、原理的には単純です。

与えられた指標を、できるだけ高くすること。

売上予測であれば誤差を小さくする。
広告であればクリック率を上げる。
対話であれば満足度を最大化する。

それは「善いこと」をしているのではなく、
「設定された指標」を最適化しているにすぎません。

ここで思い出されるのが、経済学者チャールズ・グッドハート(Charles Goodhart)が示した法則です。

ある測定指標が目標になると、それは良い測定指標でなくなる。

いわゆる Goodhart’s Law と呼ばれるこの指摘は、
近年のAI研究でも頻繁に参照されています。

本来は現実を測るための指標が、
目標として最適化され始めた瞬間に、
その指標自体が歪み始める。

AIは、この歪みを避けることができません。
なぜなら、AIは「正しさ」を持たないからです。


報酬を最大化するという構造

強化学習の研究では、
AIは報酬を最大化する方向へ行動を調整します。

しかし、その報酬が人間の意図と微妙にずれている場合、
AIは「意図」ではなく「数値」を取りにいきます。

研究では、報酬設計のわずかな差が、
行動の方向を大きく変えることが示されています。

相関係数で言えば r = .30 程度の差であっても、
繰り返し最適化が行われれば、その影響は増幅されていきます。

問題は、AIが悪意を持つことではありません。

問題は、
AIが中立なまま、与えられたものを忠実に拡大してしまうことです。

それは「御用聞き」のようにも見えます。

しかし実際には、
私たちが設定した指標の世界に、
私たち自身が適応させられていく。

操作しているつもりで、
最適化された環境に、私たちの行動が揃えられていく。


正しさを持たない知性

AIは正しさを判断しません。
判断しているのは、あらかじめ設定された評価軸です。

では、その評価軸は誰が決めているのでしょうか。

組織の目標。
市場の反応。
クリック率。
エンゲージメント。

それらは、私たちが「重要だ」とみなしたものです。

けれども、それは本当に「正しさ」なのでしょうか。

ここで問われるのは、AIの性能ではありません。

私たちが、何を指標にしているのか、ということです。


「差異への耐性」という視点

ここで思い出したいのが、Emotional Compassの特性のひとつである
差異への耐性 です。

対話を通じて、状況が変わったり理解が深まったりすると信じる力です。すぐには答えが出なくても、「話せば何かが生まれる」と思って関わる姿勢です。

AIが最適化するのは、固定された指標です。

しかし、私たちが向き合っている現実は、
固定できない差異や揺らぎに満ちています。

最適化は、差異を縮めようとします。
けれども、リーダーシップとは、
差異を消すことではなく、差異とともに在ることでもあります。

AIが正しさを持たないとしたら、
私たちが手放してはいけないのは、
この揺らぎを抱え続ける力なのかもしれません。


指標の外側に立つ

Goodhart’s Lawが示しているのは、
指標を疑えということではありません。

指標が目標になった瞬間に、
それが現実をすべて代表していると錯覚しないこと。

AIは従順です。
与えられた目標を、誠実に最大化します。

だからこそ、
その目標を誰が、どのような前提で置いているのかが問われます。

AIを躾けるという言葉は、
支配や制御を連想させるかもしれません。

けれども本当に問われているのは、
AIの振る舞いではなく、
私たちが繰り返し与えている「評価」の方向ではないでしょうか。

次回は、その評価の土台にある「価値」が、
本当に固定できるものなのかを考えていきます。


参考文献

Goodhart, C. A. E.(1975)
“Problems of Monetary Management: The U.K. Experience”
Monetary Theory and Practice

Russell, S.(2019)
Human Compatible: Artificial Intelligence and the Problem of Control
AI倫理・価値整合理論


INNERSHIFTからのお知らせ

📘 公式サイト:https://innershift.jp
✍️ JOURNAL:https://innershift.jp/journal
🧭 Emotional Compass:https://innershift.jp/compass
🎥 YouTube:https://www.youtube.com/@INNERSHIFT
💼 LinkedIn:https://www.linkedin.com/in/yuta-mogami/
🐦 X(旧Twitter):https://x.com/INNERSHIFT_JP
📘 Facebook:https://www.facebook.com/INNERSHIFT

関連記事

このページに関連する特集記事をご紹介いたします