AIは正しさを持たない。
第1話では、そのことを確認しました。
AIは与えられた指標を最適化するだけであり、
その指標が価値を代表しているとは限らない。
では、その指標の背後にある「価値」は、
どのように決められているのでしょうか。
もし価値そのものが揺れているとしたら、
AIは何に整合しようとしているのでしょうか。
Alignmentという問い
AI研究の世界では、「Alignment(アライメント)」という言葉が使われます。
それは、
AIが人間の価値と整合するように設計されること
を意味します。
この問題を正面から扱ってきたのが、
カリフォルニア大学バークレー校の研究者
Stuart Russell です。
ラッセルは著書
Human Compatible: Artificial Intelligence and the Problem of Control
の中で、こうした前提を置きます。
AIは、あらかじめ固定された目的関数を持つべきではない。
むしろ、人間の価値を不確実なものとして推定し続ける存在であるべきだ。
ここで示唆されているのは、
技術的な問題というよりも、
価値の不確実性そのものです。
価値は一枚岩ではない
私たちは、AIに「正しい判断」をしてほしいと望みます。
しかし、その「正しさ」は誰のものでしょうか。
効率を重視する人もいれば、
公平を優先する人もいる。
短期的成果を重んじる人もいれば、
長期的影響を重視する人もいる。
組織の中でも、社会の中でも、
価値は一枚岩ではありません。
ラッセルが提起するAlignmentの難しさは、
AIの性能の問題ではなく、
人間側の価値が揺れていることにあります。
AIは、何に整合すればよいのか。
私たち自身が一致していないものに、
どう整合すればよいのか。
不確実性を前提にするという設計
Alignment研究の重要な視点のひとつは、
人間の価値を「確定的なもの」として扱わないことです。
AIは人間の好みや行動から価値を推定しますが、
その推定は常に暫定的であり、不完全です。
これは、ある意味で誠実な前提でもあります。
AIは正しさを知らない。
だからこそ、学習し続けるしかない。
しかしここで、ひとつの問いが立ち上がります。
AIが推定する価値は、
私たちが本当に望んでいるものなのでしょうか。
それとも、私たちがその場で示した反応を
単に拡大しているだけなのでしょうか。
「内省継続力」という視点
ここで思い出したいのが、Emotional Compassの特性である
内省継続力 です。
日常の中で、自分のふるまいや気持ちを振り返る習慣を持ち続ける力です。昨日よりも今日、今日よりも明日へと、自分との対話を続ける姿勢が支えになります。
AIが人間の価値を推定し続ける存在だとすれば、
私たちが示している振る舞いや判断は、
そのまま学習素材になります。
もし私たちが、自分の価値を固定的なものとして扱い、
振り返ることをやめてしまったらどうなるでしょうか。
AIは、その固定された反応を拡大します。
しかし、私たちが内省を続け、
価値の揺らぎを引き受け続けるならば、
AIの整合もまた、変化し続けるはずです。
Alignmentは、
技術の問題であると同時に、
私たちの態度の問題でもあります。
固定できないものと向き合う
価値は、固定できるものではありません。
状況によって変わり、
経験によって更新され、
対話によって深まります。
AIに完全な整合を求めることは、
ある意味で、私たち自身に完全な一貫性を求めることでもあります。
けれども、人間は揺れる存在です。
だからこそ、
揺れていることを前提にした関わり方が必要なのかもしれません。
Alignmentは、
「完全に合わせる」ことではなく、
「ずれ続けることを前提にする」設計なのではないでしょうか。
次回は、そのずれをどう扱うのか、
そして「躾」という言葉がどこまで有効なのかを考えていきます。
参考文献
Russell, S.(2019)
Human Compatible: Artificial Intelligence and the Problem of Control
AI倫理・価値整合理論
INNERSHIFTからのお知らせ
📘 公式サイト:https://innershift.jp
✍️ JOURNAL:https://innershift.jp/journal
🧭 Emotional Compass:https://innershift.jp/compass
🎥 YouTube:https://www.youtube.com/@INNERSHIFT
💼 LinkedIn:https://www.linkedin.com/in/yuta-mogami/
🐦 X(旧Twitter):https://x.com/INNERSHIFT_JP
📘 Facebook:https://www.facebook.com/INNERSHIFT