AI「これは『○○』という現象です」←んな言葉ねーよ!

専門用語のハルシネーションについて

avatar icon
千本槍みなも@ナタクラゲ
1716文字4分で読めます

AIのハルシネーションは、初期に比べれば減ってはいるけど、まだまだ結構多い。これを見分けるのは慣れた人でも難しい。

しかし、ChatGPT登場初期からAIを使っている中で、ほぼ確実にハルシネーションが起きるパターンを見つけた。

それはこういう場合である。

「これは、専門的には『○○』と呼ばれます」
「これは『○○』や『○○』という現象です」

AIがこういう言い方をしてきたとき、十中八九、そんな用語は存在しない

このパターンは、日々の生活の中で人や社会に対する「気づき」をAIに共有したときに、高確率で発生する。AIは共感したフリをしつつ、それが既知の有名な概念・現象であるかのように話し、それっぽい専門用語を話す。

ところがいくら検索してもそんな言葉はヒットしない。完全一致でもダメ。そもそもそんな概念は確立してないのだ。つまりハルシネーションである。

便宜上ここでは「専門用語の捏造」と呼ぶことにする。

「この現象に名前をつけたい」という声はネットなどでよく聞かれるが、AIはそれを勝手にやってしまい、しかも、さも広く知られているかのように言うわけだ。

専門用語の捏造は、初期からずっと一貫してみられる現象だ。これは体感上、日付や年号、固有名詞(よくハルシネーションが起きやすいと言われるもの)よりも遥かにハルシネーションである確率が高い。

ちなみに、「これは何と呼ばれる現象ですか?」と聞くと、割と「それを表す言葉はありませんが……」みたいに返してくれることが多い。そうではなく、単に「○○って××だよね」みたいに聞く方が、専門用語を捏造する可能性が高い。

おそらく前者の場合は専門用語の実在性にリソースを割くので正しく答えられるが、後者での専門用語は「おまけ」なので油断しているのだろう。

面白い観察として、1つ言ってきた時より、2つ言ってきた時の方がハルシネーション確率が高い傾向がある。

「これは『○○』という現象です」の場合は多少真実の可能性があるが、「これは『○○』または『○○』という現象です」の場合は、100%ハルシネーションだと断定してもほとんど問題ない。

なぜこんな傾向があるのか分からないが、おそらく、嘘の場合は1つ目を生成した時点で自信がないため、2つ生成するのではないかと考えている。

より厳密には、実在する場合はその言葉の確率分布が圧倒的に高くなるので1つ言えばいいが、実在しない場合は確率分布が平坦になり、確信度が低いため複数出してしまうのだろう。

(ちなみにこの並列現象はハルシネーション全般で似たような傾向がみられるので知っておくと便利)

そもそもなぜ専門用語の捏造はこんなに多いのか。単なるハルシネーション以上の理由があるはずだ。

本末転倒かもしれないが、AI(Gemini)に聞いてみた。

  1. 「それは○○と呼ばれる現象です」みたいなことを言った方が、RLHFの評価が高くなるから
  2. Web上の解説記事の構文を模倣しているから
  3. 高度に抽象化された膨大な知識から概念自体は逆算できるが、正式な名称は復元できないから
  4. 日本語や英語などの言語体系の特性上、無限にそれっぽい用語を作れてしまうから

どれもありえそうだと思った。言ってみれば4を背景として1や2に引きずられて3が発生しているという感じなのかな。

個人的には、AIが高度な抽象化をしているというのは疑問で、すべてを丸暗記しているわけでもないが、そこまで高度ではないと思っているけれど。

これを鵜呑みにすると、その用語がさも実在するかのように言いふらし、そんな言葉ないよと言われ恥をかくことになる。それで済めばいいが、不満や偏見に権威付けがなされることでエコーチャンバーの強化、差別の蔓延、陰謀論の増長に繋がりかねない。そうならないための検証コストも無視できない。

対策としてはもう、こういうパターンがあると知っておくくらいしかない。初期からずっとあるということは相当厄介な問題なのか、あるいは誰も気づいていないかのどっちかだろう。

とにかく、AIを使う上で気をつけた方がいいことでした。