作成者:Mike MacKenzie
AIを分類する枠組みのひとつに、「強いAI」と「弱いAI」があります。
弱いAIとは、人間の知性の一部分のみを代替し、特定のタスクだけを処理するもので、現代においては産業への利用が盛んです。
一方強いAIとは、人間のような自意識を備え、全認知能力を必要とする作業も可能なAIです。ターミネーターシリーズのスカイネットや、ドラゴンボールシリーズの人造人間など、物語の世界では登場していますが、現段階では実現に至っていません。
この強いAIを実現するにあたり難問だとされているのが、フレーム問題とシンボルグラウンディング問題です。
この記事では、シンボルグラウンディング問題の問題点や、具体例、身体性との関係について紹介します。
シンボルグラウンディング問題とは
シンボルグラウンディング問題とは、「記号で指し示されるものをAIがどのように認識するかという問題」です。記号接地問題とも言われます。記号(シンボル)が概念に接地(グラウンディング)されることなしには、記号処理が意味をなさないことを議論しています。
ここでいう記号とは、自然言語や静的イメージ、動的イメージのほかにも、動機や感情といった状態など、脳内の活動のあらゆる側面を含みます。
認知科学者のスティーブン・ハルナッド(Stevan Harnad)が1990年に提唱しました。
この問題は文献によりさまざまな表現がされています。
コンピュータには、記号の「意味」が分かっていないので、記号の操作だけで知能は実現できない。シンボルを、その意味するものと結びつける(グラウンドさせる)ことが必要であり、困難である。
出典:第一回:人工知能の概要とディープラーニングの意義(東京大学 松尾豊教授)
出典:松尾豊, 「AIの未解決問題とDeep Learning」, The 28th Annual Conference of the Japanese Society for Artificial Intelligence, 2014.
出典:UTokyo Online Education 学術俯瞰講義 2016 中島秀之
シンボルグラウンディング問題の具体例
具体的に、シンボルグラウンディング問題とはどのような問題でしょうか。
たとえば人間は、リンゴと言われると果物のリンゴの概念(赤い、固い、甘い…etc)を想像できます。これは、リンゴという記号がリンゴの概念に接地されているためです。シンボルグラウンディング問題を抱えるAIは、リンゴという言葉からリンゴの概念を想像することはできません。リンゴは「リ」「ン」「ゴ」というカタカナ3文字の記号でしかないのです。マレー語を知らない人が「epal」と言われても単なる記号でしかなく、リンゴの姿と結び付けられないことと同じです。
リンゴの例のほかに、シマウマの例もよく用いられます。縞模様と馬の概念がわかっている人は、シマウマという縞模様の馬がいると聞いていれば、初見でもシマウマを認識できます。一方AIは、「縞模様の馬」という記号とシマウマを結び付けることができません。
中国語の部屋
中国語の部屋とは、「機械は思考できるのか?」という問題意識から提案された質疑応答式のテストであるチューリングテストの反論として、言語哲学・心の哲学を専門とするアメリカの哲学者ジョン・サールが主張したものです。
この中国語の部屋は、記号が概念に接地することなしに記号処理が行われる具体例となっています。
以下がその手順です。
- 英語は理解できるが、中国語を理解できない人が部屋にいる
- 部屋の中には、中国語の文字を書いてあるとおりに置き換えると、中国語の受け答えができてしまう完璧なマニュアルがある
- 部屋の中の人に「中国語の質問」をする
- 部屋の中の人は、質問の意味は全くわからないがマニュアルに従って質問に答える
- 部屋の外から見れば、部屋の中の人に中国語の質問をしたら正しい答えが返ってきたことになる
部屋の中の人は、中国語を理解しているようにみえてもマニュアルに沿って記号処理をしているだけで、実際に中国語を理解しているわけではありません。
記号と概念を接地できないAIは、この部屋の中の人と同じです。 概念に接地せず行われる記号操作は知能とは言えません。
そのため、強いAIの実現にシンボルグラウンディング問題の解決が必要とされています。
シンボルグラウンディング問題と身体性
シンボルグラウンディング問題の解決には何が必要なのでしょう。
人間がどうやって記号と概念を結び付けているのかに目を向けて生まれたものが、身体性に着目したアプローチです。
人間は、身体を通して得た感覚を概念として、記号と結び付けていると考えることができます。
人間には身体があるからこそ物事を認知・思考できるという考えから、知能が成立するためには身体が不可欠であるという身体性に着目した考え方が生まれました。
この身体性に着目したアプローチは昔からありましたが、現実世界から概念を見極めるパターン認識の段階に課題があり、うまくいきませんでした。
しかし、ディープラーニングの登場で状況が変化します。ディープラーニングは、データから特徴量を自動で学習できます。つまり、現実世界の情報から特徴量という形で概念を獲得できます。
ディープラーニングによりパターン認識の精度が高まったことで、ディープラーニングとロボットの組み合わせという形での研究が行われるようになっています。
一方で、実世界の身体がなくとも、大量のデータから概念獲得や意味理解ができる可能性も生じ始めています。これは、身体を動かせない人でも大量の動画を見続ければ現象を理解できるのではないかという考え方です。
ディープラーニングを活用した技術には、文から画像を生成できるものがあります。「リンゴ」という文からリンゴの画像を生成できるため、人間が「リンゴ」という言葉からリンゴの姿を想像することと同様だととらえることもできます。
しかし、人間の「リンゴ」の概念は視覚的情報にとどまりません。甘いという味覚から得られる情報や、固いという感覚から得られる情報も含まれているでしょう。
ディープラーニングは、記号を概念の一部である視覚的情報と接地できる段階にあります。
課題もあるが解決に向け前進するシンボルグラウンディング問題
シンボルグラウンディング問題とは、記号で指し示されるものをAIがどのように認識するかという問題でした。ディープラーニング登場以前のAIは、記号と概念を結び付けることができませんでしたが、ディープラーニングは特徴量を自ら学習するため、人間とは異なりますが、ディープラーニングなりの概念を獲得できるようになりました。
美味しい、楽しいなど本能や感情に関する記号は接地できるか、人間に近い概念は形成できるかなど、シンボルグラウンディング問題に関する課題は残っていますが、自然言語処理や画像認識などの一部領域では、大量のデータから概念獲得や意味理解ができつつあるようです。
AI白書2017
深層学習教科書 ディープラーニング G検定(ジェネラリスト) 公式テキスト