チューリングテストとは? 2014年「合格」疑惑の意味と真相・AIにもたらす影響を解説

このエントリーをはてなブックマークに追加

コンピュータと人間を分かつものは何でしょうか。もし人間のような自然な受け答えをコンピュータが実現したら、そのコンピュータは「人間の脳と同じになった」といえるのでしょうか。

このような問いに答える手段のひとつとして、数学者アラン・チューリングが開発したチューリングテストが知られています。チューリングテストは人工知能研究の分野で長らく使われてきました。

2014年6月8日、あるスーパーコンピュータの回答が、審査員の30%以上に「人間である」と判断され、史上初のチューリングテスト合格を果たしました。しかし、この快挙に対して「チューリングテストに合格したとは認めがたい」という反論が著名な専門家たちから出るなど、テスト合格を疑問視する声が上がっています。

そもそもチューリングテストとはどういうもので、一体どのような議論がされているのでしょうか。詳しく解説します。

チューリングテストとは?

チューリングテストとは、1950年にイギリスの数学者アラン・チューリングが「機械は思考できるのか?」という問題意識から提案した質疑応答式のテストです。

1950年頃、イギリスの研究者たちは「機械は思考できるのか」という問いについて研究していました。しかし、研究は難航を極めます。「機械」「知能」の用語の定義を明確に述べなければならず、統計的な調査に頼らざるを得なくなり、結論づけることは困難だったからです。

用語の定義などに意味はない、と考えたチューリングは「機械は思考できるか」という問いについて考えるのではなく、「機械が人間的であるか」どうかを判定するためにチューリングテストを考案しました。

参考:Computing Machinery and Intelligence.Mind 49:433-460A.M.Turing(1950)

チューリングテストの目的

チューリングテストの目的は「機械が人に近い振る舞いができるかどうかを判別すること」です。

チューリングテストで判別できることは「テストを通して、審査員が人間とコンピュータを判別し間違えたら、そのコンピュータは人間並みの知能を持っているかのような振る舞いができた」ということです。

「機械に知能があるかどうか、思考しているかを判別する」ことがテストの目的ではないことが今後の議論で重要になってきます。

チューリングテストの具体的なテスト方法

チューリングテストの方法は以下の通りです。

  • 人間の審査員が、1人の人間と1つのプログラムに対し会話をする
  • このときの条件は、
    1. 人間もプログラムも、審査員に人間と思われるように会話をする
    2. 実験の参加者は全員隔離されているので、会話の内容以外からは相手を判断できない
  • 会話を終えて、審査員が人間とプログラムを区別することができなければ、そのプログラムは合格。つまり「人間並みの知能を持っている」とみなせる


Ledge.ai編集部にて作成

2014年「チューリングテスト合格」疑惑と問題点

Photo by Free-Photos on Pixabay

疑惑の合格」といわれ、チューリングテストが注目を集めるきっかけとなった2014年のチューリングテスト合格について詳しくみていきましょう。

2014年6月8日、英国レディング大学で実施された実験において、ウクライナ在住の13歳の少年という設定の「Eugene Goostman」というプログラムを、審査員の30%以上が「人間である」と判断し、チューリングテストに初めて合格しました。

チューリングテストの合格基準
チューリングが1950年の論文「COMPUTING MACHINERY AND INTELLIGENCE」内で「50年ほど経てば、5分程度の質疑応答では、質問者は対話相手が人間かコンピュータかを70%も当てられないだろう」と述べていることから、質問者の30%以上が、対話相手が人間かコンピュータか判断がつかないことが、チューリングテストの合格の一つの基準とされています。

しかし、Eugene Goostmanの合格は「疑惑の合格」と言われています。

チューリングテストは審査員を騙しているだけ?

人工知能研究の世界的権威であるレイ・カーツワイル氏は、テストの形式について以下のように指摘しています。

  • 「ウクライナ在住の13歳の少年、しかも英語を母語としていないためネイティブな英語が使えない、という設定により、審査員が質問を制限される」
  • 「5分程度なら審査員を欺くことはできる」

すなわち、チューリングテストのやり方は人に近い振る舞いができているかどうかを判定するのに適していないという批判です。

他にも合格が疑問視される理由として、以下の点が指摘されています。

  • 「対話ができるだけでは、人間並みの知能があるとはいえない」
  • 「話題を限定しない対話というのは現実的にはかなり不自然だ」

しかし前述のとおり、チューリングテストの目的は人に近い振る舞いができるかどうか判別することです。

そのため、今回の合格に対して「合格したからといって機械が思考しているとは言えない」と主張することは、実験の目的からずれているといえるでしょう。

チューリングテストへの反論「中国語の部屋」

2014年の実験以前にも、チューリングテストに対する反論はありました。代表的なものが、言語哲学・心の哲学を専門とするアメリカの哲学者ジョン・サールの「中国語の部屋」という主張です。

以下がその手順です。

  1. 英語は理解できるが、中国語を理解できない人が部屋にいる
  2. 部屋の中には、中国語の文字を書いてあるとおりに置き換えると、中国語の受け答えができてしまう完璧なマニュアルがある
  3. 部屋の中の人に「中国語の質問」をする
  4. 部屋の中の人は、質問の意味は全くわからないがマニュアルに従って質問に答える
  5. 部屋の外から見れば、部屋の中の人に中国語の質問をしたら正しい答えが返ってきたことになる

つまり、「中国語の受け答えができる」だけでは、中国語を理解しているとは言えません。

同様に、知能があるような受け答えができるかを調べるチューリングテストだけでは、本当に知能があるかどうかは分からないというのがこの主張です。

チューリングテストを実施する意味


Photo by geralt on Pixabay

批判や反論を見ていくと、チューリングテストを行うことは、機械の知能を測るのに適切な実験ではないように思われるかもしれません。

では、チューリングテストを行うことに意味はないのでしょうか。チューリングはなぜこのテストを行ったのでしょうか。

公立函館みらい大学の教授でAI(人工知能)基礎・パターン認識について研究している松原仁氏は、チューリングテストは「知能の客観的な定義」として重要な位置づけになっていると述べています。

人工知能の目的が「機械に人間並みの知能をもたせる」ことであると、一旦設定されれば、チューリングテストに合格する機械を開発することが具体的な目標になる。

これによって「知能とはなにか」という問いに対して一定の定義ができたことになる。

不毛になりがちな知能にまつわる議論を、実りあるものにするというチューリングの目的はかなり達成されたといえる。
チューリングの意図は、完全な知能の定義を提唱したものではなく、「知能とはなにか」という抽象的な問を、具体的な問にブレークダウンすることにある。

(「チューリングテストとは何か」2011松原仁 P.42,43より抜粋)

そもそも知能には明確な定義がないとも言われます。そのためチューリングテストに合格したからといって「機械が知能を持つ」とは断言できませんが、「チューリングテストに合格する」という具体的な目標を設定することで、我々が「知能とは何か」という議論を進めることができます。

多くの専門家や私たちが、こうやって議論していること自体が、チューリングの狙いだったのかもしれません。

2014年「チューリングテスト合格」がAIに与えた影響

先に述べたとおり、チューリングテストを通じて様々な議論がされることで、AI(人工知能)の発展に大きく貢献していることは事実です。

このままAIの進化が続けば、AIが人間の能力を超えるシンギュラリティ(技術的特異点)が2045年に来るともいわれています。

今回取り上げたチューリングテストにおいて「Eugene Goostman」が実際に審査員を騙すことができたことは、AIの進化がシンギュラリティに近づいた第一歩かもしれません。

AIが人間を超えるかどうかは定かではありませんが、チューリングが私たちにそうさせたように、この議論を通じて「知能とは何か」「人間とは何か」に対して理解が深まることを期待したいです。