タスクに熟練するほど、先々まで考えるようになる―ヒトの学びをAIで検討

複雑なタスクにおける意思決定では、熟練するほどに先々の段階まで考え、かつ注意深くなることが、AIモデルで明らかになった。このAIモデルは、米ニューヨーク大学のBas van Opheusdenらがボードゲームプレイヤーの行動を分析して開発したもので、詳細は「Nature」に2023年5月31日掲載された1

人間の知性の特徴は、将来に向かって複数のステップを計画する能力である。しかし、熟練した意思決定者が初心者に比べて、より先々の段階の選択まで計画し、それによって成功しているのかは、まだ結論が出ていない2-4。従来の認知科学では、計画の深さを測るタスクは単純すぎるし、一方、例えばチェスは複雑すぎて評価が難しかった。そこで今回、Opheusdenらは複雑なタスクにおける専門性と計画性の関連を調べるために、新たなタスク課題とAIモデルを開発し、検証した。

研究で採用したタスク課題は、四目並べというボードゲームである5。2人のプレイヤーが白黒のコマを盤上に交互に並べていき、先に4個のコマを一列に並べた方が勝ちというシンプルなルールだが、勝つためには何手も先を読む深い計画性を要求される。このゲームを行うための意思決定AIモデルは、コマの配置パターンを点数化してその出現回数をもとに選択するヒューリスティック探索と、ディシジョンツリーなどを組み合わせて構築された。また、人間の注意の欠如(見落とし)を模して、モデルが一手を指すごとに配置パターンをランダムに削除するなどの最適化も行った。

このAIモデルを検証するために、40人の人間にゲームをプレイしてもらい、そのデータをAIモデルに学習させて各プレイヤーのモデルパラメータ(配置パターンの重み付けや脱落、ディシジョンツリーの段階数など)を作成させた。その結果、このAIモデルは各プレイヤーの選択を約4割の精度で予測したほか*a、特定の局面に対する各プレイヤーの主観的な好みを捉えていた*b。また、チューリング試験として、人間の観察者にプレイヤーがAIか人間かを判定させたときの正答率は55.4%であり、このモデルは人間らしい決定をすると考えられた。さらに、人間のプレイヤー10人の目の動きを装置で追跡したところ、人間の着目の分布とAIモデルの探索の分布は有意に相関した*c。こうした結果から、人間はAIモデルと同様のアルゴリズムでディシジョンツリーを構築し、次の一手を計画していることが示唆された。

次に、熟練者と初心者の違いを検証した。まず、30人の人間にゲームを学習させたところ、繰り返しプレイするほどゲームに強くなる *dことが確認された。この強くなる過程において、意思決定プロセスのどの側面が影響しているのかを調べるために、今回のAIモデルを用いて計画深度(ディシジョンツリーの段階数)、注意の欠如(見落とし)、ヒューリスティックの質の3指標を評価した。その結果、プレイ回数が増えると計画深度が増してより先の手を読むようになり*e、かつ見落としは起こりにくくなる*fことが判明した。一方、ヒューリスティックの質はほとんど変化しなかった。同ゲームをオンラインでプレイした100万人以上のデータを用いて分析しても、実験室での検証と同様に、プレイ回数が増えるほどゲームの強さと計画深度が増し、見落としは減るとの結果が確認された。

著者らは、「本研究では、タスクに熟練すると計画性が向上し、また注意深くなるという、強固なエビデンスが示された。これは人間の計画性を正確に理解するための新しい知見となる可能性がある」と結論付けている。(編集協力HealthDay)

 

注釈
*a
40.8±1.4% accuracy、mean ± s.e.m. across participants、two-sample t-test against chance: t39 = 26、P<0.001。

 

*b
percentage of correct 2AFC(two-alternative forced-choice)=58.6±1.0%、t39=8.3、P<0.001。 correlation predicted-observed evaluations、ρ=0.377±0.039、t39=9.6、P<0.001 。

 

*c
mean correlation across participants、ρ=0.535±0.024、t9=21、P<0.001。

 

*d
ゲームの強さ、linear regression(n=30、β=21.6±4.6、P<0.001

 

*e
計画深度の変化、linear regression(n=30、β=0.255±0.061、P<0.001)。

 

*f
注意力低下、linear regression(n=30、β=−0.0119±0.0028、P<0.001)。

参考文献

  1. van Opheusden B., et al: Nature. 2023 May 31.
  2. Gobet, F. Thinking & Reasoning, 1997. 3(4). 291–313.
  3. Campitelli, G. & Gobet, F. J. Int. Comput. Games Assoc. 2004. 27. 209–216.
  4. Linhares, A., et al. Cogn. Syst. Res. 2012. 13. 72–86.
  5. Wei Ji Ma Lab Interactive Task Arena. https://weijimalab.github.io/(2023年10月24日閲覧)