Hearing X COLUMN [4] 身体技能のあくなき上達をめざして（後編）

COLUMN 2019.12.11 | HOME > COLUMN

生物心理学者の岡ノ谷一夫さんは、学習には情動が不可欠であり、情動の喚起のカギを握るのは「場の共有」だという。ゆえに、現在、普及しつつあるMOOCはまだ不十分だと指摘する。さらに、現在、岡ノ谷さんが手がける「言語進化学」の研究における鳥やラットを使った研究の話を通じて、学びの本質について語り合った。

学びには、「場の共有」が不可欠である

—前編では、主に岡ノ谷さんの語学の習得について伺いましたが、その中で情動が重要であるというお話がありました。その情動というのは、恋愛のようにプラスの感情であっても、指導教官を言い負かすようなマイナスの感情であっても、効果的だということでしょうか？

岡ノ谷　はい、どちらも効くと思います。学習においてもっとも重要なのは覚醒度の高さなんですね。なぜなら、感情を喚起する情動価には、プラスとマイナスの両方がありますが、感情は情動価と覚醒度によってつくられるものだからです。やはり眠い状態では学べませんし、生存の危機を感じるとか、なんとしても仲良くなりたいといった状態、つまり覚醒した状態が大事になります。

たとえば、小鳥が歌を学ぶとき、お父さんの歌を単に録音機で再生しただけでは、脳のドーパミンニューロンは活動しません。ところが、お父さんの歌を再生する際に、お父さんが小鳥のそばにいるだけで、音に対してドーパミンニューロンが賦活することがわかっています。つまり、社会的な覚醒度が上がった状態じゃないと、歌への情報自体が小鳥には入っていかないのです。

柏野　社会的である必要があるのでしょうか？

岡ノ谷　さまざまな研究がありますが、どうやら社会的である必要があるようです。というのは、動画で鳥のお父さんの姿を見せても賦活しないからです。つまり、学ぶ側がなんらかのインタラクションを感じないと、学習はうまくいかないのです。

—最近はMOOC（Massive Open Online Courses＝ムーク）など、インターネットを介した動画によるオンライン講座が普及してきていますね。今のお話だと、対面の授業よりも学習効果が薄いということになりそうですが……。

岡ノ谷　まさにそのMOOCについて私は否定的に捉えていて、より効果的な仕組みを考えるべきだと、研究費の申請をしたことがあるのです。残念ながら、申請は通りませんでしたが。MOOCは数万人単位の人が受講できますが、実際に修了する人というのはほんの数パーセントなんですね。その理由はやはりインタラクションにあると思います。

もちろん、何らかの方法でMOOCにインタラクティブな仕掛けを取り込むことは可能だとは思いますが、私自身は、単なる仕掛けを超えた「何か」が必要なのではないかと。おそらくそこには、「場を共有する」という、技術的にはなかなか解決できない問題があると考えています。

「場を共有する」というのは、その気になれば、抱きしめたり殴ったりできる、という環境にある、ということです。もちろん実際には、教育の場でそんなことはしませんが、潜在的にはそういう可能性のある場が学習には必要なのではないか、と考えているのです。もちろん、MOOCで高解像度な画像を送ることはできるし、なんらかのインタラクティブな仕掛けを付加することはできるでしょう。しかし、可能性としての抱擁とか、殴打の機能をつけることは不可能です。

では、アバターなら代用できるのか。やはり、アバターが人間と同様の感覚を享受できない限り難しいでしょう。なんらかの方法で場の共有が可能になれば、MOOCはもっと役立つし、普及するのではないかと思っています。

場の正体を究める研究の重要性

柏野　「場の共有」の仕掛け云々の前に、現状は、インタラクティブな仕掛け自体がまだまだ不十分ですよね。ご承知のように、言語獲得のプロセスについては、ワシントン大学のパトリシア・クール教授の実験が有名ですが、言葉を学ぶ際、幼児にビデオでモノを見せただけではダメで、インタラクティブな行為が必要であることを示しています。たとえば、親がモノを指差しながら名前を言うといったジョイントアテンション（共同注意）が必要だという。そうしたインタラクティブな仕掛けを検討していく必要がありそうですね。

岡ノ谷　Skypeなんて、視線の位置も合いませんからね。自分が視線を動かしたところで、相手の視線は動かない。多方面から撮像した映像を用いてホログラフィ化することで視線の問題は解決するかもしれませんが、それで学習効果が上がるのかどうか、根源的な疑問があります。むしろ、画像などの精度は高くなくても、場を共有できる状態をつくることができれば、学習効果はもっと上がる気がします。やはり、ポイントは場の共有だと思うんですね。もっとも、MOOCでそれを言ったらおしまいですが……（笑）。

柏野　おっしゃるように、高解像度の映像があればいいかというと、そういうわけではないと思います。むしろ脳の情動系に入ってくる情報というのは、空間的な解像度は低かったりする。だから受け取る映像が必ずしも高精細である必要はなくて、何かインタラクションの本質を捉えるような仕掛けがあればいいだけなのかもしれない。それが時間的なシンクロナイズなのか、空間的な方向の一致なのか、具体的にはわかりませんが、それこそが「場」の正体なのかもしれませんね。

岡ノ谷　そうそう！　だから「場の正体を究める」という基礎研究が必要なんです。現在のMOOCには、それが足りないと思っています。

じつは私がMOOCに関心を持ったのは、以前、共同で論文を書いた、言語学者でマサチューセッツ工科大学の教授を務める宮川繁先生が数年前に東京大学の特任教授を兼務されて、MOOCの教材づくりをなさっていたからなのです。

ちょうどその頃、私は、スタンフォード大学で人気の機械学習のMOOCを受講したばかりで、MOOCの限界を感じていたんですね。これを一人で全部やるのはしんどい、こんなものを見るくらいなら、本を読んだ方が早いと思ったのです。本を読む行為には、内発的な動機付けが不可欠です。それが現状のMOOCにはありません。高解像度の映像を送ることは大事かもしれませんが、むしろ、内発的動機付けを促すために何をすべきかを見極めることのほうが大事だと思っています。

したがって、現状のMOOCというのは、内発的動機付けが非常にうまくできる人にとっての有用なツールであって、万人の教育に役立つものではないと思っています。

—本は自分のペースで読み進めることができますが、動画を視聴するのはイライラすることがありますね。

柏野　まさにいま、コンプライアンスや法務に関する社内研修の多くがWebの動画学習になっていて、毎回、イライラします（笑）。紙に書いてあれば一瞬で理解できるし、理解した箇所は飛ばし読みもできますが、動画の場合、その時間の分だけ拘束されてしまう。最後に100点満点を取らないと修了できないのですが、まったく頭に入ってこなくて……。インタラクティブ性は一切なく、一方的に視聴させられるだけだから余計に苦痛です。

岡ノ谷　僕も理化学研究所のチームリーダーを非常勤でやっていますが、同じ状況です。動画をちゃんと見たかどうかまでチェックされます。重要なことだというのはわかりますが、これによって消費される時間がどれだけあるかと思うと、気が遠くなる……。もっと、ほかに効率的な方法がないのかと。

遠隔での教育はまだまだ課題があるということです。その課題については、基礎研究をきっちりやるべきでしょうね。

小鳥の歌の学習から人間言語の起源を探る

柏野　岡ノ谷さんのご研究の話も伺いたいと思います。岡ノ谷さんは、小鳥の歌の進化とその機構などから人間言語の起源について探究されてきたわけですが、鳥の歌の学習と人間言語の学習は、どこまで連続性があると考えていらっしゃいますか？

岡ノ谷　発声の学習の部分について、つまり発話の音韻の学習については、連続性があると思っています。音韻の学習については、鳥はかなりいいモデルになる。しかし、おそらくそこまでです。私は鳥の歌（さえずり）の研究をしていますが、鳥には歌だけではなく、状況と強く結びついた、つまり、意味をもった鳴き声である「地鳴き」もあります。一部の研究者は、鳥が鳴き声を組み合わせて、新しい意味をつくっているとおっしゃっていますが、そこはまだまだ研究の余地がある。新しい組み合わせに対して単に応答が出ないので、新しい意味ができたかのように研究者が解釈している可能性があります。

どういうことかというと、その研究者たちの実験によれば、A＋Bという違った鳴き声の組み合わせで「危険だ、逃げろ！」という意味を表す音があって、その音を入れ替えてB＋Aにして鳥に聞かせたところ、鳥が逃げなかったのだという。だから、A＋Bという正しい語順ではなくなったので、無視したのだと結論づけているのです。しかし、そもそも鳴き声の順番を入れ替えたら全体的に音響レベルで違う音になってしまうわけで（AもBも時間軸が反対になる）、鳥にとってはAとBの意味の違いを理解して、AとBが入れ替わったと感じているのかどうかはわかりません。単に知らない音だと認識した可能性があります。

私も、ジュウシマツの歌の研究で文法構造について調べていますが、私の言う文法というのは、一つひとつは意味を持たない音要素の組み合わせのことなんですね。私の研究では、その音要素を文法的に配列する行動が進化することを示したわけですが、あくまでも「有限状態文法」に限定しています。だから、鳥の鳴き声が人間の発話学習のモデルになり得るのは、音韻レベルまでだと思っているのです。

柏野　音韻レベルであっても、どこまで汎化できるのかというのは非常に興味があります。

岡ノ谷　鳥は基本的に相対音感を持ちません。音と意味が連合しているのです。だから、音程を変えると意味は変わってしまう。人間のように、声の高さが違っていても、同じ意味をもつ発声であるとして認識することは、鳥にはできません。

柏野　そこは非常に面白いところで、人間とAIの比較でもそうなのですが、学習の過程で、どれだけ一般的で、より上位のルールを導き出せるのか、あるいは知らない問題に直面した際にいかに汎化できるか、というのが、学びの一つの試金石になりますよね。

鳥に汎化を学ばせることはできるのか？

柏野　たとえば、自閉スペクトラム症の方の場合は、汎化が難しく、フレキシブルに対応するということが苦手な人が多いんですね。誰がしゃべっていても、少々アクセントが違っていても、早口でも、ゆっくりしゃべっても、同じ単語であると認識できるのは汎化のなせる技です。それをどこまで進化論的に遡れるのか、というのは非常に興味深い。鳥では難しいということですよね。

岡ノ谷　もっとも、鳥も訓練によっては汎化を学ばせることは、できるかもしれません。いま、まさにその実験をやっているところなのです。

じつは僕は、そういう反自然的な実験は非常に嫌だったんですよ。だからこれまではやってこなかったわけですが、言語の起源に興味を持つ中で、どこまで訓練で植え付けることができるのか、というのは非常に大きな興味なのです。

柏野　それは挑戦的な試みですね。私は、動物を使った実験をしている人は大きく分けると二種類いると思っているんですね。岡ノ谷さんのように動物の鳴き真似をするような動物好きの人は、まず動物の生態が念頭にあって、そこに関わる脳機能を調べようとする人が多い。

一方、電気工学系出身の人に多く見られますが、動物も機械のように一つのシステムとして捉える人たちがいる。こういう入力をしたらこういう出力が得られた、といってそれを解析するわけですね。だから動物の脳のニューロンを調べる際も、あたかもシステムやアンプと同じように解析しようとする。両者はアプローチがまったく異なるわけです。

ところが今回は、こういう入力をしたらどういう出力が出るのかを調べようとされているわけで、まさにあちら側、つまりシステムとして捉える流派の人たちと同じことをしよう、とされているわけですね。

岡ノ谷　そう、僕はあくまでも動物が自然に行う行動のしくみが知りたくてこれまで研究をしてきたんですね。ただ、言語の起源に迫ろうとすると、これまでのアプローチだけでは難しいと考えています。というのも、そもそも動物のコミュニケーションである鳴き声が進化して人間の言語になったと考えるには、非常に大きな跳躍があるからです。何か大きなジャンプがない限り、鳥の鳴き声が人間の言語に進化することはあり得ません。

そのジャンプが何だったのかが知りたい。それを、人間は特殊だということを前提にしないで説明したいのです。なぜなら、そもそも人間自体も、言語も、進化の産物だからです。

そこでいま、動物にどこまで不自然なことを教え込むことができるかに興味を持ってやっています。もっとも、最初からシステムとして捉えている人たちとは視点はかなり違います。

柏野　そこは重要なポイントですね。コウモリのエコロケーション（超音波の反響を用いた物体認知）に関する研究をされた菅乃武男先生や、メンフクロウの音源定位の研究をされた小西正一先生などは、動物の自然な行動に即した実験をやってきたからこそ素晴らしい業績を上げてこられたと思っています。

一方で、単にシステムの解析だと捉えてきた人たちの研究の中には、先ほど岡ノ谷さんが例に挙げられたように、動物に何か聞かせて、何か反応を調べたりしているけれど、それが本当に何を意味しているのか、他の捉え方ができるのではないか、と思うような結果が少なくありません。

しかし今は、ディープラーニングなどを活用することもできるようになってきましたし、自然な行動を調べるだけでなく、前編で出てきたソーシャルなプレッシャーと学習の関わりなど、動物行動学者だからこそできる新たな実験があると思っています。そこは私もたいへん興味があるところです。

岡ノ谷　極端なことを言えば、メカニズム偏重で研究をしてきた人は、ラットを使って二つの音を聞き分けさせたときに脳で何が起きているかを調べると言って、200Hzと500Hzの音を聞かせたりするわけですね。ところが、それは意味がないわけですよ。だって、ラットは10 kHz以上の音じゃないと、聞こえないわけですから（笑）。

僕らの実験では、ラットが穴に鼻を突っ込んで場所を覚えるという習性を使ったり、22kHzの音はラットが辛いときに出すディストレスコール（忌避音）だから使わないようにしたりと、いろいろ工夫をしています。やはり、まずその動物についてよく知るということが非常に重要なんですね。

柏野　私がやっているスポーツ脳科学も同じなんですね。これまでの運動研究というのは、計測機器の限界もあって、限られた特殊な状況と条件のもとで、動きや反応を調べていたわけですが、その結果は、日常的な運動の延長線上にはない、ということが多かったのです。つまり、意味のある環境で、意味のある動きをする、となると話が違ってくる。

もちろん、前者の研究も意味のある研究ですし、私自身はシステム的なモノの捉え方をする方なので、その研究の意義もよくわかります。一方で、リアルワールドでの運動や反応にもたいへん興味があって、そこをあえて結びつけようとしているのが、まさにスポーツ脳科学プロジェクトの挑戦なのです。

だいたい、トップアスリートの計測なんて、基礎研究をやっている人たちからしたら暴挙ですからね。動きも反応も複雑すぎて、測れるわけがない、というわけです。ただ自分は、動物行動学の人たちのアプローチを見てきたからこそ、基礎的なものと実践的なものの両方を見なければ、見えてこない関連性があると思っているのです。

もっとも、リアルな問題をただそのまま観察していても埒が明かないところもあります。どうやって実験に落とし込むかが、知恵の出しどころだと思っています。

一生をかけて、腑に落ちるまで研究を続けたい

—今後のご研究の展望についてもお聞かせください。

岡ノ谷　いま、文部科学省の新学術領域研究において、「共創的コミュニケーションのための言語進化学」という領域の代表をやっているんですね。この中で、言語がどのような生物学的な適応のもとに、いつごろ始まり、どのようなメカニズムを経て現在の形になり、さらに将来どのように変化していくのかを解明していこうとしています。加えて、現代のコミュニケーション問題を考察しつつ、未来のコミュニケーションツールについても考えようとしています。

その中で二つの柱として挙げたのが、「階層性を操る能力」と、「意図を共有する能力」です。この両方があって初めて言語ができたのではないかと考えているからです。従来、階層性を操る能力については、言語学者のノーム・チョムスキーを中心とする生成文法学派が論じてきたわけですが、意図の共有については言及してこなかったんですね。一方で、認知心理学者のマイケル・トマセロは、何かを指差すとか、視線を向けるといった動作によって他者と同じものに注意を向ける、いわゆるジョイントアテンションによって、意図の共有ができるようになり、そこから言語が現れたと主張しています。

そして我々は、この両方をなんとか融合できないかと考えています。それをできるだけ単純なストーリーで語りたいとは思っていますが、人間の性質に関して、単純なストーリーで説明することが正しいかどうかはわかりません。いずれにせよ、小鳥を使って系列操作、ネズミを使って意図の共有を解明する実験を行なっているところです。

また、防音室を使って、音楽心理学的な取り組みもしています。音楽というのは、情動を動かすと同時に、階層性に基づく芸術であることから、意図共有と階層性の融合に関して、何らかの示唆を与えてくれるのではないかと思っています。

すでに成果も出ていて、小鳥が歌を上達させるためには、ただ親鳥の歌を聞いているだけではダメで、自分で歌わないとダメだということを突き止めたんですね。

具体的には、小鳥が歌い出そうとするときに、わざとケージを揺らして歌うのを邪魔する仕掛けをつくって調べました。そして、本来、歌の学習に適した時期（学習臨界期）に歌えなかった個体と、それでもなんとか歌った個体と、邪魔をしないで普通に歌って育った個体を比べたところ、発声練習の経験量によって歌の成熟度が違うことが明らかになりました。

なお、見本となる歌を聞かせすぎると、今度は逆に下手になるということもわかっています。これは、ニューヨーク私立大学の別の研究グループの研究成果ですが、学習の刺激は1日15分くらいにしておかないとダメだという。理由はまだわかっていませんが、おそらく聞かせすぎると、環境雑音のようになってしまって、注意が向かなくなるのではないかと思います。

ただし、親鳥は雛鳥の学習に最適な時間だけ歌うわけではありません。もっとたくさん歌う。求愛のために歌うから、しょうがないですよね。

いすれにしても、歌わないとダメだし、聞きすぎてもダメ、ということ。やはり身体能力の上達には、適切な学習が必要だということです。

ちなみに、この研究の原点にあるのは、この宇宙の中で、私という存在が一瞬しか存在しないというのが腑に落ちない、という思いなんですね。もし、言語の起源や意識の起源がわかったら、どうして自分がこういう特異的な意識を持っているのか、ということも腑に落ちるかもしれません。死ぬまでに腑に落ちるといいのですが、もし死ぬ前に腑に落ちたと感じるとしたら、腑に落ちるように自分の思考が変わったということなのかもしれませんけどね……（笑）。

柏野　確かに、腑に落ちたときが死ぬ時でしょうね。

岡ノ谷　そう、だから腑に落ちたら死んでしまうかもしれないので、当面は腑に落ちないよう気をつけます（笑）。

柏野　まぁ、そう簡単には腑に落ちませんよ。だから、一生ではちょっと足りない気がします。

岡ノ谷　テレビ番組を見ていたら、ある研究者が出てきて、「最初は別の問題を手がけていたのだけれど、これは一生では終わらないと思ったので、解く問題を変えました」と言っていて、びっくりしたことがあります。一生で足りない問題にぶち当たったからといって、問題自体を変えることなんてできるのか、と。僕はそんなの嫌ですね。

柏野　私の場合は、最初から一生では解けないと思っていますけどね。

岡ノ谷　でも、研究費の申請書にそんなこと書けないでしょう？（笑）

柏野　そりゃそうだ（笑）。まぁ、腑に落ちなくても、少しずつわかるだけでも十分に楽しめます。

岡ノ谷　そうですね。だから、私も研究がどんどん楽しくなってきています。できるだけ腑に落ちないように気をつけながら、最後までもがきたいですね。それと、リュートがもっと上手になりたい（笑）。

柏野　私も野球をがんばります（笑）。今日は長時間にわたり、ありがとうございました。

（取材・文＝田井中麻都佳）

Top

岡ノ谷一夫 [ Kazuo OKANOYA ]
生物心理学
» 岡ノ谷研究室Website

栃木県足利市生まれ。慶應義塾大学文学部卒業後、米国メリーランド大学大学院で博士号取得。千葉大学助教授、2004年理化学研究所脳科学総合研究センター生物言語研究チーム・チームリーダー。2008年ERATO情動情報プロジェクト総括を兼任、2010年より東京大学総合文化研究科教授。小鳥の歌の進化と機構から、人間言語の起源についてのヒントを得る研究で知られている。また、近年では動物とヒトの比較研究から、言語と感情の起源を探っている。

柏野牧夫 [ Makio KASHINO ]
人間情報科学・認知神経科学
» Website
» スポーツ脳科学プロジェクト

1964年岡山生まれ。1989年、東京大学大学院人文科学研究科修士課程修了。博士（心理学）。 NTTフェロー (NTT コミュニケーション科学基礎研究所柏野多様脳特別研究室室長)、東京工業大学工学院情報通信系特定教授、東京大学大学院教育学研究科客員教授。著書に『音のイリュージョン～知覚を生み出す脳の戦略～』（岩波書店、2010）、『空耳の科学―だまされる耳、聞き分ける脳』（ヤマハミュージックメディア、2012）他。

学びには、「場の共有」が不可欠である

場の正体を究める研究の重要性

小鳥の歌の学習から人間言語の起源を探る

鳥に汎化を学ばせることはできるのか？

一生をかけて、腑に落ちるまで研究を続けたい

RELATED CONTENTS

SERIES