―ノイズが開く運動制御の可能性―

順天堂大学 生理学第一講座
北澤 茂

はじめに
 手を伸ばして物をつかむとか、気になるものに目を向ける、という目標に向かう運動は基本的な運動の一つである。こんな運動はありふれていて、我々は日常気に留めることはない。しかし、多関節の腕を操るなどというのは工学的には難しい問題であり、気にも留めずにやってのけること自体が実は驚くべきことなのだ。
 1980年代後半に、手を伸ばす運動は、「滑らかさを好む」という原理に従って選ばれていると報告された[1, 2]。何気ない運動の中に、実は深い原理が隠されているらしい。その後およそ10年を経て、イギリスのWolpert教授ら[3]は、生体の信号につきもののノイズの影響を克服しようとする結果として、運動が滑らかになるという説を1998年に提唱した。一見、悪玉に見えるノイズが私たちの運動を決めているというのは驚くべき発想の逆転である。一方、私自身は小脳に滑らかな運動を作る原理が埋め込まれていると考えて研究を進めてきた。そこで、小脳がノイズを利用して、運動が滑らかになるという仮説、「ランダムウォーク仮説」を2002年に提案した[4]。
 これらの研究を背景として、この11月にスタートするHuman Frontier Science ProgramではWolpert教授を含む日米英加の研究者が協力してノイズが運動の学習と制御に果たす役割を研究することになった。研究の題名は "Controlling the statistics of action: noise and uncertainty in sensorymotor control" (行動の統計的性質を制御する:感覚運動制御のノイズと不確定性). Principal researcherはカナダのFlanagan博士、加えて3人のメンバーは英国Wolpert博士、米国Shadmehr博士、日本の私、北澤である。これから始まる研究の背景と見通しについて紹介したい。

滑らかな運動が選ばれる
 目標に手を伸ばす到達運動の際の手先の軌跡は、始点と終点を結ぶ直線に近い緩やかな曲線で、速度曲線はいわゆるベル型である(図1左)。この軌道の持つ意味について、FlashとHogan [1]は1985年に「躍度最小モデル」を提案した。彼らは、実際の手の運動が、手先の位置を時間で3回微分した「躍度」の2乗を運動の開始から終了まで積分した量(評価関数)が最小になるような軌道でよく近似できることを発見した。位置を時間で1回微分すると速度、2回で加速度だから、3回微分した「躍度」は加速度の時間変化率、ということになる。手が石ころのような物だとすれば、力は加速度に比例するから、「躍度」は力の時間変化率と比例し、躍度最小モデルから得られる軌道は、力の変化率がなるべく小さくなるような軌道ということになる。このモデルから得られる軌道は、始点と終点を結ぶ直線で、速度は中点で最大となる4次関数である。たったこれだけの単純な原理で、到達運動の主要な性質をほぼ説明する。Unoら [2]は評価関数が腕の力学的性質(手は石ではない!)を反映すべきであると考え、トルク変化最小モデルを提案しさらなる成功を収めた。いずれにしても、力の変化がなるべく少ない「滑らかな運動」を我々は知らず知らず選んでいるらしい。

図1
滑らかな速度曲線(正常)と凸凹な速度曲線(小脳障害)。手を伸ばす運動の終点の誤差分散(ばらつき)を小さくするには滑らかな運動が適している。脳はどうやって「誤差分散」を小さくするのだろうか?


滑らかさはノイズのおかげ?
 運動を滑らかにすることのメリットは何だろうか。関節への負担が減って怪我をしにくくなるかもしれない。しかし、滑らかに最適化された運動を作り出すには計算時間などの相応のコストを払わなければならない。従って、生存競争を勝ち抜くのに有利になるかどうか、直感的には明らかではない。生物学的にもっともらしい目的に基づいて滑らかな運動を説明することができるに越したことはない。
 最近HarrisとWolpert [3]は運動の制御信号に信号の大きさと比例する標準偏差のノイズが乗ると仮定すると、終点の誤差の分散を最小にしようという生物学的に妥当な目標と、滑らかな制御が結びつくことを理論的に示した。直感的に言えば、大きい信号は大きいノイズを伴い、終点に大きな誤差を生むのでできるだけ避ける。大きい信号を避けるということは信号の上昇とその後の下降の幅が小さいということにつながる。つまりは信号の変化率が少なくなり、結局のところ「滑らかさ」もかなりの程度実現される、という次第である。「目標に正しく手を運ぶ」という到達運動の目的そのものから最適制御と同様の運動が得られるというのだ。これはまことに分かりやすい。プロの選手の動きはよく「無駄な力が抜けている」と形容される。無駄な力を省いた見た目にも美しい運動は、終点の誤差の分散を最小にする運動なのかもしれない。

 HarrisとWolpertのモデル[3]は、終点付近の誤差を減らすような学習を続ければ、それだけで優雅な運動に近づいていくことを保証している。では、脳はどうやって終点の誤差の分散を小さくするような滑らかな制御を実現しているのだろうか。

小脳と滑らかな運動の関係
 人間で見出された運動の滑らかさに関する最適化原理は、他の種(ネコやサル)でも成立する。しかし、小脳が障害されるとこの滑らかさはたちどころに失われる。具体的には急激な加速、減速を繰り返すようになる(図1右)。到達運動の滑らかさを実現するために小脳は不可欠である。
 また、小脳には都合よく終点の誤差の信号が表現されている [5]。終点の誤差の信号は、脳幹の下オリーブ核から起こる登上線維によって小脳のプルキンエ細胞に伝えられている。このプルキンエ細胞は登上線維以外に、平行線維からの入力を受け取る。平行線維とプルキンエ細胞の間のシナプス結合には可塑性があって、登上線維からの信号の大小で長期にわたって抑圧されたり(長期抑圧)増強(長期増強)されたりする。平行線維からの入力をプルキンエ細胞の出力に変換することで、運動制御に必要な信号を作っているとすれば、終点からの誤差に応じて運動出力を調整する仕組みが小脳には備わっていることになる。
 もし、小脳で終点の誤差に応じた変化が積み重なって、運動の誤差分散を小さくする方向に学習が進むなら、万々歳である。そううまく行くだろうか。大体、誤差の分散などというものを脳は計算しているのだろうか。少なくとも「誤差分散」がニューロン活動で表現されていると言う報告はかつてない。もし「誤差分散」が脳に直接表現されていないとすれば、一体どうやって「誤差分散」を小さくすれば良いのか。これこそ今回のHFSP共同研究の主題である。行動の「統計的性質」をどうやって制御するのか。運動の「誤差分散」をどうやって小さくするのか。

ランダムウォーク仮説から人工小脳へ
 私はここでも「ノイズ」が使えると考えている [4]。登上線維の誤差信号に平行線維のノイズをかけた「誤差xノイズ」が使えるのではないか、というアイデアである。ノイズ任せの動きはいわゆる「ランダムウォーク」である。しかし、この「誤差xノイズ」に基くランダムウォークの拡散係数は、誤差分散の平方根に反比例する。つまり、誤差分散が小さいところには拡散係数が小さいので長く留まり、誤差分散が大きい悪い制御からは、拡散係数が大きくなるのではやく離れる、という仕掛けが自然に入ったランダムウォークになっている。最もよい制御のところにもいつまでも留まることはできない、という問題はあるのだけれど、ランダムウォークする制御系を複数用意しておけば、複数の制御系の出力の和はいつもまあまあ許せる程度の出力を出してくれるだろう。
 実際、眼をすばやく目標に向けるサッカードの制御に、OnかOffかの2値のコントローラを複数準備して、ランダムウォークさせてみた。すると、実際の運動ニューロンの出力や、誤差分散を最小にする最適な制御(図2黒線)の出力と良く似た出力(図2青線)を出すようになった。まだこのアイデア(ランダムウォーク仮説, [4])には詰めるべき点が多いのだけれど、今後の共同研究の中でどう展開できるのか、先行きを楽しみにしている。最近、大脳皮質に埋めた電極から「運動の意志」を取り出して、外部機器の制御を行うという運動補助システムの研究が盛んである[6]。この流れに、われわれの共同研究の成果を結び付けて運動の統計的パラメータを巧みに制御する「人工小脳」を構成することはできないだろうか。自然な運動制御を実現する運動補助システムの開発に結びつけることができないか、などと夢を膨らませている。3年後の成果に請うご期待。

図2
誤差分散最小制御(黒線)とランダムウォーク仮説が与える制御(青線)。眼を50ミリ秒で10度動かす制御で、終点の誤差分散を最小にする制御(黒線)は実際の運動ニューロンの出力とよく一致する[3]。眼球を止める拮抗筋の活動は40ms以降に生じる。2値のコントローラを多数準備してランダムウォーク仮説[4]に従ったシミュレーションを行うと、コントローラの出力の平均は誤差分散最小制御に近い制御を与えた(青線はシミュレーションの一例)。


参考文献
1.Flash, T., Hogan, N. 1985. The coordination of arm movements: an experimentally confirmed mathematical model. J. Neurosci., 5, 1688-1703.
2.Uno, Y., Kawato, M., Suzuki, R. 1989. Formation and control of optimal trajectory in human multijoint arm movement. Minimum torque-change model. Biol. Cybern., 61, 89-101.
3.Harris, C.M., Wolpert, D.M. 1998. Signal-dependent noise determines motor planning. Nature, 394, 780-784.
4.Kitazawa S. 2002. Optimization of goal-directed movements in the cerebellum: a random walk hypothesis. Neurosci. Res. 48, 289-294.
5.Kitazawa, S., Kimura, T., Yin, P.B. 1998. Cerebellar complex spikes encode both destinations and errors in arm movements. Nature, 392, 494-497.
6.Nicolelis, MAL. 2001. Actions from thoughts. Nature, 409, 403-407.