ランダムドットキネマトグラムとランダムドットステレオグラムからの発想
■空間型コンピューター
山口浩さんが書いていらっしゃった「空間型コンピューター」という本を読んでびっくりした。この本のテーマの一部は、私が卒業論文でやったことの延長だ、と感じたからだ。当初、山口さんの記事にコメントしようかと思ったが、長くなりそうなので、ここに書いてトラックバックすることにした。当然、山口さんのすばらしい記事を読んでから、以下読み進まれることをおすすめする。
私は大学時代に感覚知覚心理学研究室で卒業論文を書かせてもらった。かなり入れ込んで書いた私の卒業論文のテーマは、「ランダムドットステレオグラムとランダムドットキネマトグラムの特性について」というごく地味なテーマだった。これは、形のてがかりのない点々で構成されるパターンを、交互に見せるか、左眼右眼別々に見せるかで、動きが見えたり、奥行きが見えたりする知覚現象の特性を、研究対象にした卒論だった。要は、コンピューターを使って、動きの感じ、立体感などを生むにはどうしたらいいか、という視覚の基礎研究のようなものだ。
ちなみに、人様のグラフィックスを借用してよいのかわからないが、ランダムドットとは以下のような感じのものを言う。人間の眼は、ここから隠された形を認識してしまうのだから、たいしたものだ。
余談であるが本書との関連でいえば、感覚知覚心理学のつながりで、本書に出てくるトロント大学の研究室に88年に行かせてもらった。NASAから援助を受けて宇宙酔いの研究として、周辺視の実験をやっている様子を見せてもらった。あ、周辺視というのは、中心視の反対をいう。中心視というのは、ごく普通に意識されているものの見方をいう。人間の目が、目の前にあるものをごく普通に見て、これはボールだとか、これはコップだとか、信号が赤だとか認識したり、文字を読んだりするときに使われる。認識する。これに対して、かならずしも意識的に見ていない視野のはじの方の知覚を周辺視という。
当然、解像度というか、細かいものを見るのに中心視の方が適しているのだが、おもしろいことに、運動に対する感覚としては、周辺視の方が敏感だったり、身体がどちらに向いているかという感覚につながっていたりするのだという。本書で、大きなシュレーターを組まなければならないというのは、実はこの辺の事情による。中心視と周辺視をうまくつかってやると、からだが動いている感覚を与えたりできる。つまりは、その場にいる感覚を生むには、中心視のしかカバーできない15インチ程度のモニターでは全然足りないのだ。
ちなみに、周辺視を意識すると不思議な感覚が生まれたりする。お試しになることをお勧めする。
■神経単位、計算理論、そして、べき乗則へ、
自分の卒論は、デイビッド・マーという夭折した天才的な認知科学者の「ビジョン―視覚の計算理論と脳内表現」という当時大変話題になった本に多大な刺激を受けて書いたものだった。私の理解がただしければ、ニューロン単位の網膜から始る知覚現象を、生理学的なレベルの解析とコンピューターシュミレーションを使ったアルゴリズムの研究とを計算理論という考え方で比較しながら、説明するという野心的なアプローチだった。
私が文字どおり卒論でフォーカスしていたのは、網膜から視神経レベルの初期視覚だった。この初期視覚のレベルで、エッジの検出や、ランダムドットキネネマトグラムのような動きの検出が行われているという仮説を検証したかった。この考え方のベースにあるのは、ごくごく隣あわせで存在している視神経細胞がお互いにごく簡単な連絡をとりあうことで、高度な視覚を実現できるという仮説だ。ごく単純な足し算、引き算、あるいは、周辺の細胞の一定のパーセンテージでの重み付けで、微分、積分、フーリエ解析に匹敵する演算を行える、ということをマーは証明していた。
コンピューターでイラストを描くといった画像処理にお詳しい方なら、ガウシアンフィルターとかご存知なのではないだろうか?ガウシアンフィルターのパラメーターを操作されたことはないだろうか?各種フィルターは、場合によってひとつのセルの周辺の重み付けにより、実現できる(らしい...)。
わけのわからんことを書いているようにしか思えないと自分で書いていても思うのだが、これアナロジーはこれまで本ブログにおいて問題にしてきたウェブのつながりや、miyakodaさんのSNSのつながり、果ては都市経済の問題などと、視神経、初期視覚の問題が、ほぼ同様のアルゴリズムで扱える可能性がある、といことを私に示唆していると、さっき気がついた。
この前から弄くっているべき法則をごく単純なノードの結びつきでシュミレーションしうよとする試みに、「網膜モデル」を追加してみたのは、このためだ(参照)。まだ、途中なのだが調子にのって、どんな感じの集中モデルが描けるか、シュミレーションの内容を説明する前に載せてしまう。以下の画像は、クリックすると大きくなる。
<足しあげフィルターによるシュミレーション結果>
<乗算フィルターによるシュミレーション結果>
<網膜型フィルターによるシュミレーション結果>
まだ、パラメーターの設定やら全然整合性がついていないのだが、グラフをかくと、どうにかべき法則的に対数で近似できそう感じだ。なんとなく卒論で書いた網膜の計算モデルと、べき法則を関連付けられそうな予感がある。もっと言ってしまえば、ブログが巨大な知覚装置になりうるということを示しているのかもしれない。集中と分散という考え方から、さらに先へ進めたいと感じている。
ええい、途中経過のまとまらない記事だが、あえてアップしてしまおう。自分でも、まだ先が全然読めない。
ああ、なんか空間コンピューターの話しが知りきれトンボだぁ!
■参照リンク
・ランダムドットステレオグラム by 眼鏡かわら版さん
・認知心理学 講義資料 by 上智大学 認知心理学研究室さん
・中心視と周辺視 by @ SFC体育
・脳の情報表現:発火周波数,時間パターンと細胞モデル by 銅谷賢治さん (うわっ、シグモイドが出てきた!)
・初期視覚系の情報処理モデルと輪郭セグメント検出 by 新妻清三郎さんら(中心視、周辺視、クラスターなどキーワード多数!)
・愛に空間を (HPO)
・コップはなぜコップに見えるのか?~自発的認識論~ (HPO original、古い!!!)
・マインド・ワイド・オープン―自らの脳を覗く by 橋本大也さん
■共有体験?
私のようなアカデミックでないものが感動を共有させていただいていると書くことすら不遜かもしれないがある方のブクマがつないでくれた金沢創さんのブログ記事に感動した。
| 固定リンク
この記事へのコメントは終了しました。
コメント
ひできさん、こちらでははじめまして。
ランダムドットの記事に非常に興味がそそられます。
この画像、私の目からですが、
中心視からは、ひとりの人物(お婆さんみたいな形)が見えてきました。
でも、周辺視からみてみると、どこかへ巡礼する人たちが見えてきました。
不思議な世界へ連れていかれそうな気分がします。
ちなみに、ひできさんには、このランダムドットの画像って
どのように見えるのか知りたいです。
投稿: Jack | 2004年6月 3日 (木) 00時46分
Jackさん、おはようございます、
かなり見えにくいですが、これは星型です。
よければこの画像だけ、できるだけ大きく印刷して、ぼぉっとみてみてください。うきあがってみえるはずです。
投稿: ひでき | 2004年6月 3日 (木) 07時31分
トラックバックありがとうございます。軽い気持ちで池に小石を投げ込だつもりだったのですが、大津波が返ってきた、という感じです。正直、半分も理解できていないと思います。以後勉強させていただきますが、たぶん追いつけないでしょうね。
経済理論は、将来こうした認知科学の一分野に吸収されていくのでしょうか。焦りに似た感覚を覚えます。一生懸命ランダムドットを見つめたのですが、何が描かれているのか、まったくわかりませんでしたし。こりゃ大変だ。
ついでですが、「すばらしい記事」は言いすぎだと思います。
投稿: 山口 浩 | 2004年6月 3日 (木) 11時00分
山口浩さん、こんにちわ、
コメントありがとうございます。山口さんにまで分からないといわれてしまうと...
分かりやすい表現を目指します。ちょうど今朝同僚から「わかりやすい説明」とかいう本を薦められ「そりゃ、おれの書いた文書がわかりにくいっちゅうことかい!」とか感じていたところでした。
はぁ...
まあ、そもそも「自分でもわかっていないことを書く」というところに無理があるのかもしれません。
反省します。
投稿: ひでき | 2004年6月 3日 (木) 13時32分
すごくしろーとなことですが..
でも、ちょっと気になるのでコメント。
ってか、あれを思い出したので...
「アオイショウメイの連鎖モデル」です
あれは・・
まぁ、ウソ理論なんですが(笑)
でも、ちょっとほんとかもな、って本人的には思ってるんです
で、
あの現象が起こってるときって、周辺視・・つまり視野がやたら広くなってた感じがして...
で、
ぼくとしてはそういうのにドーパミンとか..
「創発」とか絡むのかなぁ、って感じなんですが..
(・・全然違うかも)
投稿: m_um_u | 2004年6月 3日 (木) 17時30分
m_um_uさん、こんにちわ、
をを、宮沢賢治ですね。そういえば、あの「明滅しながら」というイメージはかなり脳内の発火のイメージに近いかもしれませんね。いま、はじめて感じました。
それに、m_um_uさんのノードとレイヤーってのは、まさに私がシュミレーションとかでやろうとしていたことだと思います。網膜以降の情報処理もそうなんですが、ご存知のようにニューロンとかは、「多数決素子」みたいなものなのだそうです。その前のレイヤーの近傍のノードのいくつかの発火が重なって、次のレイヤーのノードが発火する、しかも、前レイヤーのノードによって信号に重み付けのようなものが存在するということだそうです。これだけの原理で、網膜からの初期処理でものの形を認識できることが立証されています。
それが、参照としてあげさせていただいた「脳の情報表現:発火周波数,時間パターンと細胞モデル」あたりに書いてある話だと私は理解しております。
ほんとうにいろいろな方からヒントというか、解答そのものをいただきながら、今回気が付いたのは、網膜から社会現象までノードとのノードのごく近い結びつきを、レイヤーを重ねることで説明できる、ということにつきます。
うーん、シュミレーションの用語もノードと、レイヤーに統一します。
いっぱい、いっぱい、ヒントをありがとうございます。
投稿: ひでき | 2004年6月 3日 (木) 18時20分
一風変わった、脳内構造のホームページがあるのですが、よろしければ、ご批評願えないでしょうか?
投稿: ノース | 2007年7月 4日 (水) 17時01分
ノースさん、こんにちは、
ずいぶんおもしろい考え方ですね。
「画面」という概念がいまひとつわかりかねます。
ご教授いただければ幸甚です。
投稿: ひでき | 2007年7月 6日 (金) 12時25分
画像を使うのはかまいませんが、連絡くらいはして下さい。
投稿: ひょうすべ | 2010年1月29日 (金) 08時22分
ひょうすべさん、
すみませんでした。大変失礼をいたしております。
投稿: ひでき | 2010年1月29日 (金) 08時28分