« [書評] オンラインゲームの中の仮想通貨の分析 | トップページ | 今日聞いたおとぎ話(習作) »

2004年5月16日 (日)

[書評] リンクと力:ウェブ上でリンクすることの政治経済学

[書評]リンクと力:ウェブ上でリンクすることの政治経済学 by Jill Walker

m_um_uさんに下記の論文を教えていただいた。そして、山口浩さんに私のアイデアとの関連についてコメントしていただいているのを読んだ。

・"Links and Power: The Political Economy of Linking on the Web" by  Jill Walker

私自身も非常に彼女の考えに近しいものを感じた。自分自身の備忘録をかねて、以下印象、関連情報をまとめたい。

追える限り、論文の主旨を追う。アブストラクトをまず翻訳する。例によって、私のいい加減翻訳なので、注意してお読みいただきたい。

グーグルのような検索エンジンは、リンクを、客観的で、互いに承認された、機械読解可能な、価値のサインだと、解釈する。リンクは、ウェブ上の通貨となったのだ。この経済的な価値をもつことにより、リンクは力を持ち、ウェブの上のアクセスの容易さと知識に影響を持つ。

この論文を読むまで、グーグルがどのようなシステムを取っているかを知らなかった。彼女の論文を理解する前に、PageRankの考え方を理解しておく必要がある。

・「Googleの人気の秘密 」 @ google


そして、これを数学的に解説して下さっているサイトがあった。

・「Google の秘密 - PageRank 徹底解説」 by Hajime BABA さん


上記記事の冒頭に、こうある。

PageRank は、 「多くの良質なページからリンクされているページは、やはり良質なページである」 という再帰的な関係をもとに、全てのページの重要度を判定したものである。

行列に関する数学的な分析には、ついていけなかったが、私が「見えない自由...」や「あなたは誰?」で考えてきた問題のいくつかは、とうの昔にグーグルのエンジンによって解決、実現されていたということなのだろう。私があまりにネットのことに無知なだけなのだろうが、かなり驚いた。

「見えない自由...」では、ネットの上の認知欲求の満足を互いに、クリック、リンクなどによてり、与信をあたえあえる状況を、通貨的なふるまいとして、説明しうるのではないか、というのが出発点だった。PageRankのポイントは、Jillの指摘のように、サイトの間の問題としては、解決している。

「あなたは誰?」では、匿名性の問題を、人のつながり、信頼のつながりで解決しるのではないか、というのが最初の仮定だった。PageRankは、これを再起的に解決しているということだ。

ちなみに、いくつかのサイトを回り実験してみた。グーグルで「www.」と検索してみた。でてきた順番は、確かにPageRankの順番になっているようだ。知らないサイトもあるが、自分のそうなんだろうなという感覚に一致する。

1. Microsoft Corporation
2. Yahoo!
3. AltaVista
4. Amazon.com: Welcome
5. Google
6. CNN.com
7. Welcome to Lycos!
8. Adobe Systems Incorporated
9. My Excite
10. MapQuest: Home

ちなみに、自分のサイトは...見たくない。ここの記事などは、グーグルのPageRankのゲージがほとんど真っ白だった。

彼女の論文に戻れば、Google以降の世界では、リンクがPageRankのポイントにつながり、一定の条件のもとでリアルの通貨に「交換」しうるのだという。私は、必ずしもPageRankのポイントをどれだけ変化させたかで、ひとつのリンク、ネット上の「認知」に一定の価値の単位を与えられるとは思わないが、大変興味深い考えであると考える。これは、miyakodaさんのお考えにも通じるのではないだろうか?

・「うおー、SNSの理論化ができそう」 by miyakodaさん

■検索構造と権力 (5/17追加

Dainさんからのご指摘て、本節を追加する。

実は、この論文の眼目は、PageRank等の力がどのような政治的、経済的な力を持ちうるかということへの言及を2002年の段階でしていたことにある。グーグルなどのサイトで、PageRankを意図的に0にしてしまわれたら、実質追放刑にあったのといっしょだと。あるいは、お金で自分のサイトへのアクセスを「買う」といったことが、検索サイトとの連携で十分可能である、と。日本のブログでも、どなたかが指摘されていたのを見た記憶があるが、グーグルなどのサイトは、非常に大きな政治的な資源となりうるということだ。極端なことをいえば、米国政府がグーグルを国営化してしまうとか、米国政府の政策に合う運営をする規制をかければ、非常に大きな力を政府がもちうる。

最近のブログにおいても、Jillと同様の指摘をする方がいる。Dainさんのコメントに詳しい。

Dainさんの「ブログがうざい」という指摘がるということについてだが、コメントでもふれたように、ちょっと重み付けを返れば、グーグルなどでは、十分にブログ関連の記事のPageRankを下げる事は可能である。2002年の段階で、Jillのような指摘があっても、状況が変化していないというのは、グーグルなどの検索サイトがポリシーを変えない理由があり、かつ、ブログは実は十分に信頼のできる記事が互いにリンクしあっている状態にある、ということではないだろうか。これまでのまったく単体でしか存在しなかったサイトと、自然に相互につながっているサイト群とでは、ごくすなおなPageRankの「よいサイトは、よいサイトからリンクされている」という観点から、違いがあるのは、ある意味当然であろう。

■それから

PageRankがそのまま私の問題とする「認知欲求の満足の交換」という問題の100%の解決にはならない。また、Jill自身が認め、山口浩さんがご指摘くださっているように、ネット上のリンクによるポイントというのは、通貨による決済というより、物々交換にちかいのかもしれない。これが、果たしてネットの上で、どうなっていくのかを考え続けたい。

■周辺的な事実

彼女は、TinderBoxというツールでこの記事をまとめたとコメントしていた。
http://www.eastgate.com/Tinderbox/

この論文は、2002年の6月のボルティモアの会議で発表された内容であるそうだ。

その他の彼女のブログの記事のタイトルも非常に興味深い。
http://huminf.uib.no/~jill/

■追記
例によって橋本大也さんが「日本における検索の未来 - データセクション」という対談をYahooの志立正嗣さんとされていた。Yahooの検索エンジンが独自のものになるだという。メジャーサイトとマイナーサイトの区分け、商業サイト、タレント名鑑などとの関連も語られていた。Jillさんの視点を比較して考えると面白いかもしれない。

■参照リンク
ネット通貨としての「認知」  by 山口浩さん
ネット通貨としての「認知」:修整  by 山口浩さん
ネット通貨としての「認知」:さらに修整  by 山口浩さん
「ブログってウザクないか?」の続き by Intermezzoさん (コメントまで読み進みいただければ幸いです。
あなたは誰? (HPO)
見えない自由がほしくて、見えない銃をうちまくる -ネット上の貨幣としての認知にインフレーションは来るのか?-  (HPO)
[書評] べき乗則、ウェブログ、そして、不公平さ (HPO)

|

« [書評] オンラインゲームの中の仮想通貨の分析 | トップページ | 今日聞いたおとぎ話(習作) »

コメント

ども、Dainです

いつも考えるきっかけをいただき、感謝しています
確かに「ネット上の認知」についてはひできさんの考えと PageRank は近しいものがありますね。しかしそれが暴走することもあります。一例はgoogle村八分問題。

「google村八分」をgoogleで検索した結果
http://www.google.co.jp/search?hl=ja&ie=UTF-8&c2coff=1&q=google+%E6%9D%91%E5%85%AB%E5%88%86&lr=">http://www.google.co.jp/search?hl=ja&ie=UTF-8&c2coff=1&q=google+%E6%9D%91%E5%85%AB%E5%88%86&lr=

他のサイトやblogでの検索結果と比較すると面白いかもしれません。私の千円札の価値は日銀がオーソライズしてくれます。しかし私のblogは?

もう一例。最近あちこちから「ブログうざい」という声あがっています。weblogの構造上、良質なサイト(ここではココログ本体)から、あるいは自分のサイト内で自動的に沢山のリンクが張られた結果、PageRank が上がり、昔からそのキーワードで情報を蓄積しているサイトが「押し下げられる」現象が顕在化していることです。

この話題はblog「殿下執務室」で掘り下げられています。
http://www.2log.net/home/mdenka/archives/blog194.html">http://www.2log.net/home/mdenka/archives/blog194.html

 対処法も含めて方向性が見えない現在進行形の話題なので、私自身、記事化までいたっていません。一つのネタとして提示します(既出だったらごめんなさい)。ただ、PageRank を手放しで評価できないことは事実だと思っています。

 重要なのは、いつも「いや、待てよ」と一度は疑うことだと思います。この私のコメントも疑ってかかってくださいね。

投稿: Dain | 2004年5月16日 (日) 20時50分

Dainさん、こんばんわ、

いまもまた電気を消そうとしている娘がすぐ横にいます。なので、手短にいきます。

実は「リンクと力」の後半は、まさにネットの検索結果がお金で買えるという「ふしだらな行為」が行われているという所が焦点なのです。Jillさんの英語がすんごいアメリカの学生っぽくて読みにくくて、私が英語の訳に自信がないので、ふれていないという、知的怠慢をしております...この論文2002年の夏に書かれているらしいので、米国ではそのころから「村八分」問題、もしくは特定の企業サイト優遇問題があったようです。いまはもうちょっと公然とやっている感じがしますよね。

そうそう、記事書いてから気が付いたんですけど、こっちからはっているリンクもグーグルのエンジンは評価してくれているらしくてSearch Engine Optimization(検索エンジン最適化)という観点からは、新聞社やYahoo!などの、それこそ記事中で触れた「信頼性」の高いサイトとつながっていると、PageRankも上がっているようです。

そして、「村八分」という言葉ですが、すんごいグッドタイミングで、↓のコメントに書きましたが、ネットで「村」が存在しうる、あるいはしているのではないか、というのが私の仮説です。

http://hidekih.cocolog-nifty.com/hpo/2004/05/an_analysis_of_.html#c251541">http://hidekih.cocolog-nifty.com/hpo/2004/05/an_analysis_of_.html#c251541

多分、理屈からいえば、ブログの記事の評価は、行列をとくときのアルゴリズムのパラメーターの置き方で、かなりPageRankを下にすることは可能だろうと思います。というか、ブログの信頼性をかなり正確に評価することは、グーグルのアルゴリズムで可能です。まあ、高等数学のわからない私が言い切ってしまってよいのかどうかわかりませんが...

まあそれまでの間は、私のようなブログにグーグルであたったかたは、不幸としていいようがないでしょうから、まあ...私も雑音のひとつなんでしょうね。

投稿: ひでき | 2004年5月16日 (日) 21時37分

あ・Google八分系ですね
そして、「blogうぜぇよ」問題、と

これはぼくも前にちょっと書きました
http://morutan.blogtribe.org/entry-36d1da1d380529d53cf36025fbec46a6.html

http://morutan.blogtribe.org/entry-840d33c5522a336f15299d84fe1eccca.html


っつーか、ここからはじめたほうが早いですね
「Googleを通して見える世界」(@ル・モンド・ディプロ、2003.12)
http://www.diplo.jp/articles03/0310-5.html

こんな感じで、「Googleの覇権」ってのはちょっとした問題になってます

ここだとイデオロギーって感じで大げさな感じもしますが..
でも、使い勝手の悪さってのは実際問題になってきている(cf.「blogうぜぇよ」もしくは「検索結果がいっぱいですぎてイヤだ」)

それで検索エンジンの方向としては、
「検索する人の嗜好(志向)にあわせた結果を自動的に出せるような形」
っていうコンシェルジェみたいな形なのが理想なんですが..
どうやらそれはちょっとムリみたいで..

(んで、言語系研究が関わってくるんですが...自然言語解析が難しいみたいです。意味論とか関わってくるのかな..機械翻訳も関わります)


なので、
「検索サイトの方向性を最初からある程度限定していれば、検索の結果も限定されてくる」
って感じの、personalizaitionって流れが一般的みたいです

(福島俊一 , 2004, 「検索エンジンの仕組みと技術の発展」, 『情報の科学と技術』, 情報科学技術協会)

んで、そういう流れの方向としてlocalizationってのがあって..
「地域限定系の情報を流していったらいいんじゃん?」
ってのも出てきてるみたいです

(この辺りはエスターのインタビューに詳しいです)
http://www.imediaconnection.com/content/3307.asp


んで、weblogもそんな感じでlocalizationの流れがある、と
http://business.seesaa.net/article/149391.html#comment


現在掴んでる範囲では、そんな感じです


(んで、それ以降とか、業界の詳しい内容についてはこの人のとこかな)
「エッセンシャルサーチエンジン」
http://inoue.typepad.com/searchengine/


※あ、あと細かいことですが...
m_um_uなので.....(u_mじゃないということで...ひとつ...(^^;))

投稿: m_um_u | 2004年5月17日 (月) 06時46分

m_um_uさん、おはようございます。

ああ!すみません。
いま少なくとも記事中のはなおしました。
再度チェックいたします。
ほんとうに失礼ばかりで、もうしわけございません。

投稿: ひでき | 2004年5月17日 (月) 07時29分

対応早っ >m_um_uさん、ひできさん
もうついていけないわたしorz

少し戻ってしまうのですが、わたしの考えは「PageRankは有用だけど目安の一つ」です。お話の方向はひできさんと同じ方を向いているつもりです… が、少し気になるところがあり、教えていただきたいのですが…

 >ブログの記事の評価は、行列をとくときのアルゴリズムの
 >パラメーターの置き方で、かなりPageRankを下にする

不勉強なのですがどうしても見つかりません。システム屋の端くれなのでこのアルゴリズムに興味があります(つまり、恣意性を排除しつつも重み付けを行うことができるのか?)。

キーワードは行列(determinant)だろうとgoogleで検索(笑)しても、それっぽいのがみつかりません。ひできさんの書き方からあまりお詳しくないのは分かりますが、「このへんで聞いたよ」という欠片かキーワードぽいのだけでも良いので…

投稿: Dain | 2004年5月17日 (月) 12時34分

Dainさん、こんにちわ、

するどいところをつかれてしましましたね。

私も書いたものの気になっていて、今朝も「リンクと力」の関連ありそうな参考文献をあさっていたのですが、2002年の文献なせいか、リンクが切れまくっていました。「グーグルはブログが好き!(Google loves blogs!)」というタイトルの記事がリストアップされていたので、期待したのですが、リンクが切れているし、それこそgoogleで検索しても見つかりませんでした。

あまり確信はないのですが、私は以下の2点の類推を行いました。

・私が記事中であげさせていただいた「グーグルの秘密」をざっと読んだときに、行列の解き方にパターンがいくつかあるということと、行列を解くときの係数のとりかたにいくつかヴァリエーションがある、という記述があったと思います。「グーグルの秘密」の作者が書いておられるように、これは高度に数学の問題のようです。私のように、表面つらをなでただけで、断定的な言い方をしてしまったのが、正解かどうかわかりませんが、ブログでしかも信頼性のひくいと考えられるもののパターンを抽出すれば、解法と係数のパラメーターを制御可能だと、類推しました。

・多変量解析を以前やっていたときの経験で、因子分析や多重相関をとったときに、一定の尺度を構成するのに説明変数にかけあわせる係数を算出していました。グーグルの行列の解法はわかりませんが、「よい」ということの尺度を構成するいくつかの側面を抽象した説明変数が導き出され、それに対して算出された係数をかけあわせてPageRankを出しているのだろうととイメージしました。また、これも統計とかコンピューターを使ったときの経験ですが、人間に自然な形で結果をだすには、どこかで重みづけをしているはずだろうと、考えました。これもまた類推です。

グーグル上場にあたってのいくつかの記事で指摘されていたように、実際にどのような操作をグーグルがしているかは、まだ完全に情報公開されていないようです。以下は、もっと類推ですが、グーグルが上場すれば、競争力確保がマネジメントに期待されることになり、競争力を守るためには、そう遠くない将来に切れると聞いている特許の周辺特許をださざるを得なくなるでしょうから、情報公開はこれからすすむのではないでしょうか?お役にたてずすみません。

私もPageRankはあくまで目安だと思っています。なにより、検索エンジンを使わなくとも、一定のコミュニティーは存在可能ですものね。

投稿: ひでき | 2004年5月17日 (月) 14時47分

自己フォローです。

1年位前に同じようなことを感じていた人がいるようです。

"PageRank is Dead" by Jeremy Zawodny
http://jeremy.zawodny.com/blog/archives/000751.html">http://jeremy.zawodny.com/blog/archives/000751.html

このブログでも指摘されていますが、意図的にリンクを何人かでつくりあげればPageRankを「出し抜いて」ランクの高いサイトを作り上げることが可能なようです。

実験してみたくなりましたが、どうも、自分の目指すところとここまで来ると違うような...

投稿: ひでき | 2004年5月17日 (月) 16時32分

Dainですー
なんだかかき回したみたいで申し訳ないです…

"PageRank is Dead" は探し途中でzapしてました。「ブログうぜぇ」のはしりだったんですねー

せっかくひできさんが解説してくれたのに、青チャートでお腹いっぱいだった私にはちんぷんかんぷんでした >多変量解析・因子分析・多重相関

…google を最初に知ったのは、どっかからのクチコミだったことを思い出しました。google もただの道具だと割り切って付き合っていこうと思います。最近併用しているのがコレ↓は、visual&audio系に強いので重宝してます。googleとはまた違うアルゴリズムなので、意外と新鮮な出会いがあるかもしれませんね

http://www.alltheweb.com/">http://www.alltheweb.com/

も少しこの状況をwatchしていきます。

投稿: Dain | 2004年5月18日 (火) 00時35分

ネットのリンクをポリティカル・エコノミーの観点で分析するという発想をもったことがなかったので、一連の議論は大変新鮮でした。それからgoogleのもちうる政治力、あるいは政治的影響力については、そのとおりだと思います。業務の上でインターネット上で情報を入手しようとするとき、つまりプライベートな目的でなく使用されることのどれほど多いことか。

テクニカルな側面はよく分かりませんが、国際開発の世界で最近、ソーシャル・キャピタルということがいわれます。「資本」の意味を単に金銭の量にみるのではなく、人と人とのソーシャルな関係性にみる考え方です。これなど、ちょっと似た議論かなと思いました。

投稿: koh | 2004年5月18日 (火) 02時59分

Dainさん、おはようございます、

私も知ったような口をほんとうにたたけるような知識も技能もないのですが、統計はいろいろつかえるという感触を持っています。

わかりやすく多変量解析を解説してくださっているサイトを見つけました。

http://park6.wakwak.com/~tg-website/statistics/02_stat/factor_clst.htm">http://park6.wakwak.com/~tg-website/statistics/02_stat/factor_clst.htm

この問題の先にあることについて、自分なりに考えを書き連ねてみました。まだ、本来お見せできる状況ではないのですが、いまはやりのコラボということで、書いている状況からオープンで行きます。

http://hidekih.cocolog-nifty.com/hpo/2004/05/post_9.html">http://hidekih.cocolog-nifty.com/hpo/2004/05/post_9.html

コラボいただければ、ほんとうに幸甚です。うれしいです。

投稿: ひでき | 2004年5月18日 (火) 08時52分

Kohさん、

そーなんですよ!それです、それ!!!ソーシャルキャピタルというのですか?日本流にいえば、「人こそおれの財産」ということでしょうか。

実は金銭以上に、いや金銭的な価値を一番生むのは間違いない人なんですよね。上場している企業とかをみれば、ほとんど資本もなく、とんでもない「価値」を生み出している人とその人のつながりがあるわけですよね。

あ、来客でございます。また後ほど...(事務所で書いているのがばればれ...)

投稿: ひでき | 2004年5月18日 (火) 08時56分

ひできさん、サイトのご紹介ありがとうございます。因子分析ってやつですね。全然詳しくない話題ですが一読しました。

■googleは恣意性を排除しつつも重み付けを行えるのか?

…で、google の PageRank の話題に戻ると、私の考えは、ひできさんの類推と同じです。引用するとココ↓ですね。

 >「よい」ということの尺度を構成するいくつかの側面を
 >抽象した説明変数が導き出され、それに対して算出
 >された係数をかけあわせてPageRankを出しているの
 >だろう

 >人間に自然な形で結果をだすには、どこかで重みづけ
 >をしているはずだろう

ただ、そこから導き出される考えはちょっとシニカルかも…

考え↓
「人は見たいものしか見ない。聞きたいことしか聞こえない」

重み付けの対象を探し(因数の抽出)、重み付けをする(因子負荷量)のは、人ですもの。

■google検索対象からblogを外す

blog という「自サイト内でリンクを自動生成しまくる」仕組みについて、googleはついていけていないのが現状かしら? それならその部分は引いた目で「検索結果」を見なきゃ…というのが今の私の考えです。

…などと言ってるそばからこんな方法を見つけました

Googleの検索対象からblogを外す方法
http://sasapanda.com/toshi/archives/000878.html">http://sasapanda.com/toshi/archives/000878.html

これは使えるかも。ブログを貶めているわけではなく、このpoint of view でネットを「観る」必要がある、ということです。

--
遅レスごめんなさい
読む時間・書く時間が足りないので、コラボに参加できません、ごめんなさい(皆さん早いっすー) でも、ゆっくり追いかけますね

投稿: Dain | 2004年5月20日 (木) 18時20分

Dainさん、こんばんわ、

因子分析も、検定などの統計も、人間が自分で見たいものを見るための方法にすぎない、というのは本当です。そもそも、数学とかいうと非常に高度に感じますが、統計学の数学というのは、結構ごく簡単な仮定に基づいて理論付けされています。統計学の基本中の基本である、正規分布ですら、結構経験の域をでないものであったりするそうです。

それはさておき、ブログをはずせる検索の方法というのは、非常に納得しました。十分に価値のある方法だと思います。

コラボしてますよ、楽しいですよ、コラボ(笑)。

例えば、今日、ほんとうに自分が探していた答えを、コメントや、トラックバックでつながってくださっている方々が教えてくださいました。非常にはうれしかったです。これは本当にネットワークの知の在り方だと、強く感じております。

http://hidekih.cocolog-nifty.com/hpo/2004/05/post_9.html#c265350">http://hidekih.cocolog-nifty.com/hpo/2004/05/post_9.html#c265350

私は幸いにして、ネットもくわしくありませんし、昔ほど本も読みません。そして、いまネットでつながって、いろいろな方と交流させていただいて、教えていただいて、また、それを自分なりに書くのが、なにより楽しいです。

また、今日は、ブログの中には、自分がまったく知らなかった非常に親密な関係性を保っていらっしゃるグループがあることも知りました。この事実も、↑のことから帰結するひとつの現象のように感じております。


Dainさんとも、私の気持ちからすると十分にコラボさせていただいているように感じております。もー、あの記事を読んで以来、Dainさんを他人とは思えません。

投稿: ひでき | 2004年5月20日 (木) 23時29分

コメントを書く



(ウェブ上には掲載しません)




トラックバック


この記事へのトラックバック一覧です: [書評] リンクと力:ウェブ上でリンクすることの政治経済学:

» Yahoo! Japan が検索エンジンを Google からYahoo! Search Technologyに変更 [????日坊主な雑記]
今日Yahoo! Japan が検索エンジンを Google からYahoo! Search Technologyに変更したようです。Yahoo! Japanと... [続きを読む]

受信: 2004年5月31日 (月) 21時21分

« [書評] オンラインゲームの中の仮想通貨の分析 | トップページ | 今日聞いたおとぎ話(習作) »