« コンピュートピアに寄稿 | メイン | セマンティックウェブはどうなんだろう? »

2004年11月20日

googleと集合知

2ちゃんねる等のいろんなところで既に話題になっているので、今更とも思いましたが、
googleで「糞映画」をキーワードとしてサーチすると東映のデビルマンの公式サイトが
トップに表示されます。(今のところはということです。今後は変わっていく可能性あり)

もちろん、公式サイトで「この映画は糞映画です」と書いてあるわけではなく、
公式サイトにリンクしているさまざまなページの中に「糞映画」という文字列があることが
多いため、googleのランク付けアルゴリズムが、「デビルマン」と「糞映画」は関連性が
高いのだなと判断して上位にランクするという仕組みです。

これは考えてみればすごいことであり、さまざまなWebページ(その多くはblogと思いますが)
のリンク関係から、googleが「デビルマンは糞映画」という知識を抽出してくれたという
ことになります。特定の評論家の意見ではなく、インターネットで情報発信する
すべての人々の意見が総合されて、こういう知識が抽出されるわけです。
これはいわゆる、集合知(Collective Intelligence)と呼ばれる研究分野に属すると言えます。

「デビルマンは糞映画」というだけではたいした知識ではないかもしれないですが、
他にもネット上で集合的かつ暗黙的に作られたより重要な知識が抽出できるはずです。

現状のgoogleの単純な文字列検索とリンク分析だけでここまでできるのですから、
もう少しセマンティクス(意味情報)的な分析が使えるようになってくると、
この分野はますますおもしろくなってくると思っています。

投稿者 kurikiyo : 2004年11月20日 10:38

コメント