2005 年 09 月 24 日 : Blog検索エンジン考
BLOGを書く人が増えている。
それに伴って膨大なBLOG情報がインターネットに溢れるようになってきた。自分にとって価値のあるBLOGを見つけ出せないジレンマに陥る傾向に拍車がかかる。BLOG 検索エンジンが次のビジネスチャンスになりそうだ
BLOG 自体はシステム的に複雑でなくて、それなりの人が取り組めば実現可能なソフトウェア技術である。その証拠に世界中でいろんな人が様々なBLOGシステムを開発し発表している。
しかしBLOG 検索エンジンに関しては従来のソフトウェア技術をブレークスルーするものをいまだ知らない。自分のフィーリングに合ったBLOGを検索する術がない。
新しいBLOG検索エンジンに関してひとつ思うことがある。BLOGというのはひとつの著作であり、一般的な傾向としては自分にとって読む価値のあるものは、文体や言葉、その連なり、その音の響きが自分のとって何処となく心地よいものではないか。
SPAMメールを排除するシステムには学習させることによってメールの内容からSPAMと判別するものがある。個人的に利用しているSPAMメールフィルターにはこの"ベイズ理論"という数学の確率理論が使われている。その精度に満足している。
ネットで調べると、Thomas Bayes氏は18世紀に生きた、聖職者兼数学者のイギリス人だったらしい。何百年も前の数学的理論が現在のコンピュータに応用されているだけに、Thomas Bayes氏の偉大さが窺い知れる。
"ベイズ理論"によれば、ある事象が発生する確率は過去の同じ事象の発生頻度によって概ね予測できるという。言い換えれば、その原因から起こる結果についての確率が分かれば、その結果を引き起こす原因が分かり未来を見渡せるということである。
この理論を応用し、自分のフィーリングの尺度でBLOGを数値化できれば、その人にとって心地よい新しいBLOG検索エンジンが創造できるかもとふと閃いた。