unlimited blue text archive

検索エンジンの扉

作成年月日
2007年02月24日 04:00

サーバーを借りこのサイトを構築し準備は全て整ったかに見えたが、それはあくまで文書を用意しただけに過ぎない。電話を引いたがまだ誰にも電話番号を教えていない状態。この後は友人に教えたり電話帳に番号を載せたりしなければこの電話番号にかけてくる人間は居ないわけである。そしてこのサイトはいつか訪れるかもしれない誰かの為に作られた物であるから、検索エンジンに拾って貰わなければ本当の意味で準備が完了したとは言えない。

しかしこのサイトは文書に対するリンクを前提に作られているのでトップページを貼り合う「相互リンク」という風習とは無縁である。こちらの文書の中で外部のサイトやページにリンクを貼っている箇所は有るが、外部からのリンクは一切無い。このサイトの存在は現在妻以外は知らないので、googleのindexに登録されていない現状では天文学的な偶然(アドレスの打ち間違い)に拠らない限りこのサイトに辿り着ける人間は世界中にただの一人も居ないのである。

しかしここで困った事が起こる。検索エンジンによる到達を前提として作られたこのサイトは、外部からの固定リンクが存在しないが故に検索最大手のgoogleの巡回ロボットに拾って貰うのが難しいのである。これではいけない。

googleには「webサイトを作ったら俺たちに教えるがいい」という趣旨のもと「サイトの登録 / 削除」というサービスがあるので、なるほどこれは便利と思いつつポチっと登録申請をするが、その後4日経っても5日経ってもgoogleのindexにこのサイトが登録された様子はない。登録完了まで1週間から4週間かかると書いてあるがアクセスログを確認して巡回ロボットが大量に徘徊した跡を発見すると「どうして見たのにindexに反映されないのだ」と不安になる。「何か記述に不備があっただろうか」「登録の時のアドレスがエイリアスだったのがマズかったのか」とあれこれ想像してしまうのである。

やれる事は全部やっておこうとgoogle用のサイトマップファイルを見よう見まねで作成しアップロード。グーグルサイトマップの作成と生成ツールで雛形を生成し最終的に手打ちで作成。これで上手く行けばgoogleを利用したサイト内検索フォームをトップページに付加する事も検討中。CGIによる検索フォームが望ましいがさすがに今はそこまで手が回らん。

しかし今回のこの一連の作業で思い知らされたのはgoogleの積極性と、その危険性である。以前観たテレビ番組で「何の説明も無くある日突然自社のサイトがgoogleのindexから削除されアクセスが激減し、経営が危険な状態に陥った事を理由に訴訟を起こした企業」の話が取り上げられていたが、自身の手でgoogleの門戸を叩いてみるとその恐怖がしみじみと実感できる。googleのindexに登録されないという事は「ネット上に存在しない」という事と限りなくイコールに近い。「あらゆる人があらゆる文書を参照出来る」という事を実現する為のデバイスが一社の手に委ねられている訳である。

勿論googleは民間の会社であり、公平に情報を網羅しなければいけない義務はない。先に触れた企業の訴訟は現状を省みなければ完全な言いがかりである。好きなサイトだけ集めてindexを作成する権利がgoogleにはあるだろう。例え「世界中の全ての情報を集積する事」を理念に掲げていたとしても実際の業務において法律に反しない範囲で自社の運営を決定する権利がある筈だ。だからこそ人類が等しく利益を享受出来るこんな作業は国連とかそういう国際的非営利団体の手によって行われるべきだと思うのである。

あるキーワードが入力された時に検索サイトで何位に表示されるかは企業にとってとても重要なファクターになっている為に、この行為は慎重に行われなければならない。国際的非営利団体の行為が特定の企業に有利に働くような事は許されるべきでは無いからだが、既存の検索エンジンとは別のロジックで共存する事は可能だと思うのだ。例えばページランクという概念はこの検索エンジンには不要だろう。meta要素のkeywordも無視して良い。自己申告などあてにする事は無い。高度なプログラムを搭載し、ドキュメントの「意味」を判断して検索ワードに一番関連性が高いページから表示してくれれば良いのである。

こうしたロジックで表示されるページは使い勝手が悪い物になると予想される。玉石混交、真実を記した物もまことしやかに捏造されたページも、ページの中身がその検索ワードに即した内容であれば表示されてしまう。アニメ番組の公式サイトやある商品のメーカーページも書き方が悪ければ下位に甘んじてしまうだろう。けれどもこの検索エンジンはそれで良い。通常使う分にはgoogleを利用していればいいのだ。

この検索エンジンの目的は「取りこぼさない事」。ありとあらゆる手段を講じてネットを巡回し、ひたすらにhtml文書を記録していく。そういうロボットとサーバーを用意してくれる国際的機関が一刻も早く出来て欲しいと思っている。今この瞬間もhtmlドキュメントは爆発的に増殖しているのだから。

しかしこんな事を書いているとますますgoogleのindexに登録されないんじゃないかと勘ぐってしまうな。普段はgoogleで良いんですよ?いざという時の最終防衛ラインとしてね、こういうのがあるといいんじゃないかなぁと思っただけなんですって。