検索のしくみ

　検索のしくみ　

ネット上には、さまざまな検索サービスが展開されている。

図は、左から順に、Goo、Yahoo、Google　の検索トップページである。
君は通常、そのサービスを利用しているだろうか？
何気なく使っている検索サービスは、２つの仕組みによって、支えられている。
それは、
　　Ａ：インターネット上の情報を集める
　　Ｂ：ユーザの求める情報を提供する
という仕組みである。
インターネット上の情報を集める仕組みは、検索ロボット（サーチロボット：search robot）と呼ばれる。
また、ロボットが集めてきた情報をためておき、ユーザの要求にあうページを表示する仕組みを、
検索エンジン（サーチエンジン：search engine）と呼ぶ。

■◇■検索ロボット
検索ロボットは、世界中からＷｅｂページ情報を集めてくる仕組みであり、
そのために作成されたプログラムを、スパイダー（Spider：蜘蛛）あるいはクローラー（Crawler：這うもの）という。
世界中にある Webサーバアクセスし、そこにあるWebページをごっそりコピーするものもあれば、
選択的にコピーするものもある。
そこで集められ、作成元の企業に送り替えさえたページ情報は、検索エンジンにより、データベース化される。

■◇■検索エンジン
多量の情報を整理し、いつでも取り出せる状態にしたものを、データベース　という。
検索エンジンは、スパイダーから送られてきたWeb情報を、インデックスを付けて、データベースに登録する。
登録されたWebページは、キャッシュ とよばれる。

さらに検索エンジンは、そのデータベースの中から、Webページを探し出す仕組みを提供する。
その方法により検索エンジンは、ディレクトリ型　と　全文検索型　に分けられる。

・ディレクトリ型検索エンジン
　このタイプの検索エンジンは、集められたWebページを、一定のルールで評価（審査）し、
　そのルールにあったページを、ユーザの使いやすいような領域に分類して、登録する。
　ユーザは、その領域（カテゴリー）を選びながら、目的のページを探し出す。
　このような検索方法を、カテゴリー検索　という。
　右図は、カテゴリー検索の　カテゴリ一覧である。

・全文検索型検索エンジン
　このタイプの検索エンジンは、集められた膨大な量のWebページに含まれる言葉を
　ほぼそのままインデックスし、キャッシュする。
　ユーザは、探しだしたい情報に関連する言葉を使い、検索する。
　このような検索方法を、キーワード検索　という。