検索機能を付けた個人別履歴の作成
96H068 高徳 哲也
takatoku@h-ps011.ise.osaka-sandai.ac.jp
(page 1)
はじめに
ユーザが過去に見たWebページを再び見るためによく使われる機能としてWWWブラウザのブックマーク機能がある。
本研究ではブックマーク機能の欠点を補い、より簡単に過去に見たWebページを見つけ出せる環境を提供する。
(page 2)
ブックマーク機能について
利点
・自分用に最適化されたディレクトリ型サーチエンジンの作成
・Webページを移動する際URLを入力せずに済む
欠点
・面倒なブックマーク登録作業
・面倒なブックマークの整理
・ブックマークを利用する際使用できるパソコンが限定される
(page 3)
研究目的
本研究では個人別の履歴表示と検索機能を用いることによってより簡単に過去に見たWebページを見つけ出せる環境を提供する。
特にブックマーク機能で述べた欠点であるパソコンが複数台あるような所での問題を解決するようにする。
(page 4)
研究内容
・従来のブックマーク機能の欠点を補う
キャッシュサーバにあるログを用いて個人別の履歴を作成 する。
履歴にはWebページを見た時間、タイトル、内容の表示
・履歴表示に検索機能を付ける
Webページに含まれているキーワードを用いて過去に見 たものを検索する。
(page 5)
個人別履歴の作成手順
個人別履歴の作成手順
1.ログにフィルタ処理を行う
2.フィルタ処理を行った結果から一日分の全履歴を作成す る
3.CGIを用いてその日の履歴から個人の履歴を作成する
(page 6)
フィルタ処理 1/2
store.log
Webページの情報がどこに保存されているかを保存している。
cache
Webページの情報が保存されている。
上記のログから履歴に必要な情報を取得するためにフィルタ処理を行う
(page 7)
フィルタ処理 2/2
store.log cacheにフィルタ処理を行った結果
http://news.yahoo.co.jp/headlines/hwj/000128/cpt
/15413500_wircpt007.html
|
(Yahoo! - 米陸軍とNASAがシミュレーション技術を共同で開発(WIRED))
|
トップYahoo!JAPAN-カスタマイズ-ヘルプトピックストップ国内海外経済企業マーケットエンターテインメント
URL
|
(タイトル)
|
内容
上記の結果を
process1
というファイル名で保存する。
(page 8)
一日分の全履歴を作成
prosess1
に access.log にフィルタ処理を行った結果を組み合わせる。
takatoku | 18:20:35 |
http://news.yahoo.co.jp/headlines/hwj/000128/cpt
/15413500_wircpt007.html
|
(Yahoo! - 米陸軍とNASAがシミュレーション技術を共同で開発(WIRED))
|
トップYahoo!JAPAN-カスタマイズ-ヘルプトピックストップ国内海外経済企業マーケットエンターテインメント
上記の結果を
process2
というファイル名で保存する。
(page 9)
個人別履歴の作成
個人別履歴には
process2
を元にCGIを用いてユーザからの要求があるだびに作成する。
ユーザ識別にはWWWブラウザの環境変数を用いて行う。
(page 10)
ユーザ識別について
本研究で用いた環境変数
REMOTE_IDENT
REMOTE_IDENT
とはサーバが
IDENT_DAEMON
を受け取った時に得られる環境変数。
利点
ユーザ識別のためにユーザ名やパスワードを入力することなく個人の履歴を見ることができる。
(page 11)
個人別履歴
個人別履歴を表示した結果
(page 12)
キーワード検索
履歴表示にWebページに含まれていたキーワードを用いて検索できる機能を付け加える。
検索機能には日本語全文検索ソフトである「Namazu」を用いる。
これにより、より的確に目的のWebページが閲覧できるようになる。
(page 13)
Namazu について
Namazu の特徴
・各種プラットホームに対応
・高速な検索を実現
・多くの検索方法をサポート
・検索結果表示の柔軟性
・正確なHTMLの取り扱い
・複数インデックスからの検索をサポート
・多彩な詮索クライアント
(page 14)
キーワード検索による方法
(page 15)
検索結果
(page 16)
現在の状況
・CGIの環境変数を用いることによってユーザ別の履歴を表示させることが可能
・「Namazu」によるキーワード検索機能が可能
(page 17)
今後の課題
・履歴のタイトル、内容表示での文字化けによる問題
・「Namazu」によるインデックス作成に時間がかかる
・クライアントマシンのOSによってはユーザ認証のために用い る情報を標準で持たないものもがある
・検索機能の充実化
(page 18)