<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>Sooey &#187; opera</title>
	<atom:link href="http://old-journal.sooey.com/tag/opera/feed/" rel="self" type="application/rss+xml" />
	<link>http://old-journal.sooey.com</link>
	<description></description>
	<lastBuildDate>Fri, 04 Dec 2009 08:44:05 +0000</lastBuildDate>
	<generator>http://wordpress.org/?v=2.9.1</generator>
	<language>en</language>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
			<item>
		<title>ブラウザの履歴を全文検索するソリューション</title>
		<link>http://old-journal.sooey.com/2007/09/25/668/</link>
		<comments>http://old-journal.sooey.com/2007/09/25/668/#comments</comments>
		<pubDate>Tue, 25 Sep 2007 06:54:54 +0000</pubDate>
		<dc:creator>juno</dc:creator>
				<category><![CDATA[Uncategorized]]></category>
		<category><![CDATA[opera]]></category>

		<guid isPermaLink="false">http://www.sooey.com/journal/2007/09/25/668/</guid>
		<description><![CDATA[Opera ブラウザ 9.5 アルファ版公開によると、Operaの次期バージョンでは「全文履歴検索」という機能が搭載されるそうな。

何か面白い記事を読んだものの、後からその箇所を探すのに苦労した、という経験はありませんか?もう、この悩みともお別れです。Opera 9.5 には全文履歴検索機能が搭載されます。この機能を利用して、今までに訪問したすべてのページを検索できます。いちいちブックマークする必要はありません。

Opera のこれまでのバージョンや他ブラウザの履歴検索機能が訪問した事のあるページの URL のみを検索対象とするのに対し、Opera 9.5 の全文履歴検索機能は訪問した事のあるページに実際に書かれていた内容を検索対象とします。キーとなる語を打ち込むと、あなたの履歴にあるページ内のテキストから自動的に検索されます。

「いつかどこかで見かけたあのページをまた見たい」と思うことは結構あって、それがニュースサイトの記事だった場合はタイトルがちゃんと付けられているから通常の履歴検索でもなんとかなったりするんだけど、「たまたま通りかかった個人のブログで流し読みした情報が、後日必要になった」なんてケースだとなかなかそうもいかない。ページの配色とか文体は印象に残りやすいから、サーチエンジンが「赤い背景で、○○について丁寧な文体で書いてあるページ」といった条件を認識してくれるようになると素晴らしいのに。

で、サーチエンジンが頑張ってくれるようになるまでは、閲覧したページをプロキシかましてずっとローカルに保存していくっていうのが現実的な解決策ですかね。問題はディスク容量？どのContent-Typeのものを保存するかにもよるけど、最近のHDD相場を考えればそんなに非現実的でもない気がする。pdumpfsを組み合わせるとか。

実は、先週WEBrickでコンテンツを延々保存するプロキシを書いてみたんだけど、保存すべきコンテンツの取捨選択が結構ややこしいことになったのでそのままお蔵入りにしてしまった。RubyとMeCabを組み合わせて、閲覧したページから抽出した名詞が自動的にタグとなって「履歴タグクラウド」みたいな夢を描いたんだけどなあ…。

というわけで、Opera 9.5をMac OS Xに入れて件の機能を試してみた。

Opera 9.5 History Search (originally uploaded by juno_)

ちゃんと履歴のコンテンツまで見て検索されている。

ただし、手元ではページを表示しただけでは検索結果に含まれなかったので、Operaを一度再起動したら検索対象に含まれるようになった。インデックスの更新タイミングがリアルタイムじゃないのかな。検索結果の見せ方にもう少し工夫が欲しいけど、なかなか期待できる。
]]></description>
			<content:encoded><![CDATA[<p><a href="http://jp.opera.com/products/desktop/next/">Opera ブラウザ 9.5 アルファ版公開</a>によると、Operaの次期バージョンでは「全文履歴検索」という機能が搭載されるそうな。</p>

<blockquote>
  <p>何か面白い記事を読んだものの、後からその箇所を探すのに苦労した、という経験はありませんか?もう、この悩みともお別れです。Opera 9.5 には全文履歴検索機能が搭載されます。この機能を利用して、今までに訪問したすべてのページを検索できます。いちいちブックマークする必要はありません。</p>
  
  <p>Opera のこれまでのバージョンや他ブラウザの履歴検索機能が訪問した事のあるページの URL のみを検索対象とするのに対し、Opera 9.5 の全文履歴検索機能は訪問した事のあるページに実際に書かれていた内容を検索対象とします。キーとなる語を打ち込むと、あなたの履歴にあるページ内のテキストから自動的に検索されます。</p>
</blockquote>

<p>「いつかどこかで見かけたあのページをまた見たい」と思うことは結構あって、それがニュースサイトの記事だった場合はタイトルがちゃんと付けられているから通常の履歴検索でもなんとかなったりするんだけど、「たまたま通りかかった個人のブログで流し読みした情報が、後日必要になった」なんてケースだとなかなかそうもいかない。ページの配色とか文体は印象に残りやすいから、サーチエンジンが「赤い背景で、○○について丁寧な文体で書いてあるページ」といった条件を認識してくれるようになると素晴らしいのに。</p>

<p>で、サーチエンジンが頑張ってくれるようになるまでは、閲覧したページをプロキシかましてずっとローカルに保存していくっていうのが現実的な解決策ですかね。問題はディスク容量？どのContent-Typeのものを保存するかにもよるけど、最近のHDD相場を考えればそんなに非現実的でもない気がする。pdumpfsを組み合わせるとか。</p>

<p>実は、先週WEBrickでコンテンツを延々保存するプロキシを書いてみたんだけど、保存すべきコンテンツの取捨選択が結構ややこしいことになったのでそのままお蔵入りにしてしまった。RubyとMeCabを組み合わせて、閲覧したページから抽出した名詞が自動的にタグとなって「履歴タグクラウド」みたいな夢を描いたんだけどなあ…。</p>

<p>というわけで、Opera 9.5をMac OS Xに入れて件の機能を試してみた。</p>

<div class="flickr">
<a class="flickr-image" href="http://www.flickr.com/photos/sooey/1436077511/" title="View ths photo at Flickr"><img src="http://farm2.static.flickr.com/1361/1436077511_c5e9c84c99_o.png" width="538" height="279" alt="Opera 9.5 History Search" /></a><br />
<span class="small"><strong> Opera 9.5 History Search</strong> (originally uploaded by <a href="http://www.flickr.com/people/juno_/" title="View profile at Flickr">juno_</a>)</span>
</div>

<p>ちゃんと履歴のコンテンツまで見て検索されている。</p>

<p>ただし、手元ではページを表示しただけでは検索結果に含まれなかったので、Operaを一度再起動したら検索対象に含まれるようになった。インデックスの更新タイミングがリアルタイムじゃないのかな。検索結果の見せ方にもう少し工夫が欲しいけど、なかなか期待できる。</p>
]]></content:encoded>
			<wfw:commentRss>http://old-journal.sooey.com/2007/09/25/668/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
	</channel>
</rss>
<!-- WP Super Cache is installed but broken. The path to wp-cache-phase1.php in wp-content/advanced-cache.php must be fixed! -->
