« ココログに移転 | トップページ | Mac OS X 10.4でNFSサーバーを起動するには »

2006年1月27日 (金)

Spotlightでの日本語ファイルの内容検索

改行コードが内容検索に影響を与えることはなさそう。

.htmlファイルはJapaneseText.mdimporterを導入していればどの文字コードでも内容検索可能。但しmetaタグで文字コードが指定されていれる必要あり(<html>や<head>など、meta以外のタグが全く書かれていなくてもOK)。シフトJISの場合、"Shift_JIS"と書く必要あり("x-sjis"では不可。AppleWorksで作成したファイルをHTML保存した場合、デフォルトではx-sjisになっているので注意)。指定がなければどの文字コードでも日本語の内容検索は全く不可。半角英数字ならmetaタグなしでも可だが、タグ自体を検索する(例えば<html>を探す)ことはmetaタグの有る無しに関わらず不可。

JapaneseText.mdimporter導入前に保存したeuc-jp、およびjisファイルは導入後も内容検索できない。ファイルを保存し直すか別の場所に移せば可能になる。どうやらこのインポーターは検索時に効果を現すのではなく、保存時に内容をunicodeで?データベースに保存するためのものらしい?

mi書類はShift_JISなら内容検索できる。またJapaneseText.mdimporter使用時、euc-jpでもjisでもUTF-8でも拡張子txtがついていれば内容検索可(拡張子なしだと不可)。

(08年6月1日追記)
Leopardでは上記に加え、.htmlファイルにおいて「<meta name="robots" content="noindex">」が指定してある場合も検索対象から外れてしまう模様。

« ココログに移転 | トップページ | Mac OS X 10.4でNFSサーバーを起動するには »