GoogleやYahooで検索できない文字

あるんですねぇ…。
検索できないコンテンツは存在していない? なんていう記事もありますが、検索できないキーワードというのも確かに存在していて、実際私は困ってしまいました。


ことの起こりはこんな感じでした。
今メンテしているシステムを使っている方(お客様ですね、平たく言うと)から「XXで検索できないんだけどどうなってるの?」と問われました。聞いた瞬間ピンと来たんだけれど憶測で物を言ってはいけないので調べてみました。
やっぱり思った通り。今のロジックではある特定の文字は検索できない仕様になっていた。治す方法はすぐに思いついたけれど副作用はある。それを説明してやるかどうかはお客様に決めてもらうことにしたのですが…。
「他にもそういう文字はあるの?」と聞かれました。納得の質問です。俺だって逆の立場だったらそう聞きます。抜かってました。すぐに調べました。ところが…みつからない…。
みつからないんだよ!困っちゃったんだよ!知っている人は知っているんだろうけどさぁ。普段なら何回か検索すれば大概の場合RFCへのリンクがヒットして解決するのに見つからなかった。俺絶不調??もしかして絶不調??


そして、何が痛かったって、そもそものきっかけになったある文字ではネット検索できないことです。致命的でした。


その文字とは…


+


まいった…
Googleのヘルプにはある程度有用な情報が載っていました。
Google で検索用語の句読点を認識させるには、どうすればよいですか。
何の解決にもなってないけどね(笑)。Yahooの方には情報が見あたらなかったです。
面白かったのは全角+の扱い。Yahooでは+で検索しても++で検索しても何も出てきません。Googleではちゃんと+がヒットします。どっちが便利なのかは微妙。


さて、仕事の方は簡単に片が付いたはずだったけれど全然違う問題が発生して解決は来週に持ち越しになりました。どうやって解決したかって?簡単。お客様に全角+がその項目に入ることがあるかどうか聞いた上で検索ボタン押した時だけ半角+を全角+にreplaceするJavaScriptかまして、検索するモジュールで全角から半角に戻してあげただけです。
日本で、ダブルバイトの国で本当によかった(笑)。シングルバイトの国の人はどうやって解決しているのだろうか??エンコードしているのかなぁ。


この記事は今日のメイン記事です。通常、文字数がオーバーしなければメイン記事の見出しをその日の見出しにするのですが今日は変えています。
なぜか?
今日の見出しにした「Webで検索できない文字」という文字列はなんとまぁYahoo検索で結果0件なんですよ。驚きました。Googleではそれなりにでてきますけれどね。
図らずも2大検索エンジンの違いがわかった一日でした。