−9

今日は名寄せについて。これで一ヶ月くらい持つかな。
前回はいかに情報を集めるかという話をしましたが、逆に手元に
整理されていない情報があふれてて困っているという状況も考え
られます。
悩ましいのは、ただ情報を集めているだけでなくてお客様になん
らかのサービスを提供している場合です。顧客情報を統合すると
同時にサービスの内容も整理したくなるのが人情です。


さらに、そのサービスをWebなどを使って行っている場合には、
すでにお客様が別のIDをお持ちの場合もあります。それももちろ
ん統合してあげたいですね。


で、統合した暁には、よりよいサービスのために、A部門で持っ
ていたaというサービスとB部門で持っていたbというサービスの
両方を受けていたお客様にはcというサービスも提供しよう!
とかいう話になりがちです。


回り道しましたが、こういう場合どうしてもデータマージ「名寄
せ」は避けて通れません。
専門の会社やソフトベンダーからいろいろなソリューションが提
供されていますが、あまり期待しないでください。
最終的に名寄せのルールを決めるのは運用する会社自信でなけれ
ばならないからです。
名寄せ作業自体をアウトソーシングすることもできますが、経験
上品質の管理が難しいのと、万一の情報漏洩が怖いのであまりお
すすめできません。


名寄せで一番重要なことは、どの項目をキーにするかというとこ
ろですがそこのアドバイスはできません・・・
なぜなら使う人がその使い方に応じて決めるべきことだからです。
企業上層部も巻き込んだ議論が必要だと思いますよ。まじで。




なので、今日からしばらくは小手先の技の話に終始しようと思い
ます。


今日は氏名情報のさわりを・・・


氏名はどういう風にデータとしてもつとよいでしょうか?私の考
えでは、姓と名は分けて管理した方がよいです。
分けて管理している物をつなげるのは簡単ですが、分けていない
物を分けるのは大変だからです。


でも、分けて管理するには最初の手間が大変です。そこでトリビ
ア(笑)

「日本人の姓は2文字が8割」

これは統計的に調べた話でも何でもなく、私の経験則です。
エクセル関数で言うと A にくっついている氏名、Bに姓、Cに名
が有ると仮定して
B の列 "=left(A1,2)"
C の列 "=right(A1,len(A1)-2)"
でできます。これを値だけコピーすればいいです。


この作業をする前に氏名の列は全角化しておいてください
外国の方が多い場合は全角大文字化したほうがよいかも。
さらに前後のブランクも削った方がよいかも。ということで
=trim(upper(jis(A1)))
これでできたデータのうち
=if(iserror(find(" ",A1)),1,0)
で、1になったデータだけを処理対象とすれば楽になります。


今日はこの辺で・・

                                                                                                              • -