名寄せとは?その意味や実施するプロセス、ツールを用いるメリットを解説
同じようなデータが複数の箇所に存在し、内容が少しずつ異なるため、どれが正しいかわからない…。
そんな悩みを抱えている方も、多いのではないでしょうか。名寄せはこのような課題を解決する、データ管理の手法です。適切に名寄せしたデータは管理の手間を省くだけでなく、貴社の事業発展にも貢献します。
名寄せは、どのように行えばよいのでしょうか。この記事では名寄せの意味や方法、活用するツールについて、詳しく解説します。
名寄せとはどのような手法なのか?
日々の業務でデータを登録していくと、同じようなデータが複数のデータベースに存在してしまう事態がどうしても起きてしまいがちです。また、企業が合併すると、両社の持つ顧客データに重複が発生します。
「名寄せ」は、このような状況を解決する手法です。いくつかの項目を手がかりにして、複数のデータベースで重複して持つデータを同一人物や同一の法人として扱い、1つにまとめる作業を指します。
名寄せの手がかりとなる代表的な項目には、以下のものが挙げられます。
- 顧客番号など、顧客を特定するID
- 氏名や名称
- 住所
- 電話番号
データのなかには以下のとおり、表記が統一されていない場合もあることに注意してください。
- 1-1-1
- 1-1-1
- 1の1の1
このような表記のゆれを統一する「データクレンジング」も、名寄せを実施する工程の一部に含まれます。
名寄せを行う理由とメリット
名寄せはデータ管理において、重要かつ必須の項目です。事業の成否を左右する項目といっても過言ではありません。ここからは名寄せの重要性と事業運営にもたらすメリットを解説します。
なぜ名寄せは重要なのか?
名寄せが重要となっている背景として、ビジネスにおけるデータの価値がこれまでになく高まっていることが挙げられます。データは簡単に作成できるため、誤った内容で保存されたり、古いままのデータが残ってしまっていたりするケースも少なくありません。
正確なデータを持っているか否かがビジネスの成功を左右することは、名寄せが重要な理由の一つです。以下のケースを考えてみましょう。
取引先の会社名 | 担当者 | 電話番号 |
スーパーDX商事株式会社 | 森林 亜紗 | 012-204-3365 |
スーパーDX商事株式会社 | 森林 亜紗 | 0579-65-8006 |
スーパーDX商事株式会社 | 森林 亜紗 | 0945-58-3808 |
担当者名が同じで電話番号だけが違うデータが3つできています。「012」から始まる番号が最新の正しいデータの場合、0579や0945で始まる電話番号にかけてしまうと「その方は社内に在籍していません」と返答されるかもしれません。
これではビジネスチャンスを逃してしまうため、名寄せを実施して正しいデータだけにアクセスする仕組みづくりが必要です。
また、同じ顧客のデータが複数保存されていると、営業電話を複数回かける、ダイレクトメールを複数送付するといった事態が起こりえます。その結果、顧客に不信感を抱かれるかもしれません。
データを適切に管理している企業という印象を与えるためにも、名寄せの実施は重要です。
名寄せを行うメリット
名寄せを行うことにより、さまざまなメリットが得られます。代表的な項目を、以下に挙げました。
- データが整理された状態で使える
- データの不備によるチャンスロスを防ぎ、商談につなげやすくなる
- データを格納する容量を減らせる
- 手紙やメールを複数出さずに済み、営業活動を効率的に行える
- 顧客からの信頼が高まる
名寄せにより、最新かつ正しいデータを活用できます。適時適切なタイミングでアプローチを行えるため、売上の向上に寄与するでしょう。加えて、貴社が「データをきちんと管理できている、信頼のおける会社」と顧客から評価されることは、商談においてプラスに働きます。
また、名寄せはコスト削減にも役立ちます。複数の箇所に散らばっている顧客のデータを1つにまとめられるため、データ容量を削減できます。
ハードディスクの増設やクラウドのストレージを増やす必要がなくなれば、費用を抑えられます。手紙を発送する数も減らせるため、郵送料の大幅な削減も可能です。
名寄せを行う4つのプロセスを解説
データの活用に欠かせない名寄せは、どのように進めればよいのでしょうか。4つのプロセスに分けて、ポイントを確認していきましょう。
データを調査して名寄せ対象とすべきデータを選別する
まずは名寄せの目的を明確にしたうえで、名寄せ対象とすべきデータを選別するところから始めましょう。対象となるデータは、目的により異なります。たとえば合併による重複を解消したい場合は、A社とB社両方に存在するデータが対象となるでしょう。
名寄せ対象のデータが決まったら、現状のデータがどのようになっているか調査してください。たとえば、表の構造をチェックして格納されている項目名を知る、といったことです。
調査した結果をもとに、データをまとめる方向性を決めましょう。どのような方向性でまとめるかにより、その後の作業項目や作業内容、工数などが変わることに注意してください。以下に挙げる項目は、ぜひ決めておくとよいでしょう。
- 収集・記録する項目の選定
- 入力可能な値の種類(文字列、金額、数値など)を、項目ごとに決定する
- 重複するデータはどちらを正とするか
- 欠損値がある場合の対応方針を決定
- IDを付与するルールを作成
収集・記録する項目は、多ければ多いほどよいというわけではありません。項目が多いほど入力や管理の手間がかかり、ミスも誘発しやすくなります。必要な項目を厳選して集めることが、データを活かし事業の発展に役立てるコツです。
データを抽出してチェックする
名寄せの対象とするデータが決まったら、実際にデータを抽出する作業に移ります。
名寄せにおいてはデータベースにつないでデータをダウンロードする作業よりも、その後の対応が重要です。それは、ダウンロードしたデータの項目が、取得元のデータベースや表によってばらばらというケースがよくあるためです。代表的な例を以下に挙げました。
- 列名が「会社名」のデータと「法人名」のデータがある
- 氏名をまとめて管理するデータと、「氏」「名」で分けて管理しているデータがある
1つめのケースの場合、「名称が似ているからきっと同じ」と判断することは早計です。どのようなデータが入っているかきちんと確認したうえで、本当に同じ種類のデータなのかチェックしましょう。
2つめのケースの場合は、同じ種類のデータかどうか確認するプロセスに加えて、データをどちらの形式に合わせるか検討する必要があります。収集したデータをどのように活用するかという観点を踏まえて、1つにまとめるのか、それとも細かく分けるのかを決めましょう。
たとえば住所の場合、都道府県や市区町村名で検索するケースが多いのであれば、「都道府県名」「市区町村名」のように分けて管理する方法が適切です。
データクレンジングを実施する
データの抽出が終わったら、データクレンジングを行います。データクレンジングは以下の作業を行い、データの品質を向上する作業です。
- 重複データを取り除く
- 表記のゆれ(ハイフン、全角と半角、和暦と西暦、旧字体と新字体など)の解消
- 破損したデータや異常値を含むデータへの対応
データクレンジングは、名寄せするほとんどのケースで必要な工程となるでしょう。実際にデータを確認すると、以下に挙げる問題が発見されるケースも少なくないためです。
- 列の一部に欠損値(値が入っていない行)がある
- 表記が不統一(「1-2-3」と「1-2-3」の混在など)
- 単位が異なる(1,010,000円の場合、A社は101(万円)、B社は1,010(千円)と表記など)
- イレギュラーな値が入っている(数値だけの箇所に文字が入っているなど)
上記のような問題があると、データを十分に活かせません。表記を統一するとともに、欠損値やイレギュラーな値への対応方針も決める必要があります。どのように変えるかは、データが示す値の特徴によって変わります。統一したルールを決めたうえで、データを修正しましょう。
データのマッチング処理を行う
データクレンジングを終えた後は、マッチング処理に移ります。同一顧客のものと判別できるように、顧客ごとに一意のIDを付与する手順です。顧客名が同一でもIDが別であれば、データが別の顧客のものであることを容易に判別できるというわけです。
データが同一顧客かどうかの判別は、簡単ではありません。世の中には同姓同名の方、また同じ社名を名乗る企業も多数あります。実際には顧客名や住所、電話番号など、複数の項目を手がかりとして、同一顧客のデータかそうでないかを判別することになるでしょう。
マッチングを進めやすくするためには、データクレンジングをきちんと行っていることが重要です。どちらも手間のかかる作業ですが、手を抜かずに作業を進めましょう。
マッチング処理では複数のデータがある場合、1つを残して他を削除する処理も行います。正しいデータにのみアクセスできる環境をつくることは、正確な業務の遂行につながります。顧客からの信頼も得られることでしょう。
名寄せを活用するためのツール
名寄せの実施には、何らかのツールを使うケースが多いでしょう。名寄せに使えるツールは、いくつかあります。ここではExcelと専用ツールに分けて、メリット・デメリットを確認していきましょう。
Excelで行う際の注意点・デメリット
名寄せの実施において、身近なツールであるExcelを活用しようと思っている方も多いのではないでしょうか。ふだん使っているツールを活用でき、ゼロから使い方を覚える手間がないことはメリットに挙げられます。
一方、Excelで名寄せを実施する際には、注意点やデメリットも知っておく必要があります。おもな注意点を、以下に挙げました。
- 多種多様な関数を覚え、使いこなす必要がある
- データが破損した場合は、バックアップから戻す必要がある
名寄せに使える関数は、全角を半角にする「ASC関数」やその逆の「JIS関数」、検索条件に一致する数を知る「COUNTIF関数」など多種多様です。名寄せの際には関数の特徴を把握したうえで、適切に使いこなせなければなりません。もしExcelで作ったデータが破損した場合は、バックアップから復元する必要があります。
Excelでの名寄せは、万能ではありません。以下のデメリットがあることも認識しておきましょう。
- データを見て自動的に名寄せする機能はついていない
- ITに抵抗を持たない方でないと、使いこなしにくい
- 複数の担当者による管理には不向き
- 1つのシートに記録できる行数は1,048,576行に制限される
上記のデメリットがあるため、大量のデータを持つ企業や多くの従業員を抱える企業、ITに詳しい従業員がいない企業においては、Excelでの名寄せは最適の手法といえません。
専用ツールを用いるメリット
名寄せの業務をスムーズに行うことを目的としたツールは、多数あります。これらの名寄せ専用ツールでは、Excelを使うデメリットが解決されています。名寄せ専用ツールを使う代表的なメリットを、以下に挙げました。
- 辞書を搭載しているため、名寄せを自動で行える。アウトプットの精度も高い
- Excelの関数を覚える必要がなく、ミスも起きにくい
- 名寄せに要する工数を、他の業務にまわせる
- データ量の上限を気にせず使える(大量データでも処理可能)
- サポートが充実しているため、操作に不明な点が生じた場合でも解決しやすい
- 充実したセキュリティにより、情報漏洩のリスクを下げられる
名寄せ専用ツールならばITに詳しい方が社内にいない企業、拠点数が多く担当者の多い企業、大量データの処理が求められる企業でも安心して使えます。
月々のランニングコストが数万円に達するツールがある一方で、「OpenRefine」のように無料で使えるツールも用意されています。貴社が求める機能と用意できる予算をチェックしたうえで、適切なツールを選ぶとよいでしょう。
ツールを使った名寄せで迅速・正確なデータの活用につなげよう
名寄せは貴社の発展を左右する、重要な業務です。Excelでも行えますが、手順や覚える関数の多さにうんざりする方も多いのではないでしょうか。せっかく集めたデータも、名寄せを行わないままでは宝の持ち腐れになりかねません。
確実な名寄せの実行には、専用ツールの活用がおすすめです。Excelよりも速く大量のデータを活用でき、誰でも簡単に使えることは大きな魅力です。ツールを使った名寄せで、迅速かつ正確なデータの活用につなげましょう。