Webのコト、教えてホシイの!

データ活用に必要なデータのクレンジングや統合が簡単にできるって本当ですか?/フロムスクラッチの矢矧さんと井戸端さんに聞いてきた(4ページ目)

ここから始まります
さまざまな部署が
長年溜めてきたデータは
フォーマットが
バラバラで
データをきれいにしたり
データ統合したりしないと
使えないんですよ
すればいいじゃ
ないですか
数百や数千なら
手作業でなんとか
なりますが
データ量が
数万件や数十万件になると
そう簡単に
きれいにしたり
データ統合したり
できないですよ
それでは
いったい何がどう
バラバラなのか
顧客データを例に
説明しましょう
たとえば
会社に蓄積されている
顧客データの
名前や生年月日や
住所ですが
こういったような
表記の揺れがあります
○住所の場合
・1-2-3
・1丁目2番3号
○生年月日の場合
・1984年1月1日
・1984/1/1
○表記
・株式会社
・㈱
・○ヶ月
・○ヵ月
○記号
・半角表示
・全角表示

この記事をシェアしてほしいパン!

人気記事トップ10

人気記事ランキングをもっと見る