2011年8月3日水曜日

データマイナーの思い込み 〜データマイニングの神話と思い込み〜をみて

ふとしたところから、SPSSさんのホワイトペーパーを見つけた。

データマイナーの思い込み 〜データマイニングの神話と思い込み〜
PDF注意


これ読んで、いろいろと感慨深かったので、エントリにしたためることにした。

ちなみに、PCを代え、MBPからの初投稿であるのも感慨深い。

さて、本題に戻ろう。

まずね、導入部分がすばらしい

勇敢なデータマイナーたちは常に危険と隣り合わせである。例えばデータの山にうずもれてしまったり、大量のデータがなぜか消えてしまったり‥
このエッセイでは、データマイニングにまつわる神話とデータマイナーたちの思い込みの正体を暴いてみたい。

おお!それは楽しみですね!
最近、いろいろデータへの悩みはつきないので、わくわくしながら読むわけです。

■データマイニングの神話と誤解
 神話1:データマイニングは分析手法 アルゴリズムがすべて
 神話2:データマイニングは予測精度がすべて
 神話3:データマイニングにはDWHが必要
 神話4:データマイニングには膨大なデータが必須
 神話5:データマイニングは分析の専門家にしかできない
 神話6:ニューラルネットワークは不透明なので使えない。

 落とし穴1:データの山に埋もれる
 落とし穴2:テラバイトの不可思議な消失
 落とし穴3:ビジネスを知らない
 落とし穴4:データを知らない
 落とし穴5:誤った前提:エキスパートに対する過度な礼儀ただしさ
 落とし穴6:データマイニングツールの非互換性
 落とし穴7:データの牢獄に閉じ込められる
 落とし穴8:まとまりのないデータマイニング

詳細はPDFがDLフリーなので、興味のある方はみてほしいです。

もう、1つ1つが耳にいたいわ、胸に刺さるわでしたw

僕は営業サイドからきた分析見習い(現状)ですが、データ量のことやアルゴリズムは本当にこう思っていた節があります。
言い訳にすぎないのかなーって感じでした。
がんばります。

あと、前回のTokyoWebminingで話が少し出てましたけど、エンジニアがビジネスのことをあまり知らないケースはむしろ普通の状況だと思います。
でも、このホワイトペーパーによると、データマイニングはビジネスプロセスと密接に関わっているので、ビジネスを知らないのはだめだと書いてあります。

そういう意味で、ああいう勉強会の場で、我々のような現場上がりの人間の情報を共有することは大変意味のあることなんだと思いました。
最近のソーシャルメディアの文脈で語られているのですが、「知」ということはまさに関連性に意味があるわけです。

どんなに優れた知でも、いろんな人が知らない、共感しないようなものでは意味がない。

今回、いろいろと思い知らされたので、ご紹介しました! 

0 件のコメント:

ページビューの合計