2010年12月16日木曜日

数式を使わないデータマイニング入門 ~隠れた法則を発見する~を読了!

数式を使わないデータマイニング入門 隠れた法則を発見する (光文社新書)

2006年の新書だけど、今でも全然いける内容。
新書の多くはそのときの新鮮なネタで年をまたぐと輝きを失うものが多いが、本書は違った。

これからの時代、もっと輝く、昆布的な存在感の本となるだろう。
以下、目次。

第1章 隠れた法則を見つける技法
第2章 ビジネスで使われるデータマイニング
第3章 データマイニングの手順
第4章 落としどころを探る―回帰分析
第5章 効率的に判断する―決定木
第6章 分けることは分かること―クラスタ分析
第7章 複雑な分類―自己組織化マップ
第8章 買い物かごの中身は?―連関規則
第9章 神経をまねしてみる―ニューラルネット
第10章 データマイニングと情報管理
第11章 監視社会とデータマイニング

以下は簡単なメモ

『分類』
クラスタ分析、決定木分析、自己組織化マップ
『関連発見』
連関規則
『予測』
回帰分析、ニューラルネットワーク

☆決定木
定性データ。育てすぎると過学習。「オッカムの剃刀」

☆クラスタ
・K-means法:いくつのクラスタに分けるか決める
       プロット、中心点計算

☆自己組織化マップ
分けのわからなさ→多次元データを二次元に。
・コホーネンネット:入力層と出力層の二層から構成、出力層は格子状のマップ

☆連関規則
紙おむつとビール。格言には連関規則が多い。

☆ニューラルネットワーク
学習能力と並列性を利用し、神経回路を模倣。
学習方法は各パラメータへの重み付け。
「交差妥当化」

・OECDプライバシガイドライン
1、収集制限の原則
2、データ内容の原則
3、目的明確化の原則
4、利用制限の原則
5、安全保護の原則
6、公開の原則
7、個人参加の原則
8、責任の原則




 

0 件のコメント:

ページビューの合計