日々の気になる出来事: 数式を使わないデータマイニング入門～隠れた法則を発見する～を読了！

2010年12月16日木曜日

数式を使わないデータマイニング入門～隠れた法則を発見する～を読了！

2006年の新書だけど、今でも全然いける内容。
新書の多くはそのときの新鮮なネタで年をまたぐと輝きを失うものが多いが、本書は違った。

これからの時代、もっと輝く、昆布的な存在感の本となるだろう。
以下、目次。

第1章隠れた法則を見つける技法
第2章ビジネスで使われるデータマイニング
第3章データマイニングの手順
第4章落としどころを探る―回帰分析
第5章効率的に判断する―決定木
第6章分けることは分かること―クラスタ分析
第7章複雑な分類―自己組織化マップ
第8章買い物かごの中身は?―連関規則
第9章神経をまねしてみる―ニューラルネット
第10章データマイニングと情報管理
第11章監視社会とデータマイニング

以下は簡単なメモ

『分類』
クラスタ分析、決定木分析、自己組織化マップ
『関連発見』
連関規則
『予測』
回帰分析、ニューラルネットワーク

☆決定木
定性データ。育てすぎると過学習。「オッカムの剃刀」

☆クラスタ
・K-means法：いくつのクラスタに分けるか決める
　　　　　　プロット、中心点計算

☆自己組織化マップ
分けのわからなさ→多次元データを二次元に。
・コホーネンネット：入力層と出力層の二層から構成、出力層は格子状のマップ

☆連関規則
紙おむつとビール。格言には連関規則が多い。

☆ニューラルネットワーク
学習能力と並列性を利用し、神経回路を模倣。
学習方法は各パラメータへの重み付け。
「交差妥当化」

・OECDプライバシガイドライン
１、収集制限の原則
２、データ内容の原則
３、目的明確化の原則
４、利用制限の原則
５、安全保護の原則
６、公開の原則
７、個人参加の原則
８、責任の原則

　

0 件のコメント:

コメントを投稿

日々の気になる出来事

2010年12月16日木曜日

数式を使わないデータマイニング入門～隠れた法則を発見する～を読了！

0 件のコメント:

ページビューの合計

本棚

amazon

2010年12月16日木曜日

数式を使わないデータマイニング入門 ～隠れた法則を発見する～を読了！

0 件のコメント:

ページビューの合計

数式を使わないデータマイニング入門～隠れた法則を発見する～を読了！