2014年3月23日日曜日

はじめてのパターン認識を読了しました

はじめてのパターン認識

俗に言うはじパタである。
ついに読み終わったはじパタ。
PRMLに行く前の準備運動になればと思ったが、タイトルとは裏腹になかなかハードコアな内容だった。
機械学習については、色々な言語のパッケージの紹介だったり、コードが載ってたりするのが多いが、本書は理論や数式、証明などがふんだんに掲載されている。
Rの実行結果がおなぐさみ程度で出てきているが、コードはないし、データセットもなかったりなので、写経して学びたいという方にはあまり向かないかもしれない。

まあ、個人的にはこれでようやくPRMLないし、他の機械学習本に立ち向かえると思うと良かったと思う。
1人で読んでいると挫折しそうだが、みんなで読むと新たな発見もあり、オススメな形式である。
ところどころに誤植っぽいのもあるが、実力をつけたい方にはオススメ。初学者は厳しいと思うが、チャレンジする価値はあると思う。

■目次
第1章 はじめに
1.1 パターン認識とは
1.2 特徴の型
1.3 特徴ベクトル空間と次元の呪い
第2章 識別規則と学習法の概要
2.1 識別規則と学習法の分類
2.2 汎化能力
第3章 ベイズの識別規則
3.1 ベイズの識別規則
3.2 受信者動作特性曲線
第4章 確率モデルと識別関数
4.1 観測データの線形変換
4.2 確率モデル
4.3 確率モデルパラメータの最尤推定
第5章 k最近傍法(kNN法)
5.1 最近傍法とボロノイ境界
5.2 kNN法
5.3 kNN法とベイズ誤り率
5.4 kNN法の計算量とその低減法
第6章 線形識別関数
6.1 線形識別関数の定義
6.2 最小2乗誤差基準によるパラメータの推定
6.3 線形判別分析
6.4 ロジスティック回帰
第7章 パーセプトロン型学習規則
7.1 パーセプトロン
7.2 誤差逆伝搬法
7.3 誤差逆伝搬法の学習特性
第8章 サポートベクトルマシン
8.1 サポートベクトルマシンの導出
8.2 線形分離可能でない場合への拡張
8.3 非線形特徴写像
8.4 ν-サポートベクトルマシン
8.5 1クラスサポートベクトルマシン
第9章 部分空間法
9.1 部分空間
9.2 主成分分析
9.3 特異値分解
9.4 部分空間法
9.5 カーネル主成分分析
9.6 カーネル部分空間法
第10章 クラスタリング
10.1 類似度と非類似度
10.2 非階層型クラスタリング(K-平均法)
10.3 階層型クラスタリング(融合法)
10.4 確率モデルによるクラスタリング
第11章 識別器の組み合わせによる性能強化
11.1 ノーフリーランチ定理
11.2 決定木
11.3 バギング
11.4 アダブースト
11.5 ランダムフォレスト

僕が輪読会で発表したスライド。




2014年3月3日月曜日

FIBC2014に参加してきた

今日はISID(電通国際情報サービス)さん主催のFIBC2014に参加してきた。
今年でかれこれ3回目の開催の運びとなったようだが、縁あって主催者と知り合ったり、去年とか知り合いがかなり登壇していたり、自分の過去の金融経験とかも相俟って、本日はお休みをいただいてこちらに参加した。

いちおう、開催概要はLPのリンクを貼っておく。
FIBC2014

ISIDさんのこの試みはとてもすばらしいと思っています。以下、開催目的抜粋。
ISIDはかねてより、大手都市銀行をはじめとする数多くの金融機関において、インターネットバンキングやローン審査など個人向け金融サービス分野のシステム構築や、マーケティング支援などのサービス提供を手掛けてまいりました。また欧米における金融イノベーションの潮流や日本の金融ベンチャー企業の動向にも早くから着目し、新たなサービス開発にも積極的に取り組んでいます。ISIDは、本イベントの開催を通じ、日本における「金融イノベーション」の創造と浸透をテクノロジーの側面から支援することにより、日本の金融サービス市場の活性化に貢献してまいります。

まあ、かなり趣味的な要素で参加してきたので、せっかくなのでブログに書いて内容をシェアしようかな。

FinPitchと呼ばれるスタートアップ企業による7分間プレゼンは本場の体裁を取り入れているらしい。
候補は30社ほどあったようだが、そのうちの12社によるプレゼン、キーノートセッション、ネットワーキングによる構成。

最終的に会場からの投票で、1位と2位が決まるという方式をとっている。
今年は2位がPay Gateで1位がMoneyForwardだった。
個人的にこの結果(昨年の結果もそうだが)には思うところがありすぎるのだが、時代だと思う事にしている。

今回、12社あったが、大きく分けて3種類かなと思う。
1、決済
2、パーソナルファイナンス
3、クラウドファンディング
※ホットリンクさんだけ、毛色が違ったけど、とても面白いサービスだった。


以下、各社のプレゼンのメモ。サービス概要などは上のリンクを参照してほしい。

・はじめに
デンマークは知的資産の活用に成功しているらしい

・VCF財務経営力診断サービスの紹介(ISIDさん)
中小企業への貸し付けがだいぶ減っている。
会社の問診票的なもの
TKCと一緒に開発
定量と定性(問診票入力)→ロジックツリー出力
中小企業金融のマッチングを担う

・一括アプリ
住宅ローンの比較サービスで申し込みの一括入力が売り
Webアプリケーション、入力情報はサーバーかローカルかは不明
アフィリエイトビジネス
データベース・ソーシャル・マーケティングが今後の展望

・Web Pay
導入が2-6時間くらいにできる(SIMPLE)
JSだけでなく、複数言語のソース埋め込みが可能
ワンタイムトークンでアクセスするのでセキュアとのこと

・ホットリンク(order book tracer)
板情報の追跡者ということらしい
板情報の可視化(過去情報も)
約定分布の可視化も可能
ボラティリティ、方向性の予測(経済物理学領域の手法使ってる)
予測成績も可視化(1分先、5分先〜20分先の分布などを出す)
月額125ドル(ブルームバーグ端末のアドオン)

・Kyriba Overview
サンブリッジに出資を受けている
資金効率最適化、リスク管理強化、財務管理の効率化(グローバルで)
Excel管理!→マクロのお化け
Webブラウザで財務管理情報にアクセスできるBI
クラウドだから従来のオンプレよりも安いというポジショニング

・Crowdcredit
金融業2種免許申請中
調達したい国と運用したい国のマッチング(クラウドファンディング)
40程度の国に進出可能(中南米とか)
適格機関投資家とサービスやってる
ペルーのオートローン投資(ガス代に上乗せとかして回収)
延滞債権投資もやっている。
対象はマイクロファイナンス以上、貸し付け未満の層
※為替リスクとかありそう?
元ロイズ銀行出身者
イギリスは出資者がいないというグローバル課題があり、その是正を狙った

・クラウドバンク
資産運用大事って話
スキームはファンドと一緒。
平均利率5%くらいだが、デフォ率高そうなファンドっぽい
一口3万円〜
3ヶ月で1億8千万ちょっと集めた
立ち上げ時はプッシュしたw

・ZUU
金融リテール市場での富裕層向けの専門家マッチングサービス
(アドバイジングプロセスをIT化)
保有資産3000万以上の富裕層(日本では1000万世帯?)
アドバイザーへのQ&Aで相談員をどんどん減らしていく
どうやって信頼性を担保するか
どうやってユーザーの心理的負担を軽減するか
ビジネススキーム(まだ確立してないっぽい)アドバイザーの広告代理みたいの

・スマレジ
iPadなどにはバーコードスキャン
レシート発行なども
商品情報の在庫などもチェックできる(マルチテナント対応もしてる)
顧客情報もPWつきで見れる(CRM的な活用)
管理はクラウドサーバー、リアルタイムでのダッシュボード確認もできる
飲食25%、アパレル20%など導入。全部で600企業
対象顧客→スマレジエリア(56万店舗くらい)
TEC、ビジコム競合(対象顧客の違い):スクエア、ユビレジ、コイニーはもっとボトム向け
販売戦略、導入戦略:スモールスタートできる。POSで把握したいオーナー向け
競合との差別化(決定打):聞いた事ないw

・TOIRO
女性向けのお金相談アプリ(アラサー女性)
NTTメディアサプライ
ライフプラン、適性予算、支出管理、匿名シェア
ライフプランは質問に回答することでやる
シミュレーションもできる(年収**万円の人と結婚したらなど)
ライフプランデータの可能性:気づきの提供、ライフイベント時の連携
ココマネのアドオン的位置づけ

・PAY GATE
決済ソリューション
消費支出の15%程度しかクレジット決済ないが、これを50%くらいにあげたい
エンタープライズ向け(運送、保険、ビザデリバリー)
PAY GATE open platform
色んな決済デバイスを開発している
UI良い

・Longine
個人投資家向け日本株投資情報メディア
情報格差の是正
IR取材における個人と機関の差
※既存の金融情報サイトとの差別化とかはどうなのか
コスト高そうなアナリストの面々
銘柄推奨が一番人気(クレーム対処が気になる)
過去の変遷もできる
サブスクライバ 1ヶ月1,050円 コンテンツ販売 企業IRレポート
アナリストのクオリティがまるで違う
価格メリット
カバレッジ銘柄:120~150

・Moneyforward
ソーシャルログインやってるっぽい(G+とFB)
会計版はビジネス版の情報取得に重きを置いてる
消し込みは自動で可能
請求書の作成もできる
権限設定ができる(閲覧のみとか、士業用とか)
プレミアム会員800円、法人向けは1800円


・キーノート
R&Dが世界とずれている
Rは強いがDがダメ
アメリカのような循環イノベーションが日本で起きないのはなぜか
Bitcoin
海外では日本政府が黙認したが故に起きたという見解らしい
最近のイノベーションの定義:Science+Enginnering+design デザイン必要
どうDiversityを反映させていくか
女性の活用が低い
GDP+16%を放棄している
若い人の活用もできてない
27歳という年齢:一番クリエイティブでイノベーティブな年齢
経験しろよと。(失敗は成功の母)
知識をどうやって経験に反映させていくか
MOOC 大規模オンライン講義 動画公開などのあれ
11歳のパキスタン人の例
アントレプレナー? change agent →アイデアを実行する者
成功するアントレプレナーが持っている
Passion
Vision
リスクマネジメント
事故の報告書読んでみて→原因は同じ
人間は間違える
機械は壊れる
事故は起きる
レジリエンス(復元力)が大事 resilience
チーム力大事 passionate team
チームを運営するのがリーダーシップ
技術のS字カーブの最初のリフトアップはチーム
グループは漸進的イノベーション(S字の中腹)→マネジメント
なぜ日本のチーム悪い?
Fear of Conflict 衝突を極端に嫌う傾向
Absence of Trust 信頼性の欠如
Hiding Weakness 失敗を責めたてる風潮/弱みをさらけ出せない
Successの逆はNot Doing Anything
PDCA活用してるのは日本くらいw

最後のキーノートは非常にためになったし、全体的にかなり面白かったので行った甲斐があったなと感じた。
ISIDさん、楽しいイベントをありがとうございました。引き続き金融業界の活性化をお願いします。

ページビューの合計