西内啓氏は東京大学医学部を卒業し、ハーバード大学がん研究センター客員研究員等を経て、現在は調査、分析、システム開発・戦略立案のコンサルティングを行う。
本書は、「統計学」が近年、ビジネス界で大きな注目を集めるようになった動きを一気に加速することになった 「基礎本」と言えるような書籍だ。地味な学問であった統計学を扱った本としては異例のベストセラーとなった。
統計学が、「最強の武器」になる理由は、どんな分野の議論においても、データを集めて分析することで最速で最善の答えを出すことができるからだ、というのが著者の主張だ。
統計学がまず具体的な成果を出したのは医療分野だ。現代の医療で最も重要な考え方は、EBM (Evidence Baced Medicine) = 「科学的根拠に基づく医療」 である。この科学的根拠のうち最も重視されるのが、統計データとその分析結果、というわけだ。
統計学がここ数年で大きく注目を集めているのは、ITと結びつくことにより、大量のデータを収集した企業が統計解析により価値を生み出そうとしているからだ。
ビッグデータとかビジネス・インテリジェンスという言葉で、IBM、マイクロソフト、オラクル、グーグル、NTTデータなどは、統計学の活用でノウハウやブランド力を持つ企業を次々に買収している。
誤差と因果関係が統計学のキモとなる。とくにEC(インターネット販売)企業では、A/Bテストというのを積極的に行う。統計学では、これをランダム化比較実験と呼び、他の条件が全て同じ対象をランダムに選んで比較する。
こうした結果について、「実際には何の差もないのに誤差や偶然によってたまたまデータのような差が生じる確率」のことを統計学では p 値と呼ぶ。この p 値が小さければ(通常5%以下)、科学者は「この結果は偶然得られたとは考えにくい」すなわち、「因果関係あり」と判断する。
その後、本書では回帰分析、一般線形化モデル、重回帰分析などが紹介されるが、統計学の発展経緯や分類が整理され、やや難解だが本書から得られるものは多い。
最後に、統計学はITとの融合によってその影響力を爆発的に拡大させたが、その結果としてデータマイニングと呼ばれる領域との接触が注目されるようになった、ことが説明されている。
データマイニングでは、バスケット分析やアルゴリズムを用いたクラスター分析という手法がよく知られている。データマイニングは、分類や予測には適しており、それ自体が目的なら有効だ。
世界のトップ企業が現在、ビッグデータ活用のため積極的なIT投資を行っているが、その基本的な考え方、バックボーンを知るには本書は最適だ。戦略立案の要職にあるビジネスパーソンにぜひ一読を薦めたい。