書評ブログ

ビクターマイヤー・ショーンベルガー『ビッグデータの正体』(講談社)

この本は、ビッグデータの本質が理解できる画期的な本だ。ビッグデータについては、数多くの書籍が出ているが、その中でも本書は秀逸の書だろう。

 

とくにビッグデータの本質として、以下の2点を指摘した点は新たな視点として注目だ。第一は、サンプルデータではなく、全部データを分析できるようになった点。全てのデータということで、当然誤差やノイズの存在は否定できないが、それを補って余りある量の力がある。

 

第二は、「相関関係より因果関係」という流れがはっきりした点。これまでは、少ないサンプル情報から因果関係を推察して分析してきた。全部データが活用できれば、相関関係の有効性が明確になる。理由はわからなくても結果さえわかればいい、ということだ。

 

こうしたビッグデータの活用が可能となった背景として、情報革命がある。とくにインターネットの発明とコンピュータの発達による高速データ処理コストの低減が、全部データの高速処理を可能にした。

 

IT技術革新最新の統計学による統計手法が結びついて、ビッグデータ活用の道が開かれた。アマゾンのリコメンド機能(推薦書籍のサイト表示)は、以前は熟練の書籍評論家チームが因果関係分析により行っていたが、今はすべてビッグデータによる相関関係により行っている。

 

結果は、コンピュータのデータ分析、すなわち、理由はわからないが、相関関係によるリコメンドが約2倍の売り上げ実績を上げた。要するに、この本を買った人は、こっちの本も買っている、という相関ロジックによる推薦だ。

 

IT革命ビッグデータの本質がわかる画期的なビッグデータの決定本として、ぜひ本書を薦めたい。