2015年06月12日
スティーヴン・D・レヴィット、スティーヴン・J・ダブナー『ヤバい経済学』―統計的分析を補完する直観の存在
ヤバい経済学 [増補改訂版] スティーヴン・D・レヴィット/スティーヴン・J・ダブナー 望月衛 東洋経済新報社 2007-04-27 Amazonで詳しく見る by G-Tools |
8年前に流行った本。経済学というタイトルがついているが、社会の様々な現象にスポットを当て、データを分析して因果関係をあぶり出すという点では、社会学に近いような気がした。本書を読むと、そう思ったのは少なくとも私だけではないようだ(もっとも、著者本人は、自分が社会学者ではないと否定しているが)。
何年か前、研究のために長期休暇をとってスタンフォードの行動科学先端研究センターに行ったとき、自分の研究について他の研究者の前で喋る機会があった。お客の一部はなんだか怒っていて、ああいうことを研究していながらなんでいけしゃあしゃあと経済学者でございますなんて言ってるんだと聞く。お前、ほんとは社会学者だろと言うのだ。でも、部屋にいる社会学者の人たちの恐れおののいた顔をみれば、それだけでもう十分私は社会学者じゃないって思い知らされる。本書では、「銃とプールで危ないのはどちらか?」、「不動産仲介人は、自分と売り手の利益のどちらを優先するか?」、「学校の先生は学力テストの点数をごまかしていないか?」、「麻薬の密売人がママと住んでいるのはなぜか?」などといった問題に対して、データを使って答えを導いている。本書(訳書)が出版された8年前にはまだ「ビッグデータ」という言葉はなかったと思うが、著者が実施した分析方法は、ビッグデータの世界のそれと同じであるように感じた。
ビッグデータというと、入手可能なありとあらゆるデータをコンピュータにぶち込んで、統計的手法を縦横無尽に駆使し、因果関係を最も上手に説明できる簡潔なモデルを導き出す究極の分析手法であるという印象がある(私の勝手な思い込みかもしれないが)。ただ、ビッグデータを活用すれば人間はやることがなくなるのかというと、必ずしもそうではないだろう。逆説的だが、分析手法が論理的になればなるほど、人間の直観がカギを握る局面が増えるように思える。
ありとあらゆるデータをコンピュータに突っ込むといっても、結局のところどんな種類のデータを利用するかを決定するのは人間である。よって、因果関係を説明できそうな変数の”あたり”をつけなければならない。しかも、ビッグデータの目的は、一般人がすぐに思いつくような素朴な因果関係を確認することではなく、大部分の人が思いもよらなかった因果関係で、かつ原因と結果の鎖がより強い関係を発見することである。「今まで誰も見向きをしなかったが、実はこの変数が結果を最も上手く説明できるのではないか?」と直観を働かせなければならない。
本書では、アメリカで犯罪が減少した原因が考察されている。一般的には、銃規制が強化されたためだとか、麻薬市場が変化したからだと言われる。ところが、著者はここで意外な結論を導き出す。つまり、アメリカで犯罪が減少したのは、「中絶の合法化」が原因だというのである。
ある調査によると、中絶が合法化されて間もないころに中絶された子供が生を受けていたら、平均的な子供に比べて貧しい生活を送る可能性は50%も高かった。片親だけで育つことになった可能性も60%高かった。これら2つの要因―子供時代の貧困と片親の家庭―は、子供が将来犯罪者になるかどうかを予測できる最も強力な要因に数えられる。片親の家庭で育つと子供が将来犯罪を犯す可能性はだいたい2倍になる。母親がティーンエイジャーの場合もそうだ。また別の調査によると、母親の教育水準が低いことが犯罪者に至るかどうかを予測する一番強力な要因だ。中絶すれば犯罪が減るというのは、気持ちのいい話ではない。だが、学問とは、不快であっても重要な事実をつまびらかにする義務を負っている。中絶率と犯罪率の間に因果関係を認めるというのは、直観的な働きがなければなかなかできないことだろう。ちなみに、ニューヨークで犯罪が減少した理由として、しばしば「壊れ窓理論」が挙げられる。これについても、著者は一蹴している。ジュリアーニ市長が就任する以前から、既に犯罪の減少が見られたからである。
どんなデータを使うかについて直観が必要であるのに加えて、データをどのように意味あるグルーピングするかという点に関しても直観が求められる。アメリカでは、2002年にブッシュ大統領が署名した”No Child Left Behind”(一人も落ちこぼれさせない)法で「一発勝負テスト」が義務化された。これは日本の学力テストのようなものであり、生徒の学力を測定するだけでなく、テスト結果について学校が責任を求められるようになった。
著者は、責任を追及されたくない教師は、生徒の答案をごまかしているに違いないと考えた。この「ごまかしている」という状態を認定するために、著者は次のようなアルゴリズムを考案した。
最初に探すのは、クラス内の解答に異常なパターンがある場合だ。たとえば同じ解答の連なり、とくに難しい問題の部分での連なりだ。(中略)出来の悪い生徒10人が試験の最後の5問(典型的に難しい問題)で正解していたら、詳しく調べたほうがいい。それから、誰か生徒1人の解答用紙におかしなパターン―難しい問題は合っているのに簡単な問題を間違っているとか―があれば、とくに、同じ試験で同じような点を取った他のクラスの生徒数千人と比べておかしいパターンがあればそれも赤信号だ。さらに、クラス全体が過去の成績に比べてずっといい成績を取り、しかも翌年の試験では大きく成績が下がっている場合も検出できるようなアルゴリズムを作っておく。実際には、ここで書かれたものよりもずっと複雑で多岐にわたる「不正のパターン」を想定してアルゴリズムを組んだと思われる。本書では、シカゴの小学校6年生のクラスの答案を分析して、不正を発見した事例が紹介されている。この小学校では、44問からなるテストを22人の生徒が受験した。その結果、22人中15人が30問目から36問目を連続で正解するという不自然な点があり、教師がインチキをして答案を書き換えた疑いがあるとされた。
膨大なデータを意味あるグルーピングに直観的に分けなければならない事例としては、野球の配球が挙げられるだろう。かつて野村楽天の下で戦略コーチを務め、現在は楽楽天の1軍ヘッドコーチである橋上秀樹氏の著書にはこう書かれている(以前の記事「『ビッグデータ競争元年(DHBR2013年2月号)』―逆説的に重視されるようになる「直観」」を参照)。
相手投手に関する数多くのデータを収集し、「カウント別」「イニング別」「状況別」とにそれぞれ分けていくと、「このカウントになると変化球がくる」「試合の序盤は真っすぐで押してくるが、後半になると変化球が50%以上になる」「走者がいないとストライクをどんどん投げてくるが、走者を背負った途端に、慎重に攻めてくるようになる」といったように、データが増えれば増えた分だけ、「相手がどういう攻め方をしてくるか」の傾向がわかるうようになる。
野村の「監督ミーティング」 (日文新書) 橋上 秀樹 日本文芸社 2010-05-28 Amazonで詳しく見る by G-Tools |
配球分析の目的は、試合状況の変化による配球の傾向の変わり目を知ることである。配球の傾向に影響を与える状況は、投手によって異なる。さらに言えば、投手と捕手の組み合わせによっても変わる。ある投手(と捕手)の場合は、1点リードでランナーを1塁に出した途端に、慎重な配球に変わるかもしれない。だが、別の投手(と捕手)は、1点リードでランナーを2塁に背負うと、かえって大胆な攻め方を攻め方をしてくるかもしれない(2013年に24勝0敗という前人未到の成績で楽天を日本一に導いた田中将大は、このタイプだったように思える)。
投手―捕手の組み合わせごとに、配球に関する膨大なデータを、試合における様々な状況ごとにグルーピングし、意味のある差を導き出す。これがスコアラーの役割である。ただし、スコアラーは、しらみつぶしにデータを分析していては非効率だ。「この投手―捕手の組み合わせだったら、こういう状況で配球が変わるのではないか?」と直観を働かせることが重要になる。
以前の記事「『一流に学ぶハードワーク(DHBR2014年9月号)』―単純化するアメリカ人、複雑なまま理解する日本人(モチベーション理論を題材に)」、「『叙述のスタイルと歴史教育―教授法と教科書の国際比較』―whyを問うアメリカ人、howを問う日本人」でも書いたが、データ分析の結果シンプルな因果関係のモデルを構築しようとするのは、いかにもアメリカ的である。アメリカ人に多変量解析をやらせても、変数の数は極力減らそうとするに違いない。戦略論においては、KSF(Key Success Factor)、CSF(Critical Success Factor)という言葉が用いられるが、これは戦略を達成する重要な要因が、いくつかに絞られることを前提としている。
一方日本人は、望ましい行動をいくつも積み重ねていけば、自ずと望ましい結果が得られると考える。日本人が多変量解析を行えば、実に様々な変数を組み込むだろう。様々な行動の集合の結果、望ましいゴールに到達するというのは、実は当たり前のことである。多変量解析においては、変数の数が多ければ多いほど、決定係数の値は1に近くなる、つまり結果を上手く説明できるモデルになるからである。日本の場合は、KSFやCSFだけで経営をしようと思わない。むしろ、目標管理制度やBSC(バランス・スコア・カード)で目標を重層的に体系化する方を好む。