統計的な差







日本人は、データが大好きである。なんでも数字で示したがるし、定量的な指標があると、すぐに納得してしまう。%の数表なども、アメリカではせいぜい整数部分だけ、甚だしきは10%台に四捨五入してしまったデータで充分なのに、日本では、有効数字を越えて小数点以下何桁も揃えたものをありがたがる。そういえば、数表にうやうやしく罫線を引いて飾り立てるのも、日本特有の傾向のようだ。

こう考えてゆくと、日本人とデータの関係がよくわかる。日本人のデータ好きは、理性の産物ではなく、宗教なのだ。数字に神が宿る。数字にしてしまえば、たちどころにご利益がある。だからこそ数字が好きなのであって、本当の意味で定量的に把握・理解しているワケではない。だからこそ、基本的には捏造したデータであっても、数表にした時点から一人歩きをはじめ、いつのまにかそれが真実になってしまう。これもまた、「数字教」の成せるワザである。

数字大好き、だけど数字音痴という日本人が最もハマりやすいワナ、それは統計的処理の意味がわからないという点である。統計的処理は、個々の要素がどうなっているかに関わらず、大量の要素を集めた全体として、なんらかの傾向値が見出せるかどうかを判断するものである。熱力学的な法則性と個々の分子の動きのように、その間に何らかの関係はあるにせよ、それを問題にせずに全体の傾向を扱えるところにポイントがある。

たとえば「日本人」という集団を見た場合、それぞれの個人を見れば、マジメなヒトも、いい加減なヒトも、いい人も、悪いヒトも、いろいろいる。人種的に見ても、個人レベルでは、あらゆる系統のヒトを抽出することが可能である。しかし、ランダムに千人ぐらい取った集団をいくつも抽出すれば、どの集団にも共通であり、なおかつ他の国民とは違う傾向を見出すことが出来る。この集団になってはじめて出てくる特徴を取り出すのが、統計的な手法である。

統計的な特徴は、その個別の成員がどういう特徴を持っているかとは、基本的に関係ない。集団全体の傾向と同一の傾向を示す個人もいるが、全くそういう傾向を持たない個人もそれなりに多い。だが、全体としてはどちらが多いのかという結果論が、その集団全体の傾向を決めるワケである。そして、複数の集団間でその傾向を比べ、その数値の差が、集団間の違いとして認められるものかどうかまで、数学的に判別することが出来る。

この、「集団としての統計的な傾向」と「各個人の特性の違い」が、まったくの別物であることを理解していない人が、日本人には多いのである。この典型的な例が、血液型である。A型の特徴、B型の特徴というのは、元々は個人の特性の違いではない。A型の集団と、B型の集団を比べたときに、その特徴に差があり、その差が統計的に有意なものであるかどうか、ということでしかない。

しかし、多くの人にとっては、「A型の特徴」は、A型の個人一人一人に当てはまる特徴と理解されている。だからこそ、根拠がないとか、非科学的だと言うヒトがいる。しかし、集団としての統計的な傾向の差であるなら、根拠はあるし、科学的なのだ。これは、占いとかでも同じである。おうし座のヒトが、個人レベルで全て同じ運勢というのはありえないが、おうし座と他の星座のヒトを比べた集団としての差であるなら、極めて説得力を持つ。

世代論とかも同じである。団塊世代とか、ある世代に属する個人が、皆同じ特性を持つことなどありえない。しかし世代論が主張するのは、他の世代と比べて、有意に異なる特徴を、その世代が集団として持っている、ということなのだ。こう考えてゆくと、なんで日本人が統計的な認識が不得意、それも人間集団に関わる統計処理において顕著なのか、思い当たる節がある。

日本人には、本当の意味で「個」が確立しているヒトは少ない。個が確立していない以上、個の集合としての集団も確立しない。あるのは個と集団の関係があいまいな共同体だけである。そう、「個」という概念がないからこそ、「個」も「集団」も把握できず、集団の特性を捉える数学的処理である統計も理解できないのだ。二次元世界に住む生き物には、三次元の世界は理解できない、というSFはよくあるが、まさにこれと同じ理屈なのだ。




(08/05/16)

(c)2008 FUJII Yoshihiko


「Essay & Diary」にもどる


「Contents Index」にもどる


はじめにもどる