「年平均と比べて異常!」等の罠~元データを見せない統計は何でも言えるんやで、という話

えーまぁめんどくさいので前提省いて言うと、全く同じ観測データを使って、「異変が起きている、最近地球がおかしい!」という結論と、「通常通り。問題なし」という結論の二通りが出せます。でもって研究者は何か異変がないと研究する意味がないし予算もつかない、マスコミは何はニュースがないと仕事にならない、というわけで前者の回答が選ばれるのが世の中の常でございます。

というわけで、どのようにして同じデータから間逆の答えを引き出せるのか、実演で試してみましょうーお題はこちら、鹿児島地方気象台の出している「桜島の噴火回数」。

http://www.jma-net.go.jp/kagoshima/vol/data/skr_erp_num.html

ざっと見てわかるとおり、2009年から急激に噴火回数が増え始めて、2015年半ばまでは毎日4-5回噴火、何だこれ状態になってますが、その後は落ち着いてきて昨年末あたりからは噴火がない月も出てきています。

データが36年分公開されており、見ていくと2005年は年間の噴火が17回。過去には少ない年もあるため、噴火しないことを「問題なし」と見なすことは十分可能です。が、「異常」にしないと記事にならない場合は以下のような見出しをつけることが可能です。



 『桜島、前代未聞の7ヶ月連続噴火なし 大規模噴火の前兆か?』



2016年8月から2017年2月までの7ヶ月、噴火が全くないのは事実。そして公開されているデータを見る限り7ヶ月連続噴火がなかった箇所はないので、前半部分はまぁ嘘ではないです。後半部分は根拠のないグレーゾーンですが「か?」と疑問にして断定を避けることによって誤報ではないと主張出来ます。マスコミがよく使う、不安を煽る手口ですね(笑)

もう一つ見出しを考えてみます。



 『桜島、四半期の噴火回数わずか3回 ほぼ休眠状態へ』



2017年1月~本日までの噴火回数は3回で、確かに珍しいっちゃ珍しいですが、少ない年だと半年で2回とかもあるので長いスパンで見れば別に異常ではないですし、何年かすると活動が活発化してぽんぽん噴火する状態に戻っているので、たかが4ヶ月噴火しなかった程度で火山が休眠したと考えるのは誤りと思われます。が、もし公開されているのが直近5年分のデータだけだったりしたら、この見出しが正しいと思ってしまう可能性があります。

というわけで、生データは一つでも、どう読むか、どの期間を切り取るかによって、出てくる結論は全く違うものに成り得ることがお分かりいただけましたでしょうか…。大事なのは「出してる結論が妥当かどうか」というところ。ただ、学者やよほどの暇人でもないかぎり、生データあさってまで事実かどうか確認する人はそういないでしょうね。世論はかくも簡単に誘導されてしまうわけですよ(´・ω・`)



…正反対のことを言ってる人がいた場合は、生データと結論を同時に提示している人の言うほうを信じるほうが無難です。
これ豆ね。


********

と、いうわけで

これら前提知識を使って、逆に「あやしい」統計を見つける小技とかをお伝えいたします。
えーまずは適当に眼についたこれ…

ここ10年で一番の寒気 4月の雪
http://www.msn.com/ja-jp/news/weather/%e3%81%93%e3%81%9310%e5%b9%b4%e3%81%a7%e4%b8%80%e7%95%aa%e3%81%ae%e5%af%92%e6%b0%97-4%e6%9c%88%e3%81%ae%e9%9b%aa/ar-BBzKx0R

画像


記事内の表現「4月中旬以降では ここ10年で 最強レベルの強い寒気」


(1)4月中旬以降では

→区切り方の中途半端さに注目。「中旬以降では」つまり4月初頭の場合は珍しくないか、他に何例かある。

(2)ここ10年で

→それ以前だと普通だった

(3)最強レベルの

→一番とは言ってない!!


期間の区切り方と、ちょっとした表現のひねりで、何でもなさげな気候でもニュースになります。お分かりいただけますね…。

この記事へのトラックバック