#統計 統計学の哲学者のMayoさんによれば

* Royallの3つの問いに、びっくりするほど多くの(しかも異なる信念を持つ)統計家達・哲学者達が賛同している。(大変なことになっている、とてもひどいことになっているというニュアンス)

続く

errorstatistics.com/2014/10/10/bre…
#統計 Mayoさん曰く

* Royallの3つの問いの「戒律」によれば

①何を信じるか→ベイジアンの事後分布

②どう行動するか→Neyman-Pearsonの方法による長期的なパフォーマンスの良さ

③証拠の比較→尤度比較法

となるが、あなたはこれら全部を拒否したいかもしれません。私が拒否しているように。
#統計 日本語圏でも同様にRoyallの3つの問いの「戒律」という合理的であろうとすれば到底受け入れることができない考え方を受け入れている人達を容易に発見できます。

ソーバー著『科学と証拠―統計の哲学入門―』とその翻訳者の松王政浩さんが大変な悪影響を与えているように見える。
#統計

①ベイズ統計では主観的信念の更新を扱う必要はない。(掛算の式が数量×単価の順序である必要がないのと同じ)

②Neyman-PearsonのPearsonさんはFisherさんの「検定は"学習の道具"」という考え方に賛成していた。

③尤度はモデルのデータへの適合度の指標に過ぎず決して「証拠」ではない。
#統計 Royallの3つの問い(「戒律」)の枠組みで統計学をベイズ主義、頻度主義、尤度主義などに整理して語ることが、理解力が足りない人達に魅力的に見えることは非常によく理解できる。

しかし、そういう道に入った途端に、統計学が用意してくれている道具を合理的に使う道は閉ざされてしまいます。
#統計 ベイズ主義、頻度主義、尤度主義のような既存の杜撰な考え方で、ベイズ統計、統計的検定、尤度を使った議論のようなまともで有用な事柄について整理することは極めて有害です。

理解力が足りない人にとっては、既存の主義による分類がわかり易くて魅力的に見えると思われるので非常に要注意。
#統計 世の中の多くの人達は、立派な肩書きを持っていて、社会的に専門家扱いされている人の言葉に結構弱いです。

日本語圏で「Royallの3つの問い」のような杜撰であることが明らかな整理の仕方を広めることから、統計学に哲学の紹介が始まってしまったことは大変不幸なことだったと思います。
#統計 「道具~には~という性質があるので、~の場合の~という長所と~の場合の~という欠点を持つ」とか「道具Aと道具Bにはそれぞれ異なる利点と欠点がある」のように説明して、各道具の使い方はユーザーに任せるべき。

そして統計学は決して【お墨付き】が得られる道具ではないことの強調も必要。
#統計 私がここ数年ツイッターでよくやっているのは、「各道具の性質を手計算や #Julia言語 を使った計算とプロットを使って紹介すること」。

道具の欠点になるような性質も自分で確認すると大変魅力的に感じられることが多いです。欠点を1つ知るごとに道具を安全に使い易なって行くメリットもある。
#統計 各道具の欠点とみなされる性質にも魅力を感じる立場からすると、統計学を(科学的な)【お墨付き】が得られる道具とみなして【お墨付き】が得られる理由を論じるというのは、最初から馬鹿げた行為にしか見えない。
#統計 科学の各分野で何をどのように評価するかは非常に複雑な行為で、わかり易く整理するのは無理だと思います。

少なくとも統計学の言葉だけで整理するのは絶対に無理。

各道具の使い方の詳細は各分野の専門家が自分の合理性と責任で決めるしかないと思う。

• • •

Missing some Tweet in this thread? You can try to force a refresh
 

Keep Current with 黒木玄 Gen Kuroki

黒木玄 Gen Kuroki Profile picture

Stay in touch and get notified when new unrolls are available from this author!

Read all threads

This Thread may be Removed Anytime!

PDF

Twitter may remove this content at anytime! Save it as PDF for later use!

Try unrolling a thread yourself!

how to unroll video
  1. Follow @ThreadReaderApp to mention us!

  2. From a Twitter thread mention us with a keyword "unroll"
@threadreaderapp unroll

Practice here first or read more on our help page!

More from @genkuroki

3 Jan
#Julia言語 個人的にJuliaはPythonにあまり似ていないと思うのですが、Pythonから来たっぽい人のJuliaのコードで気になるのは、

A = []
for ~

push!(A, a)

end

におけるA = []という書き方(Anyの配列になって効率悪化!)と、

sum([f(x) for x in X])

のような書き方。続く
#Julia言語

sum([f(x) for x in X]) だと、すべてのXの要素についてf(x)を計算した結果を配列として保存してから、その配列の要素の和を計算してしまいます。無駄にメモリを消費する。

sum(f(x) for x in X) # generatorを使う

もしくは

sum(f, X)

と書いた方が得だし、コードも短くなります。
#Julia言語

A = []
for i in 1N
push!(A, randn())
end

とするとAnyの配列Aができてしまう。

Anyの配列に格納されたサンプルによるモンテカルロ積分はFloat64の配列の場合と比較すると180倍くらい遅くなった!

A = [] → push!(A, ~) の繰り返しは要注意。

gist.github.com/genkuroki/7cd0…
Read 4 tweets
3 Jan
他にも似たような反応がありますが、小5の算数の教科書にある割合の3つの公式を覚えさせたり、「もとにする量」「比べられる量」という割合の概念を理解するために不要な用語を使うことを児童に強制していたら、教わっている子の将来が暗くなると思います。

教科書通りの教え方がまずい証拠がある。
お勧めしたいのは以下の2冊の本です。
実際に子供に算数を教えていたら楽しんで読めると思います。

amazon.co.jp/dp/4101370311
お母さんは勉強を教えないで
見尾 三保子

このタイトルはひどいし、内容とも一致していません。

内容の大部分は算数や数学の真っ当な教え方の話です。

2冊目紹介に続く
2冊目

amazon.co.jp/dp/4788508435
学力低下をどう克服するか―子どもの目線から考える
2003/3/25
吉田 甫

タイトルを見ても分からないことですが、教科書通りの教え方の対照群と実験的な教え方を、実際に授業をしてみて比較してみた研究結果が書いてあります。分数と割合の教え方を詳しく扱っています。
Read 8 tweets
2 Jan
#統計 「別に話題」→「別の話題」

以下のような教え方は、算数で「はじき」「くもわ」を教えるようなもので非常にまずい。

* 信頼区間の計算法を暗記させる。
* P値の計算法を暗記させる。
* それらの関係についてまともに説明しない。
* 理解抜きの練習を繰り返し行わせる。
#統計 「区間推定はこのやり方でやりなさい」「検定はこの方法で行います」「意味が分からないかもしれませんが、計算の練習をしましょう」という教わり方だと、検定と区間推定で共通して出て来るP値函数のような基本的な数学的道具に触れる機会は奪われて、道具を自由に使うことも不可能になる。
#統計 そして、「理解を促すため」と称して、「推定と検定では意味や思想が違います」のように教わってしまうと、統一的に理解可能な道具達を互いに異なる意味と思想を持つ無関係のものだと思い込むことを強化してしまいます。

これ、最悪。
Read 6 tweets
2 Jan
#統計 統計学入門の教科書で、推定と検定を無関係の別の話であるかのように説明しているのはよくない。

昔からある雑な考え方で統計学を分類して、道具の利用の仕方の自由をユーザー側から奪うことにならないような注意が必要だと思う。

特に、P値と信頼区間は表裏一体で別に話題にはならない。
#統計 P値の定義は大雑把に「データの数値以上の偏りがモデル内で生じる確率」です。近似値や上限を取る変種もある。

モデルがパラメータθを持っている場合には、「P値がα以上になるθの範囲」として信頼度1-αの信頼区間が定義されます。

P値と信頼区間はまさに表裏一体です。
#統計 これを知っていれば、αが有意水準のとき、信頼度1-αの信頼区間の定義が「検定で棄却されないモデルのパラメータθの範囲」に一致することもわかり、信頼区間の解釈は検定における「棄却」の意味に帰着し、信頼区間を誤解し難くなると思います。

検定と区間推定は密接に関係しています。
Read 32 tweets
1 Jan
堀茂樹さんにあきれたので記録に残しておく。

堀さんの政治的発言は小沢一郎さん個人への強力なサポーターとしての発言であるように見えることがあり、そういう場合には尊敬もできないし、信用もできない。

あと「新自由主義」のような用語を使う枠組みで考えることの「優先」もやめられない。 ImageImageImage
そうそう。

その件では私も堀茂樹さんにブロックされることになりました。

積分定数さんは誰もが思うような疑問を堀さんにぶつけただけ。

日本が一般市民も殺す側にまわるかもしれないことについての質問なのだから徹底的に答えてくれないと困る話題でした。
「新自由主義的政策には反対」とどうしても言いたいなら、

「新自由主義的なお金のばらまき方には反対だ。しかし、この緊急時には国民全体にお金を配る政策を今すぐにでもやるべきだ」

とか言えないものなんですかね?

お金を配る先を選んでいるうちに死ななくて良い人達が死んじゃうよ。
Read 4 tweets
1 Jan
#統計 多分「主観ベイズ主義が批判されているのは、主観という怪しげなものを持ち込むからだ」と思っている人は多いと思いますが、実際にはそういう生易しい話題ではないです。

主観主義ベイジアン達が不正行為を正当化しようとしているように見えるという大問題があります。
#統計 ど素人の私が「主観主義ベイジアン達が不正行為を正当化しようとしているように見える」と言っても、信用してもらえないかもしれないので、統計学の哲学者のMayoさんのブログ記事にリンクをはっておきます。

誰が不正を許されているのか?(答え:ベイジアン達)
errorstatistics.com/2014/04/05/who… Image
#統計 検定の場合には「帰無仮説が棄却されるまでデータを順次取得し続けること」のよって確率1で帰無仮説を棄却できる場合(帰無仮説μ=μ₀)とそうでない場合(帰無仮説a<μ<b)がある。

そして検定の解説者は「帰無仮説が棄却されるまでデータを順次取得し続けることは不正行為!」と言ってくれる。
Read 18 tweets

Did Thread Reader help you today?

Support us! We are indie developers!


This site is made by just two indie developers on a laptop doing marketing, support and development! Read more about the story.

Become a Premium Member ($3/month or $30/year) and get exclusive features!

Become Premium

Too expensive? Make a small donation by buying us coffee ($5) or help with server cost ($10)

Donate via Paypal Become our Patreon

Thank you for your support!

Follow Us on Twitter!