#統計

ルーレットAでは当たりが出る確率が1%であるとする。
未知のルーレットXを回したら当たりが出た。

①仮にルーレットXがルーレットAなら当たりが出る確率は1%でしかない。

②ゆえにルーレットXはルーレットAではないだろう。

①は常に正しいが、②の判断は常に正しいとは限らない。続く Image
#統計

①' 仮にルーレットXがルーレットAだとしても、当たりが出る確率は1%でしかないので、ルーレットXはルーレットAではないという判断が誤りになる確率は1%でしかない。

も正しい。

しかし、現実的な状況では他に使える情報があることが普通なので、その判断の仕方が誤りになる場合もある。続く
#統計 100台のルーレットのうち1台が1%の確率で当たりが出るルーレットAで、残りの99台は当たりの出る確率が0.0001%のルーレットBであるとする。

その100台のうちから無作為に選んだルーレットXを回したら当たりが出た。

そのときX=Aである確率は約99%になる。 Image
#統計 1つ前のツイートでの当たりが出たという条件の下でのX=Aの条件付き確率の計算は、不幸なことによく「ベイズの定理」を使って説明されるが、もちろん無用。

さらにひどい解説だと、小学生レベルの割合の計算を「ベイズ推定」だと言い張っているものがある。特に医学部の学生は注意が必要。 Image
#統計 以上の解説を読んで、仮説検定よりも条件付き確率の使用の方が一方的に優れていると判断するのは誤りである。上の例ではそれぞれで使用できた情報の量が全然違っている。 Image
#統計 以上で説明した例は次の一般論の特別な場合とみなせる。

一般に、ギャンブルで勝ち目を増やすために確率を使った推論・推測を行う場合には、信頼できる情報の全てを使った方がよい。

こういう事情があるので、統計学を使う場合には各専門分野における固有の知識を重視する必要がある。
#統計 以上は、検定やベイズ統計に関する妙な解説(特に昔の偉い人が唱えた「主義」的な事柄をいきなり持ち出すいつものアレ)を廃して、数学的な事柄から導けることと導けないことを明瞭にして、さらに教訓を引き出すことを、仮に私がやったらどうなるかの実例として示したものである。
#統計 仮説検定について「Fisher vs. Neyman-Pearson」という図式を持ち出す解説も私は酷いと思っています。

科学的にはそういう昔の偉い人が何を言っていたかはどうでもよいことです。

計算したP値の数学的定義と性質から本当は結論できないことを結論できないと素直に認めるだけでよい。
#統計 このスレッドでは、

⓪ルーレットXを回したら当たりが出た。

①仮にルーレットXがルーレットAならば当たりが出る確率は1%でしかない。

から

②ルーレットXはルーレットAではないと判断して良い。

という結論を出せないことを認めるだけで良い。

【お墨付き】を得るという思考は捨てる。
#統計 数学的定義とその数学的性質から出せるはずがない結論は出せないものは出せないことを、統計学を【お墨付き】を得る人達が困る程度に明瞭に述べておくことは非常に大事なことだと思います。

そして、小学生レベルの割合計算で「ベイズの定理」を使ったり、「ベイズ推定」扱いしたりしない。
#統計 あと、数学的道具P(例えばP値)を使ってできないことがあることを明らかにした後でも、その数学的道具が全然ダメであるかのようなことを決して言わない。

単にその数学的定義と性質からの帰結に過ぎないという態度で一貫する。
#統計 確率の概念を使った推論・推測をする場合には、信頼できる情報をどれだけどのように使ったかで「勝ち目」が大きく変わるので、ユーザーによる専門知識を用いた「自由な利用」を推奨するべき。

妙な「主義」で縛らない。

その代わりに「自由な利用」に必須の数学的内容の理解を重視する。
#統計 FisherやNeyman-Pearsonが示した数学的結果は彼らの「主義」と無関係に意味があるものなので大事にする。

そのときに、数学的結果を超える「主義」を同時に認めてしまわないように注意を払う。

「主義」の話は数学的に何が導出できてできないかがクリアになった後に行うべき。

• • •

Missing some Tweet in this thread? You can try to force a refresh
 

Keep Current with 黒木玄 Gen Kuroki

黒木玄 Gen Kuroki Profile picture

Stay in touch and get notified when new unrolls are available from this author!

Read all threads

This Thread may be Removed Anytime!

PDF

Twitter may remove this content at anytime! Save it as PDF for later use!

Try unrolling a thread yourself!

how to unroll video
  1. Follow @ThreadReaderApp to mention us!

  2. From a Twitter thread mention us with a keyword "unroll"
@threadreaderapp unroll

Practice here first or read more on our help page!

More from @genkuroki

28 Nov
#統計

2×2の分割表の独立性のFisher検定の不正確さについて

2×2の分割表の独立性のFisher検定はFisher's exact testと呼ばれているのですが、現実的な研究計画のもとでは(補正無しの)χ²検定より不正確になり易いです。

「不正確さ」の定義と「その理由」について理解していない人が非常に多い。続く
#統計 2×2の分割表とは非負の整数a,b,c,dで構成された表

a b
c d

のことです。ただし、(a,b,c,d)は何らかの確率分布に従ってランダムに生成されたと考えます。

よく例に出されるのは、a+cは調べた喫煙者の数、b+dは非喫煙者の数、a+bは肺癌になった人数、c+dはならなかった人数です。続く
#統計 続き。独立性検定は、喫煙と肺癌の例では、喫煙と肺癌が無関係であるという仮説に関する検定になります。a,b,c,dの期待値をそれぞれA,B,C,Dと書くとき、独立性の仮説は A:C=B:D という式で書けます。その条件は喫煙と肺癌の例では

喫煙者が肺癌になる確率 = 非喫煙者が肺癌になる確率

と同値。
Read 41 tweets
27 Nov
#Jupyter たまに Jupyter を嫌う頭の悪そうな人を見かけるがこの手の人ががんばっているせいでそうなっているのか。

この手のことを言う人達よりも、MITで Jupyter + Julia で講義をしている人達の方がわたしには賢い人達のように見える。

単に適材適所の問題。感情的になってバカを晒す必要はない。 Image
#Jupyter しかし、多くの人が賛成してくれると思うが、配布する Jupyter notebook は

Kernerl -> Restart & Run All

で正常にすべてのセルが実行できるものにして欲しいと思います。

あと、パッケージ化した方が良さそうな場合には、野良パッケージでも良いので、そうしてもらえると助かる。 ImageImage
#Jupyter あと、コードそのものだけではなく、実行結果が重要な Jupyter notebook の場合には、事情が許すならば、実行した結果を含むものを配布して欲しいです。

Out[n]が全て空欄のままの配布だと内容の理解が困難な場合が多い。
Read 5 tweets
27 Nov
Re: RT 計算、マジで合わない。

コンピュータで計算しても合わないことがある。とある数式処理系についてバグレポートを出したことがある。

自分ちの子には「符号のミスはふつー。プラスマイナスのミスでバツをつけられても気にするな」と言っている。数学者達がみんなやらかしている。
数学ばっかりやっていると、人間がミスを犯さずにすむのは無理だということを深く理解できる。

自分にような「ダメな人間」ではなく、人類最高レベルの数学者であってもアホなミスを気軽にすることを知ることになる。

子供には「間違うな!」とは絶対に言えない。アホなミスをするのは仕方がない。
注意不足によるミスを全部「そういうのは仕方がない」で素通ししても、「理解しなければいけない」という真に価値ある厳しい縛りがあれば「甘やかし」になることは決してないと思う。

人間なら誰でもするミスを特に責め立てて、理解することを軽視するのは最悪の教育だと思う。
Read 4 tweets
25 Nov
#超算数

チョー算数問題のある一部分は劣った思考法に陥ったまま大人になった人達が、自分自身が劣っていることを自覚できずに、次世代の子供達を自分と同レベルの劣った存在にするような教え方に賛成しているという問題。

自覚がないので、自分自身が劣っていることを隠すことさえできない。
#超算数 しかし、それは問題の一部分に過ぎず、本丸は、算数に関するデタラメな考え方をしている側が、算数教育の世界における人の出世の流れをコントロールできる社会的な仕組みだと思う。

その辺にいる雑魚をどんなに蹴散らせても、チョー算数マスター達が算数教育の世界で正々堂々と出世して行く。
#超算数 算数の教科書執筆者の中にいるチョー算数マスター達が困るような正当な情報をどのように流すかが多分重要だと思う。

我々が抱えている問題はそのための知識がまだ足りないということ。

チョー算数マスターが算数の教科書の執筆者まで出世できる仕組みを我々は十分に理解していない。
Read 4 tweets
25 Nov
#統計

osf.io/eybpc/?show=vi…
頻度主義統計とベイズ統計についてのメモ
清水裕士
2020/11/16

は、確率測度の意味での「確率」は「全体の大きさを1としたときの部分の割合」という意味しか持たず、「ランダムに起こる現象」を意味するとは限らないことに注意を払えない杜撰な議論の典型例。
#統計 現在普及している確率論が確率測度(もしくは確率空間)の概念を基礎に据えていることは事実であり、その意味での確率論が「ランダムに起こる現象」の分析で大活躍しているのも事実です。しかし〜続く
#統計 しかし、確率の概念について正確な議論をしたいと思っている人が、普及している確率測度の意味での確率概念が「ランダムに起こる現象」の定式化にはなっておらず、単に「全体の大きさを1としたときの部分の大きさ(割合)」を定式化したものに過ぎないことを無視するのは論外に杜撰な態度です。
Read 55 tweets
24 Nov
#統計 高田健一さんが一方的に普通に正しい考え方を述べており、アルゴスさんの【頻度主義ではとくに12%を変えるとは思えません】はひどい誤り。

この手の重要な確率が「主義」で変わると誤解している。

数学弱者には「主義に基く統計学はクズなので忘れろ」を徹底しないとまずいと思います。
#統計 ある程度以上のレベルを保っていれば(『統計学を哲学する』を好意的に評価する読者はレベルが低過ぎるのでダメ)、統計学と主義・思想・哲学を絡めた議論を楽しくできる可能性があると思いますが、現実の高等教育における統計学教育の内容には相当に問題があるので、そう簡単には実現しない。
#統計 大学の医学部で、小学生レベルの割合の問題について、「ベイズ」「頻度論」のような枠組みで、怪しげな肖像画を引用して教育している事例が以下のリンク先で紹介されている。

これ、普通の神経なら、相当に恥ずかしいことをしています。

学生の側が恥ずかしい教育内容に文句を言うべき。
Read 6 tweets

Did Thread Reader help you today?

Support us! We are indie developers!


This site is made by just two indie developers on a laptop doing marketing, support and development! Read more about the story.

Become a Premium Member ($3/month or $30/year) and get exclusive features!

Become Premium

Too expensive? Make a small donation by buying us coffee ($5) or help with server cost ($10)

Donate via Paypal Become our Patreon

Thank you for your support!

Follow Us on Twitter!