#統計 添付画像下段はよくあるベイズ版95%信用区間(確信区間)の最高事後密度(HPD)版です。95%の部分は0から1の間の任意の実数に一般化できる。

添付画像上段のベイズ版P値は「信頼区間と検定が表裏一体」という原理を適用して定義されています。

nbviewer.org/github/genkuro…
#統計 ベイズ版95%信用区間もベイズ版のP値も事後分布の情報だけを使って定義されており、通常の信頼区間やP値の作り方とは異なります。

しかし、数学には定義が全然違う量がある条件のもとでほぼ同じ値になることを証明できる場合が多数あって、解析学の基本的な考え方になっています。
#統計 実践的には無視できる違いしかない2つの数学的量を使った分析や推論は平等な扱いをする必要があります。

❌定義の違いは規範の違いから来ている。違いを無視できるほど同じ値になるとしても、それらは異なる使い方をされなければいけない。

などと言うと、単なるトンデモさんになってしまう。
#統計 信頼区間と検定の表裏一体性については以下のリンク先を見て下さい。

上で採用したベイズ版のP値の定義は、信頼区間と検定の表裏一体性における信頼区間をベイズ版信用区間に置き換えれば自然に出て来ます。

それは、事後分布の情報だけを使って定義されたP値の数学的類似物になる。
#統計 信頼区間や検定について知っている人は「ベイズ統計でのそれらの対応物は何か?」というもっともな疑問を持ちながら、「頻度論の信頼区間とベイズ統計の信用区間の意味の違い」(多くの場合デタラメ)を説明されて、疑問を表明することに躊躇したかもしれない。その答えがこのスレッドにある。
#統計 そして、ベルヌイ試行ような単純な統計モデルでは、nが十分大きなときには、通常の信頼区間やP値とベイズ版信用区間とベイズ版P値は数値的によく一致し、実践的にはそれらを区別する必要はなくなります。

コンピュータ上で使い慣れた道具の側を使えばよいと思います。
#統計 通常のP値については「P値 < α が実現するまでデータを順次取得」は所謂p-hackingで研究不正になります。

「ベイズ統計の95%信用区間から否定したいパラメータ値が除外されるまでデータを順序取得」はその研究不正行為と同じことをやっていることになることに注意が必要です。
#統計 その同じことになる理由は、数学的に定義がまったく異なる別に量の数値的な一致です。その一致は純粋に数学の話なので、「頻度主義 vs. ベイズ主義」というような規範や主義の違いに影響されません。

この点を無視して、めちゃくちゃなことを書き切った本が去年の3月に出た所謂豊田『瀕死本』。
#統計 #数楽 「定義がまったく異なる量の極限での一致」は数学では最も普通の面白い話題のパターンになっています。

そういう話題を楽しむ余裕があれば、おかしなことを言われても騙されずにすむ場合が増えます。

楽しめるようになれば相当に色々楽をできる。

• • •

Missing some Tweet in this thread? You can try to force a refresh
 

Keep Current with 黒木玄 Gen Kuroki

黒木玄 Gen Kuroki Profile picture

Stay in touch and get notified when new unrolls are available from this author!

Read all threads

This Thread may be Removed Anytime!

PDF

Twitter may remove this content at anytime! Save it as PDF for later use!

Try unrolling a thread yourself!

how to unroll video
  1. Follow @ThreadReaderApp to mention us!

  2. From a Twitter thread mention us with a keyword "unroll"
@threadreaderapp unroll

Practice here first or read more on our help page!

More from @genkuroki

13 Dec
#統計 いやあ、これにはマジでびっくりした。😱

ベイズ版95%信用区間(確信区間)がゼロをまたがなくなるまでNを増やす行為は、P値が5%を切るまでNを増やすp-hacking行為と(小さな誤差を除けば)数学的に同等です。

P値が5%を切るまでNを増やすp-hacking行為の是非も規範の問題で済ませられる?
#統計 2020年3月に出版された豊田秀樹さんの本には、ベイズ統計では【データを取り増しても】よいし【事前登録~も必要ありません】と言っています。(他にも色々!)

これを「ベイズ統計を使えば研究不正扱いされていたことを堂々とできるようになる」と解釈する人達が出ることを危惧していました。
#統計 より正確に言えば、同様の言説を他で見た人達が、「ベイズ統計を使えば研究不正扱いされていたことを堂々とできるようになる」と既に信じている場合もあるのではないかと思いました。

これ、めちゃくちゃまずくないですか?
Read 26 tweets
12 Dec
#Julia言語 いきなり、struct ~ end の中で(内部)コンストラクタをnewを使って定義するのは避けた方が無難。new無しにはできないことをやりたくなったら、初めてそうするのがよいです。

公式ドキュメントにも可能な限り内部コンストラクタは避けよと書いてあります。

docs.julialang.org/en/v1/manual/c…
#Julia言語 内部コンストラクタを定義せずに、例えば、

struct Foo{A, B}
a::A
b::B
end

と書けば、Foo型オブジェクトのコンストラクタたち

Foo(a::A, b::B) where {A, B}
Foo{A, B}(a, b) where {A, B}

が自動的に定義されます。

ひとまずはコンストラクタとしてこれらを使えば大丈夫。
#Julia言語 クラスがあるプログラミング言語から来た人は、struct ~ end の内側でコンストラクタを定義した方が良いと誤解しがちだと思う。

Juliaでは、クラスベースのOOPを廃して、パラメータ付きの型による多重ディスパッチでエコシステム全体を構築した方が効率的だという話になっている感じ。
Read 8 tweets
12 Dec
に訂正があるので注意!

「ある閾値以上大きくなる」の「ある閾値以上」が文字数のプレッシャに負けて抜け落ちてしまった。

具体的な計算例の方を見れば誤解は起こらないはず。
#統計 誤解しないために見て欲しい計算はこれ↓

nbviewer.org/github/genkuro… Image
Read 5 tweets
12 Dec
対数尤度を「浮動小数点数で尤度を計算してからlogをとる」で計算するとマイナス無限大になりがち。

尤度を浮動小数点数で計算するとぴったり0.0になりがち。

他にもマイナス無限大が得られるパターンが結構あると思う。
確率がらみの数値計算では、対数尤度は「尤度の対数」で計算しちゃだめで、対数尤度を直接計算するコードを書く必要がある。

例えばgamma(x)やbeta(a, b)の類は使っちゃダメで、loggamma(x)やlogbeta(a, b)を使う。

混合正規分布を使っている場合にはlogsumexp的な工夫が必要になる。
確率密度の値は浮動小数点数では容易に0.0やInfになるので、確率密度を扱うパッケージには、確率密度の値の対数を直接扱う機能が必ず付いているはず。

私はほんの一部の狭い分野を除くあらゆる分野のど素人なので、この手のことも知らずに、結構酷いコードを書いていたことがある。
Read 6 tweets
12 Dec
#数楽 統計学の勉強と無関係に、弧度法による角度の定義とtanの定義まで戻れば、直線 y = ax とx軸で挟まれた部分の角度が

θ = arc tan a = ∫₀ᵃ dt/(1 + t²)

になることが直接的に導けることを確認すると、高校で習ったことの再構成ができてうれしいかも。続く

genkuroki.github.io/documents/High… ImageImageImage
#数楽 x²+y²=1の右半分とy=txの交点は

(x(t), y(t)) = (1/√(1+t²), t/√(1+t²))

になります。これの軌跡のt=0からt=aまでの長さが弧度法の意味での角度θの定義なので、

θ = arc tan a = ∫₀ᵃ √(x'(t)²+y'(t)²) dt

です。ここでarc tanは角度θをaに対応させる函数tanの逆函数。続く
#数楽 ここまで、高校の数学の教科書に書いてあることしか使っていないことに注意。図を自分で描けば分かり易い。

上の場合にちょっと計算すると

√(x'(t)²+y'(t)²) = 1/(1+t²).

これが arc tan t の導函数であることは、角度とtanの高校数学の教科書における定義からほぼ直接的に導かれる。
Read 7 tweets
12 Dec
かけ算順序固定強制指導を擁護する人達は「算数が苦手な子は理解していないので出て来た数を機械的にかけて済ます。ゆえにかけ算順序の指導はそのような子のために役に立つ」のように言います。

個人的には、これもまた浅はかなウソをついているように感じています。続く
ググって各種の調査結果で児童がどのように問題を解いたり解くことに失敗しているのを見ると、本当に算数が苦手な子が算数を苦手になる理由は出て来た数を機械的にかけているからでは無さそうなことは明らかだと思います。

算数が本当に苦手な子はそういう類の子ではない。続く
例えば、伊藤宏先生の調査結果(添付画像)を見てください。

かけ算順序が問題文に出て来た順序と同じで出題者的に誤りの子は問題文で示された場面を絵で描くことには成功しています。

本当に算数が苦手な子は、そもそもかけ算を使える問題であることが分かっていない。続く

mnavidata.edu-c.pref.miyagi.jp/manage/wp-cont… Image
Read 5 tweets

Did Thread Reader help you today?

Support us! We are indie developers!


This site is made by just two indie developers on a laptop doing marketing, support and development! Read more about the story.

Become a Premium Member ($3/month or $30/year) and get exclusive features!

Become Premium

Too expensive? Make a small donation by buying us coffee ($5) or help with server cost ($10)

Donate via Paypal

Or Donate anonymously using crypto!

Ethereum

0xfe58350B80634f60Fa6Dc149a72b4DFbc17D341E copy

Bitcoin

3ATGMxNzCUFzxpMCHL5sWSt4DVtS8UqXpi copy

Thank you for your support!

Follow Us on Twitter!

:(