軽くググって哲学っぽい(特に科学または統計学の哲学っぽい)話題の文献を見ると、「真~偽」という評価軸で語っていることがものすごく多くて、数学で言えば解析学的な事柄が重要なケースがあるかもしれないことを十分に考えていないように見えるものが多い。

続く
より具体的には、具体的な統計モデルを設定してデータからの統計的推論を行うことを、「仮説の真偽」という評価軸で眺めると多くの重要な事柄を見逃すと思います。

「ベイズ確証理論」の発想で「ベイズ統計」について語ることも相当に有害だと思う。

続く
解析学を扱える体系を用意してその内部で解析学的命題の真偽を扱えれば十分だとひどく誤解しているんじゃないか?

そういう一般論は、具体的な数値計算が絡む事柄で生じる沢山の問題を裏に隠してしまうので、結果的に実際の科学研究や実践統計学と無関係な空虚な一般論が出来上がるだけだと思う。
「仮説」的な事柄だけではなく、「数値」的な事柄もきちんと直接的に扱わないとダメ。
「数値的な事柄に関する仮説を扱えれば十分なので、数値的な事柄を直接的に扱わなくてもよい」という発想はダメな考え方の典型例として糾弾されてしかるべきだと思う。
あと、数値的な事柄を十分に扱えていても、「視界が狭い」とすべてがダメになる。続く
例えば、分散がσ²に固定されていて、平均μだけが動かせるパラメータの正規分布モデルにおけるフラット事前分布のベイズ統計で、データ(実数列)X_1,…,X_nから計算した平均μの事後分布は、平均がX̅=(X_1+…+X_n)/nで分散がσ²/nの正規分布になります。

続く
その事後分布で計算した、平均μの区間

(CI) X̅ - 1.96σ/√n ≤ μ ≤ X̅ + 1.96σ/√n

の確率は95%になり、よく95%の信用区間と呼ばれています。

これは「平均μに関する仮説(CI)が成立する確率を事後分布で測っていること」にもなっています。

続く
事後分布は、モデル(今の場合は分散固定の正規分布モデル)に強く依存して決まる(フィクションに過ぎない)モデル内確率分布に過ぎないのに、それで「仮説(CI)が正しい確率が分かる」のように安易な解説をする困った人達がいて問題になっています。

このスレッドではそこにはあまりつっこまない。続く
ここで指摘しておきたいことは、仮説(CI)が(フィクションに過ぎない)モデル内パラメータμに関する仮説に過ぎないことです。

モデル内パラメータの数値やそれに関する仮説しか見えていない状況は、視野狭窄で非常にまずいと思います。これが特に言いたいことです。
普通は「分散を固定した正規分布モデルのような極めて特殊な設定で、平均を推定しても大丈夫なのか?」と疑問を持つものだと思います。

そういう疑問を持たない奴はダメな奴だとみなして問題ないと言ってよいほど、みんな普通に疑問に思っていることだと思います。
データX_1,…,X_nのサイズnがある程度以上大きければ、適当なプロットによってモデルの設定である「具体的に与えられて固定された分散σ²(例えばσ²=1)を持つ正規分布」というモデルの設定が妥当そうかどうかを視覚的に確認できます。

そのような確認の重要性を語ることは統計学の伝統の1つです。
数値的な事柄を扱う場合には、データとの比較によって、推測用に採用したモデルの妥当性の確認にも注意を払うことが必要です。

モデル内部のパラメータ数値やそれに関する仮説を扱うだけの設定での考察ではお話になりません。
このスレッドに書いたようなことを知っておかないと、杜撰で論外な哲学的考察をまともだと誤解してしまう危険性があると思います。

* 「仮説」ではなく、「数値」を直接扱うことも重要。

* 「数値」を扱う場合に、モデル内パラメータの数値しか見えなくなると論外な考察になる。
例えば、データとモデルを尤度函数の情報で要約してそれ以後は尤度函数しか使えないことにすると、「データとの比較で正規分布モデルが妥当であるか」のような事柄を扱えなくなるので、そういう考え方は論外であり、真っ当な哲学的考察においてはクズ扱いされなければいけない(笑)

尤度主義は論外。
同様に、データとモデルと事前分布の情報を事後分布に要約して、事後分布を求めることこそ統計的推論の目標である、のようなことを言うのも論外です(笑)

モデル内パラメータの事後分布をどんなに眺めても、「データとの比較で正規分布モデルは妥当であるかどうか」は何も分からない。
あと言うまでもないことですが、データサイズn→∞で事後分布が1点に収束することを知って、「ベイズ統計ではデータサイズn→∞の極限で真理に到達する」のように語る人は単なるトンデモさんに過ぎません。
「仮説よりも数値」「数値を見るときには視界を狭くすると論外になる」という方針ではなく、「仮説の信憑性を確率の大きさという指標で測る」という方針で進んで行くと、ベイズ統計の数学的仕組みではモデル内パラメータに関する確率しか扱えないので、必然的に論外な方向に進んで行くことになります。
要するに、「ベイズ確証理論って何馬鹿なことをやっているの?出発点ですでに論外だろう」という疑問について私は述べているつもりです。
「尤度主義」やら「ベイズ確証理論によるベイズ統計の解釈」の類は統計学にとって有害なだけなので、実践的に統計学を使う人達は完全に無視してしまった方がよいと思う。

統計学を正しく使っている人達の多くはその手のことについて知らないと思いますが、これから広まってしまう危険性がある。
統計学入門の教科書を読んだり、講義を聞いたときに感じる

  「え?この特殊な正規分布モデルを使っていいの?」

という非常に合理的な疑問の持ち方を大事にすることと、「尤度主義」やら「主観ベイズ主義」に帰依することは両立しません。
同じ用語が出て来ても同じようなことを扱っていると思ってはいけません。

「尤度主義」を全否定しても、特定の条件のもとで最尤法やAICは素晴らしい道具になります。

「主観ベイズ主義」を全否定しても、ベイズ統計が最尤法では無理なことを可能にする素晴らしい道具であることはくつがえりません。
この問題で頭が痛いのは、算数教育の問題と似ていて、社会的には専門家だとみなされてしまう「立派な人達」が非常におかしなことを述べていることだと思う。
尤度函数や事後分布のようなモデル依存のデータ要約法の結果以外の情報を捨て去ることはモデル自体の妥当性を疑わなければいけない科学研究では致命的。
コンピュータで作った数値的な例

目的:サイコロXはちょっとしたイカサマのサイコロである。サイコロXの出目のデータを使って、どのようなイカサマのサイコロであるかを調べたい。

続く
方法:

仮説A, B, CはそれぞれサイコロXの出目の確率分布が添付画像のサイコロA, B, Cの出目の確率分布に等しいという仮説だとする。

その3つの仮説A, B, Cの信憑性をベイズ統計の方法を使って調べる。

事前分布では3つの仮説が正しい確率は等確率だとしておく。 Image
実験結果:添付動画のように、サイコロXの出目のデータのサイズnが十分大きくなったところで、事後分布は「仮説Bが正しい確率が100%である」に収束した(動画の右側)。

動画の左側における棒グラフは事後予測分布を、ドットはデータ中におけるその出目の割合を表している。
注目するべきポイント:

動画の右側の事後分布(データを使って求めた仮説A,B,Cがモデル内で正しい確率)だけしか見ないと、仮説Bが真理であるかのように誤解する危険性がある!

ドットで示されたデータを見れば、仮説Bが正しくないことは視覚的に明らかである!
答えをカンニング:

動画の左側にサイコロXの真の分布の棒グラフを追加。

真実は「3の目が出る確率がちょっとだけ他の目より高い」なのですが、ベイズ更新の収束先になった仮説Bは「3,4が出る確率がかなり高い」なので、真実からは程遠いです。
補足:

仮説A,B,Cの中では仮説Bが真実に最も近いです。ベイズ更新は普遍的にそのような「モデル内で真実を最も近似した分布」に収束することが知られています。しかし、その仮説Bも真実からは程遠い。

あと、仮説Cが非常に優勢になる場面が生じていることにも注目。結構面白いと思います。
ソースコード: #Julia言語

nbviewer.jupyter.org/gist/genkuroki…
ベイズ統計の簡単な例

このノートブックには以上で紹介したパターン以外の例(たとえば添付動画)も計算されています。
注意・警告:上の計算はMCMC法の収束とは何も関係ないです。

• • •

Missing some Tweet in this thread? You can try to force a refresh
 

Keep Current with 黒木玄 Gen Kuroki

黒木玄 Gen Kuroki Profile picture

Stay in touch and get notified when new unrolls are available from this author!

Read all threads

This Thread may be Removed Anytime!

PDF

Twitter may remove this content at anytime! Save it as PDF for later use!

Try unrolling a thread yourself!

how to unroll video
  1. Follow @ThreadReaderApp to mention us!

  2. From a Twitter thread mention us with a keyword "unroll"
@threadreaderapp unroll

Practice here first or read more on our help page!

More from @genkuroki

1 Jan
#統計 「停止規則」問題に完全決着

統計的検定では「帰無仮説が棄却されるまで順次データを増やして行く」という停止規則の工夫によって、帰無仮説が正しくても帰無仮説を確率1で棄却できてしまうが、ベイズ統計にはそういう問題はない、という主張が完全に間違っていることを説明します。
#統計 ぶっちゃけ、「統計学では主義が重要だ」という杜撰な言説に頭がおかされてしまっていない普通の統計学ユーザーはこのスレッドを読む必要がありません。

しかし、少なくとも豊田秀樹さんの本でベイズ統計について勉強してしまった人はこのスレッドを読んだ方がよいです。
#統計 このスレッドでは簡単のために以下の場合を扱います。

分散を1に固定した正規分布モデル(パラメータは平均のμのみ)と平坦事前分布でのサイズnのデータから得られる事後分布はデータサイズnとデータの標本平均X̅だけから決まる:

μの事後分布 = 平均X̅分散1/nの正規分布.
Read 23 tweets
31 Dec 20
#統計 私はこのブログ記事が好きで、これを読んで、

岩沢宏和(2014)『世界を変えた確率と統計のからくり134話』
amazon.co.jp/dp/4797376023

を注文しました。

Fisherの紅茶実験は実話なのか? - Tarotanのブログ tarotan.hatenablog.com/entry/2020/07/…
#統計

tarotan.hatenablog.com/entry/2020/07/…
【Fisher(1935a)の紅茶実験は~<ある1つの実験の有意性検定で有意になったからといって,常識的に考えて,我々の紅茶論争は終わらないでしょ.科学での議論も,紅茶論争と同じですよ>ということを伝えるための例になっている,と私は思います】

の部分が最高!
#統計 FisherさんやNeyman-Pearsonさん達の「検定」に関する意見は、通常の科学的常識と比較すると極端で非常識に聞こえるような言説に書き換えられて広められているという印象を私は持っているので、1つ前のツイートに引用したようなことを言ってくれる人がいるのはとてもうれしいです。
Read 4 tweets
31 Dec 20
#超算数 我々一般人が捨てなければいけない思い込みは、日本の算数教育界で影響力を持ち、社会的にも立派な人扱いされている人たちが、算数について穏健で常識的なことを言っているだろうという思い込み。

算数の教科書を見れば分かる。

0は偶数だが、0を2の倍数扱いすると誤りだとする方針! Image
#超算数 おそらく最も驚くべき倍数に関する教材がこれ。

amazon.co.jp/dp/4491026491
小学校算数 板書で見る全単元・全時間の授業のすべて 5年〈上〉
2011/3/1
山本 良和 (監修), 筑波大学附属小学校算数部 (編集)

より

0が倍数から除かれている様子を見よ! ImageImage
#超算数 算数の教科書ではことごとく「0は倍数に入れない」ということになっていることについては以下のリンク先を参照。
Read 15 tweets
30 Dec 20
#Julia言語 私もそれ結構やっています。

Jupyter notebookを立ち上げっぱなし。

繰り返し使うコードはあまり書いていないのですが(そもそもJuliaの使い道はプログラミングそのものじゃない)、ときどき「これはパッケージ化しておくべきだ」となるのでそうします。
#Julia言語 使い回すコードは単なる *.jl ファイルにせずに、最初からパッケージ化してもよいくらいだと思います。

julia> cd("どこか")
pkg> generate Foo
pkg> dev ./Foo
julia> using Revise
julia> using Foo
julia> Foo.greet()

./Foo/src/Foo.jl を編集

でパッケージを作れます。簡単!
#Julia言語 単なる .jl ファイルだと、ファイルの置き場所を知っていないと使えないですが、パッケージ化してあれば

using Foo

でどこからでも使えます。

しかも1つ前のツイートの方法でパッケージ化は極めて容易。

パッケージ化によって負担は増えません。

正式に公開する場合は別ですが。
Read 4 tweets
29 Dec 20
#Julia言語 小ネタ

函数にしなくても、let ~ end で囲むだけで結構速くなります。函数化するより劣りますが、それでも相当に速い。

注意:ループ内で使う変数はすべて let ~ end 内で定義されていなければいけない。

gist.github.com/genkuroki/baf7… Image
#Julia言語 より詳しい説明

let ~ end を書いただけでは高速化されず、グローバル変数をループから完全に排除することが重要なポイントになっています。

面白いのは、配列Agではなく、ループの回数Nloopがグローバル変数になった場合の方が遅くなること。

gist.github.com/genkuroki/baf7… Image
#Julia言語 トップレベルで begin ~ end で囲んでもその内側で定義された変数はグローバル変数になる。

begin ~ end は余計なことを何もしない単なるブロックになる。
Read 4 tweets
26 Dec 20
#統計 検定やP値の扱いについてのFisherさんやNeymanさんとPearsonさんの幾つかの発言を拾うと、「頻度論」「頻度主義」という用語で不当に戯画化・過激化されてしまっているP値と検定の姿は消え去り、科学的常識の範囲内で普通に理解できる穏健なものになります。

errorstatistics.com/2017/11/19/eri…
を参照
#統計 errorstatistics.com/2017/11/19/eri… で統計学の哲学者のMayoさんは、統計学者のLehmannさんによるFisherさんやNeymanさんとPearsonさん達(以下NPさん達)の発言の引用を紹介しています。

それらの引用を読むと、FisherさんとNPさん達の意見の違いを強調するための戯画化・過激化は不当であることがわかる。
#統計 検定の理論について突っ込んだ勉強をしたい人は、Lehmannさんの教科書

Testing Statistical Hypotheses
google.com/search?q=Lehma…

を読むと良いと思います。
Read 16 tweets

Did Thread Reader help you today?

Support us! We are indie developers!


This site is made by just two indie developers on a laptop doing marketing, support and development! Read more about the story.

Become a Premium Member ($3/month or $30/year) and get exclusive features!

Become Premium

Too expensive? Make a small donation by buying us coffee ($5) or help with server cost ($10)

Donate via Paypal Become our Patreon

Thank you for your support!

Follow Us on Twitter!