#統計 検定やP値の扱いについてのFisherさんやNeymanさんとPearsonさんの幾つかの発言を拾うと、「頻度論」「頻度主義」という用語で不当に戯画化・過激化されてしまっているP値と検定の姿は消え去り、科学的常識の範囲内で普通に理解できる穏健なものになります。

errorstatistics.com/2017/11/19/eri…
を参照
#統計 errorstatistics.com/2017/11/19/eri… で統計学の哲学者のMayoさんは、統計学者のLehmannさんによるFisherさんやNeymanさんとPearsonさん達(以下NPさん達)の発言の引用を紹介しています。

それらの引用を読むと、FisherさんとNPさん達の意見の違いを強調するための戯画化・過激化は不当であることがわかる。
#統計 検定の理論について突っ込んだ勉強をしたい人は、Lehmannさんの教科書

Testing Statistical Hypotheses
google.com/search?q=Lehma…

を読むと良いと思います。
#統計

* Pearsonさんは"acceptance", "rejection"(棄却)という用語の選択が失敗だったことを認めている。

* さらに、Fisherさんによる「科学的研究において統計的検定は『学習の手段』である」という見方も共有しており、Fisherさんと考え方はそう違わないとも述べています。
#統計 ベイズ統計を使用する場合にも、予測分布に仮説検定の方法を適用してモデルのある側面をチェックすることが、より良いモデルの発見に役に立つことがGelman-Shalizi (2013)で解説されています。

要するに、FisherさんやNPさん達の「統計的検定は『学習の手段』である」はベイズ統計でも有効。
#統計 以上のような事実を知れば、「頻度主義」「ベイズ主義」というような用語でそれらを不当に戯画化して、さらに「FisherさんとNeyman-Pearsonさん達は違う立場である」とか、「ベイズ統計と統計的検定は水と油である」というような見方が、どれだけ不当で不毛であるかがよく分かると思う。
#統計 あと、Fisherさんもpower(検出力)の重要性に気付いていたとも指摘されています。

Fisher (1947, p.24) は mimno.infosci.cornell.edu/info3350/readi… で読めます。
#統計 添付画像はFisher (1947, p.24) より

mimno.infosci.cornell.edu/info3350/readi…
#統計 多くの場合に、検定は直接Neyman-Pearsonの補題を適用できる分布p₀(x)と分布p₁(x)を比較する検定ではなく、パラメータ付きの分布族p(x|θ)のモデルについて、帰無仮説θ=θ₀の表現である分布p₀(x)=p(x|θ₀)と対立仮説族の表現である分布族p(x|θ)を比較する検定になっています。続く
#統計 そのときに検出力が問題になるのは、帰無仮説の分布p₀(x)=p(x|θ₀)と各々のパラメータθごとに決まる対立仮説の分布p(x|θ)の間の検出力になります。

検定の仕方によって、検出力が下がると、有益な知見が見逃されてしまうリスクが増えます。Fisherさんもそういうことを当然気にしていた。
#統計 添付画像もNeyman-Pearsonさん達とFisherさんの穏健さを強調しています。

Neyman-Pearsonさん達も、第1種と第2種の過誤の間で(すなわち有意水準と検出力の間で)バランスを取ることを推奨していた。
#統計 Fisherさんは性格的にかなり過激な人だったことが知られており、そういう人に絡まれた側もそのせいで過激な言い方をしてしまうというミスをおかすことは十分にありえます。

そういう部分を真剣に受け取らずに、穏健で合理的な考え方を再構成して後世に伝えることができれば良いと思います。
#統計 「頻度主義」と言う言い方で検定の方法を不当に戯画化&過激化してしまうことや、正確な引用も建設的な再構成も無しに「FisherさんとNeyman-Pearsonさん達の検定は違う」とあっさり言う行為に対して、どれだけ「トンデモ感」を感じているかを頑張って説明してみました。
#統計 多分、このスレッドでの私のたった1つの貢献は、FisherさんとNeyman-Pearsonさん達による

 科学的研究において、統計的検定は『学習の手段』である

という考え方を、Gelman-Shalizi (2013)にある実践ベイズ統計の話に明瞭に繋げたこと。
#統計 仮説検定は【お墨付き】を得たり、【何をなすべきか】についての意思決定をくだすための道具ではない。(Pearsonさんもaccept, rejectという用語の採用は失敗だったと言っている。)

仮説検定は「学習の手段」の1つであり、実践的ベイズ統計においてもモデルの改良のために使用可能な道具である。
#統計 内容的に杜撰な本を読んで賢くなったと誤解しないようにした方がよい。

• • •

Missing some Tweet in this thread? You can try to force a refresh
 

Keep Current with 黒木玄 Gen Kuroki

黒木玄 Gen Kuroki Profile picture

Stay in touch and get notified when new unrolls are available from this author!

Read all threads

This Thread may be Removed Anytime!

PDF

Twitter may remove this content at anytime! Save it as PDF for later use!

Try unrolling a thread yourself!

how to unroll video
  1. Follow @ThreadReaderApp to mention us!

  2. From a Twitter thread mention us with a keyword "unroll"
@threadreaderapp unroll

Practice here first or read more on our help page!

More from @genkuroki

25 Dec
#数楽 数学だとか、物理だとか、統計学だとか、機械学習だとか、そういう分野によらず、数学は本質的に難しいので、数学を使っている文献は大抵読み難いと私は思います。

数学が専門であっても、あらゆる数学に精通しているわけではないので、自分の専門分野に閉じこもらない限り、当然そうなる。
#数楽 めっちゃ読み難くても理解したときのあの「視界」がクリアになって広がる感覚は他ではなかなか得られない。脳みそに直接来る感じ。

かなり危ない。
#数楽 自分の専門分野外の文献を読んで不満が出る場合には、単にかけている時間が足りないんではないかと思う。

数学を使っている文献は数ヶ月かけても読めないものが多く、多くの場合、数年以上かかります。

数ヶ月しか目を通していない人達はきっと理解していないんだろうなと私は思います。
Read 4 tweets
25 Dec
#統計 私はよくない本だと判断して読んでいないソーバー『科学と証拠―統計の哲学 入門―』(2012)を参照している人達と、統計学の哲学に関する杜撰な意見を持っている人達はかなり重なっているように私には見えています。

添付画像に引用した私の疑問について教えてくれる人を募集中。
#統計 尤度は「モデル内で観測データと同じデータが生じる確率(密度)」でしかないし、データとモデルを尤度函数に要約すると多くの重要な情報が失われます。

そういう代物でしかない尤度や尤度函数を「証拠」(の度合い)に昇格させるのはどうかしています。
#統計 ベイズ統計を時代遅れで技術的に劣っているベイズ主義と同一視して議論を進めることが論外なだけではなく、所謂「頻度主義」について戯画化された極端な考え方を割り当てることも卑怯な議論の仕方です。

その辺については以下のリンク先も参照↓
errorstatistics.com/2017/11/19/eri…
Read 12 tweets
24 Dec
#統計 私が最近積極的に紹介している統計学の哲学が専門のMayoさんなどは全然違うのですが、「尤度原理」を安易にまともなもの扱いするような(率直に言ってレベルが低い)人が統計学の哲学を語っている場合があるという問題だけではなく、~続く
#統計 続き~、連続的なパラメータを持つモデルを扱うことが普通のベイズ統計と仮説の真偽を問題にする型の哲学的なベイズ主義が相当に毛色が違った話に見えることに無頓着なまま、哲学的なベイズ主義のスタイルでベイズ統計の哲学について語るダメな人達の問題もあると思います。

続く
#統計 続き。「複数の仮説の真偽に関する事前の主観的信念の度合いがデータに基く信念の更新によって変わって行く」という見方をして良い場合もあるでしょうが、Gelman-Shalizi (2013)では実践的なベイズ統計の使い方とは全然違うことを指摘されています。続く

stat.columbia.edu/~gelman/resear…
の第1節を参照
Read 6 tweets
24 Dec
#統計 「尤度原理はBirnbaumによって証明されている」とか、「証明されていると〇〇さんが書いていた」の類のことを言っていた人について、あきれるのは、自分でその「証明」とやらを説明しようとせず(おそらく説明できない)、誰か偉い人に名前を出すだけですましていることです。続く
#統計 そのBirnbaumの「証明」とやらは、前提がアドホックである疑いや、正確に定式化すると穴があるという疑いを払い切れるものでなかったことは、歴史が証明しています。

すでに私はその証拠として、赤池弘次さんの論文とMayoさんのウェブサイトを紹介しています。
#統計 「尤度原理はBirnbaumによって証明されていると〇〇さんが書いていた」のように述べてしまった人は、その〇〇さんが証明の詳細をきちんと説明していたか、強い疑いがかけられて続けていることを正直に説明していたかを確認し、自分自身が騙されている可能性を疑うべきです。
Read 11 tweets
24 Dec
その問題には私も興味があるので、ツイッターで「周囲の人たち」をよく観察しているのですが、一般に数学的能力が高い人はアホなタイポが結構目立ちます。

研究者であるかどうかは無関係だと思います。

自戒するより、細かなノイズに強くなる方法を積極的に教えて行った方が生産的だと思う。
教える側が細かなミスを無くすことに膨大なリソースを割くのは非生産的で、みんなでノイズに強い思考法を身につけた方がお得。

細かなミスを無くすことに膨大なリソースが必要であることを理解していれば、細かな誤りの存在を親切に教えてくれる人のありがたみも深まる。
そして、ノイズに強い思考法の存在が常識化していれば、細かなミスを見つけたときにイライラしてしまう原因がノイズに弱い自分自身の思考法にあるのではないかと考えて成長できる余地が増えるかもしれない。
Read 5 tweets
24 Dec
#統計 「尤度」=「もっともらしさ」と説明している人は何も理解せずに説明しているので要注意。

尤度の定義は「モデル内で観測されたデータと同じ数値が生成される確率または確率密度」です。モデルのデータへの適合の良さの指標と言って良いのですが、「もっともらしさ」と言えるとは限らない。
#統計 例:「正規分布のi.i.d.でデータが生成されている」というモデルの確率密度函数は

p(x_1,…,x_n|μ,σ²) = p(x_1|μ,σ²)…p(x_n|μ,σ²)
(ここでp(x_i|μ,σ²) = exp(-(x_i-μ)/(2σ²))/√(2πσ²)).

観測データの数値X_1,…,X_nが得られたとき、このモデルの尤度は

p(X_1,…,X_n|μ,σ²)

になる。続く
#統計 尤度が大きいほどモデルはデータによくフィットしていると思ってよいです。

観測データに関するモデルの尤度をモデルのパラメータの函数とみなしたもの、例えば上の例では

L(μ,σ²) = p(X_1,…,X_n|μ,σ²)

を観測データX_1,…,X_nに関するモデルの尤度函数と呼びます。

続く
Read 18 tweets

Did Thread Reader help you today?

Support us! We are indie developers!


This site is made by just two indie developers on a laptop doing marketing, support and development! Read more about the story.

Become a Premium Member ($3/month or $30/year) and get exclusive features!

Become Premium

Too expensive? Make a small donation by buying us coffee ($5) or help with server cost ($10)

Donate via Paypal Become our Patreon

Thank you for your support!

Follow Us on Twitter!