#統計

⭕️正規分布に従う母集団から標本を無作為に取ってきてそのサイズと平均と不偏分散から95%信頼区間を求めた時に、その区間の中に95%の確率で母平均が含まれる。

は正しいです。ただし、確率的に揺らぐのは標本や信頼区間の側で、母平均は固定されています。続く
#統計

❌正しくは、「母集団から標本を無作為に取ってきて、そのサイズと平均と不偏分散から95%信頼区間を求める、という作業を100回やったときに、95回はその区間の中に母平均が含まれる」という意味です。

は誤り。「正しくは」と訂正しようとしている所が単純に間違っています。訂正は無用。続く
#統計 「95%信頼区間の95%は確率ではなく、割合である」という信頼区間の定義に反する自明に間違っている主張をわざわざ広めて大恥をかいている人たちは一体どういうつもりなのか?

詳しくは私のツイログを参照

twilog.org/genkuroki/sear…
#統計 95%信頼区間の95%の意味を誤解しないための第一のポイントは、確率的に揺らぐのは、標本を取り出した母集団の平均ではなく、取り出した標本や標本から計算される信頼区間の側であることです。

母集団は固定されているという設定なので、母集団の平均も固定されていて確率的に揺らぎません。続く
#統計 誤解しないための第二のポイントは、標本を取り出す母集団は現実の母集団ではなく、数学的フィクションである正規分布モデル内での仮想的な母集団であることです。

この点は学部生レベル程度の統計学入門の教科書でまともに説明されていないので注意が必要です。続く
#統計 現実の母集団から取得した標本は固定された数値の集まりなので確率的に揺らがないのですが、数学的フィクションとしての標本ならあなたが好きなように任意の確率的な揺らぎ方をするようにできます。続く
#統計 平均の95%信頼区間の95%は「正規分布モデル内での標本分布に従って確率的に揺らぐ標本から作った区間にその正規分布の平均が含まれる確率」になっています。

95%はモデル内確率の一種です。続く
#統計 一般に信頼区間は、データ(現実世界で得た標本)だけではなく、数学的フィクションであるモデル(例えば正規分布モデル)の取り方にも依存します。

95%信頼区間の95%はそういう数学的フィクションとしてのモデル内部における確率に過ぎません。
#統計 信頼区間を計算するために使ったモデルは数学的フィクションにすぎないので、そのモデルを使って作った95%信頼区間はその数学的フィクション内部でのみ完全に信頼できるものになり、現実世界での意思決定で利用する場合には細心の注意が必要になります。続く
#統計 以上の解説は、信頼区間が数学的フィクションであるモデルに依存するという数学的には自明な事柄を強調することによって、よく見る初歩的な誤解(確率ではなく割合だという誤解)を訂正するだけではなく、信頼区間の使用時にどのような注意が必要かも明らかにしています。
#統計 例えば、次の問題について何も考えたことがない人は、正規分布モデルを使った平均の信頼区間を現実で使うことを禁止されるべき!

問題:標本を取得した現実の母集団の分布が全然正規分布に従っていない場合には、正規分布モデルで計算した95%信頼区間はどれだけどのように信頼できるか?
#統計 現実の母集団が全然正規分布に従っていないのは普通のことであり、そのような場合に正規分布モデルを適用したときに生じるリスクについて考える必要があります。

こういう科学的には当たり前のことについて何も考えずに統計学の道具を使うことは非科学的な迷惑行為になると思います。
#統計 ベイズ版95%信用区間の解説でよく見られるデタラメな説明についての解説
#統計 信頼区間と表裏一体の検定におけるP値について、添付画像のように、「というふうに統計の教科書なんかに書かれているので」と言いたくなる気持ちがよく分かる(添付画像①、動画20:50あたり)。


「仮説検定とP値の誤解」
佐藤俊哉
#統計 入門的な教科書なんかでは、例えば正規分布モデルという数学的フィクションを道具として使っているのに、そのフィクション全体の現実における妥当性も疑わないと非科学的な推論になることを強調せずに、平均に関する帰無仮説だけを特に問題にしているように見える説明を書く傾向が強い。
#統計 尤度は「モデルのデータの数値への適合度」の指標の1つ。

P値も「モデルのデータの数値への適合度」の指標の1つとみなせます。ただし、尤度と違ってモデルの包括的な適合度を見るのではなく、モデルのある特定の性質の適合度だけを見る指標になっています。続き
#統計 例えば、正規分布モデルにおける帰無仮説μ=μ₀の両側検定のP値は、特に平均の値に特に注目したときにμ=μ₀の正規分布モデルがデータの数値にどれだけフィットしているかの指標になっています。
#統計 尤度であろうがP値であろうが、多くの仮定を含むモデルを意識しないと使い方を間違えます。

正規分布モデルにおける帰無仮説μ=μ₀の両側検定のP値が非常に小さいときには、帰無仮説μ=μ₀のみを疑うのではなく、モデル全体のどこかがおかしいことを疑う必要があります。
#統計 そういうことが、

biometrics.gr.jp/news/all/ASA.p…
統計的有意性とP値に関するASA声明

の原則1に書いてあるわけです。

使用した統計モデルを意識する必要がある。

このスレッドの最初の方で強調したことは,信頼区間でも使用した統計モデルを意識する必要があることです。
#統計 尤度もP値も信頼区間も現実から得たデータの数値とモデルの関係を要約する量になっているという視点がないから、「尤度は尤もらしさの度合いである」とデタラメを述べたり、使用したモデル自体も疑いの対象なのにそのことを見えなくした上でP値や信頼区間について解説するのだと思う。
#統計 私の経験では、教科書に書いてある公式の丸写しをしたりせずに、第一原理に戻って、尤度やP値や信頼区間を計算する函数の十分に抽象化されたコード(プログラム)を書くことは理解の助けになります。

モデルの確率分布の存在を意識しないと抽象化されたコードを書けない。結構難しく、楽しい。
#統計 コンピュータのプログラムでは、モデルもデータも身も蓋もない形式で実装されることになるので、モデルに関する主張を現実の母集団に関する主張と混同することもなくなります。

• • •

Missing some Tweet in this thread? You can try to force a refresh
 

Keep Current with 黒木玄 Gen Kuroki

黒木玄 Gen Kuroki Profile picture

Stay in touch and get notified when new unrolls are available from this author!

Read all threads

This Thread may be Removed Anytime!

PDF

Twitter may remove this content at anytime! Save it as PDF for later use!

Try unrolling a thread yourself!

how to unroll video
  1. Follow @ThreadReaderApp to mention us!

  2. From a Twitter thread mention us with a keyword "unroll"
@threadreaderapp unroll

Practice here first or read more on our help page!

More from @genkuroki

8 Dec
#統計 せっかく作ったので教育用のノートブックを放流

#Julia言語
nbviewer.org/github/genkuro…

二項分布のある種の極限でPoisson分布が得られる(添付画像③④)のと同じように、負の二項分布のある種の極限でガンマ分布が得られる(添付画像①②)。 ImageImageImageImage
#統計 r=3, p=1/(5N)の負の二項分布を1/N倍でスケールして得られる分布のcdfはN=100でα=3, θ=5 のガンマ分布のcdfにほぼぴったり一致している。

離散分布と連続分布の比較は累積確率分布函数(cdf)のプロットで比較すると楽です。

#Julia言語
nbviewer.org/github/genkuro… Image
#統計 この極限はそれぞれの分布の意味が分かっていれば「当然そうなる」と思える類のものです。
Read 4 tweets
8 Dec
#統計 推定推測推論用に用意したパラメータθ付きの確率分布モデルp(x|θ)を前提とした

パラメータθの真の値は決まっている vs. パラメータθは確率分布している

という争いの枠組みは、私から見ると、

同類どうしの内ゲバ

に過ぎない。

推定推測推論用モデルの外側から来るリスクに無頓着。
#統計 推定推測推論用に用意したパラメータθ付きの確率分布モデルp(x|θ)を前提とした上で、パラメータθの値は決まっているが未知なので、最悪の場合の損失を最小化するように意思決定する、というミニマックス法を使っていても、モデル自体が大外ししているリスクは考えていない。
#統計 推定推測推論用に用意したパラメータθ付きの確率分布モデルp(x|θ)において、パラメータθが確率分布していると考えて、パラメータの分布についての損失の期待値を最小化するように意思決定する、というベイズ的意思決定論を使っていても、モデル自体が大外ししているリスクは考えていない。
Read 4 tweets
8 Dec
minimal working examples抜きには曖昧過ぎて微妙に危険な感じ。よい推定、よい予測、よい意思決定の中身が不明過ぎる。

特に「意思決定」という言葉が「推定」や「予測」など任意の行動を決める意味が広い用語になっているせいで、「本当はよい意思決定を目指すべきだ」と誤解する危険性がある。続く
教科書によく書いてある意思決定論では、パラメータ付きのモデル(推定推測推論用のモデル、以下単にモデルという)の内部で「最悪の場合の最善手」(ミニマックス)や「期待リスク最小化」(事前分布を主観確率と解釈すれば主観内で計算した期待リスク最小化)を考えます。
続く。リスクの定義を決める損失函数として「推定の悪さ」「予測の悪さ」の指標にすれば「モデル内でのよい推定」「モデル内でのよい予測」が得られ、仮に「金銭的な損失」の指標にできれば「モデル内での金銭的に最適な意思決定」が得られます。

そういう話は確かに結構面白いです。続く
Read 33 tweets
8 Dec
数学がめちゃくちゃ苦手であっても「3×2だとウサギが3本耳になる」と本当に教えていることに呆れざるを得ないのですが、事情を知らない人の中には、「場面を式に表す」を「場面から数値・数量に関する式を作る」の意味だと誤解して、おかしな教え方を擁護し出すというようなことがあるように思えます。
あと、これは10年前から言っていることですが、「3×2だとウサギが3本耳になる」(算数でもならないし、理科でも国語でもならない(笑))という教え方が論外なことは、数学が苦手でも当たり前に理解できることです。

理系大学教授を持ち出すのはミスリーディング。
通常の批判では「非常識」という言葉は使い難いのですが、算数教育界の伝統が育てたおかしな教え方については例外的に「非常識」という批判は非常に適切であり、社会全体できちんと悪い意味で非常識扱いして行くべきだと思う。

数学がどんなに苦手でもダメだとすぐに分かる非常識な教え方をしている。
Read 8 tweets
7 Dec
統計量の分布をぼーっと眺める 〜中心極限定理観察〜 qiita.com/gilbert_yumu/i… #Qiita @gilbert_yumuより
【中心極限定理の可視化、また母集団によっては成り立たないことの可視化】

#統計 中心極限定理が成立しない場合や成立していても収束が遅い場合も扱っている点が非常に良い。
中心極限定理が特別に非常にうまく行く場合(ベルヌイ分布、一様分布、左右対称な分布の多く)の可視化だけを見て終わりにすると、中心極限定理による近似が小さなnで常に良くなるように誤解してしまうリスクがあると思う。

中心極限定理が成立してかつ収束が遅い場合の可視化は特に重要だと思う。
#統計 和に関する再生性と条件付き分布 qiita.com/gilbert_yumu/i… #Qiita @gilbert_yumuより

これも教育的。条件付き確率分布の計算は基本の1つ。簡単だが、非自明さのある面白い例を紹介している。匙加減が非常によい。
Read 16 tweets
7 Dec
#統計

改訂増補版:統計検定を理解せずに使っている人のために I
池田 郁男
東北大学未来科学技術共同研究センター
Published: 2019-08-01
© 2019 公益社団法人日本農芸化学会
katosei.jsbba.or.jp/view_html.php?…

いやあ、これは色々雑な解説の仕方で頭を抱えた。
#統計

改訂増補版:統計検定を理解せずに使っている人のためにII
池田 郁男
東北大学未来科学技術共同研究センター
Published: 2019-09-01
© 2019 公益社団法人日本農芸化学会
katosei.jsbba.or.jp/view_html.php?…

Welch検定で自由度を四捨五入するのはやめて!

以前にもこれ見た覚えがある。
#統計 不偏分散の平方根は母標準偏差の不偏推定量にならないことは自明。

多分それよりも要注意なのは、不偏分散は緩い条件のもとで任意のi.i.d.サンプルで母分散の不偏推定量になること。これは例外的なので要注意。

一般に不偏推定量は特定のモデル内でしか不偏推定量にならない。
Read 14 tweets

Did Thread Reader help you today?

Support us! We are indie developers!


This site is made by just two indie developers on a laptop doing marketing, support and development! Read more about the story.

Become a Premium Member ($3/month or $30/year) and get exclusive features!

Become Premium

Too expensive? Make a small donation by buying us coffee ($5) or help with server cost ($10)

Donate via Paypal

Or Donate anonymously using crypto!

Ethereum

0xfe58350B80634f60Fa6Dc149a72b4DFbc17D341E copy

Bitcoin

3ATGMxNzCUFzxpMCHL5sWSt4DVtS8UqXpi copy

Thank you for your support!

Follow Us on Twitter!

:(