#統計 P値や信頼区間に関する大学での講義は(数え切れないくらい強調していることですが)、論文 journals.sagepub.com/doi/10.1177/02… の内容(過信や自信過剰を引き起こさない考え方)に従うように改訂されるべきだと思います。

過去の大学の講義のほとんどがその意味では失格。
#統計 帰無仮説は統計モデルのパラメータの値に関する仮説になっており、P値を得るための確率の(近似)計算は帰無仮説下の統計モデル内で行うことになるので、統計モデルについての説明がない仮説検定の説明は最初から相手にする価値がないということになります。
#統計 仮説検定における「統計モデル」は「P値の計算に使われる数学的仮定の全体」のようにざくっと定義しておくと便利です。

例えば、P値の計算に確率の近似計算を使うならば、その近似がうまく行くという条件が統計モデルの中に含まれていると考えると便利。
#統計 例えば、Welchのt検定で必要とされる数学的仮定を正確に言うことは結構難しいです。

「2群の母集団分布がともに正規分布になっていること」はWelchのt検定の統計モデルの説明として全然ダメ。

なぜならば、Welchのt検定は正規母集団の仮定が成立していなくても多くの場合に使用可能だから。
#統計 Wilcoxonの順位和検定のP値は「2群の分布が完全に等しい」というモデルの中で計算されます。

だから、2群の分布が左右対称で平均や中央値が互いに等しいとしても、分散や尖度が異なると、Wilcoxonの順位和検定では有意差が出易くなります。コンピュータで容易に確認可能です。続く
#統計 続き。2群の分布が左右対称で平均と分散が互いに等しいとしても、尖度が異なると、Wilcoxonの順位和検定では有意差が出易くなります。

分散が等しくてもWilcoxonの順位和検定では有意差が出易くなる場合があることはあまり知られていないと思います。続く
#統計 続き。そういう形で有意差が出易くなることは、Wilcoxonの順位和検定が適用される通常の状況では不適切です。

だから、Wilcoxonの順位和検定は無条件では使えない検定だということになります。

この辺も私は易しい話ではないと思います。
#統計 以上で述べたような易しくないことをある程度以上理解できた人だけが、Welchのt検定やWilcoxonの順位和検定を使う資格があります。

現実にはそういう資格がない人達がそれらの検定を使っており、特にWilcoxonの順位和検定は多くの場合に誤用されている疑いがあります。
#統計 さらにそれ以前の問題として、違いの適切な測り方についてほとんど何も考えずに「有意差を出せればなんでもよい」のように考えて、Welchのt検定とWilcoxonの順位和検定を同列に並べて比較すること自体に問題がありすぎます。

根本的におかしな考え方が蔓延している。
#統計 論文 journals.sagepub.com/doi/10.1177/02… を読んだ後に、現実の高等教育(大学と大学院)での統計学教育の現状について考えると、それらのギャップが非常に巨大であることがわかります。

みんなで少しでもまともな側に近付ける努力が必要。

• • •

Missing some Tweet in this thread? You can try to force a refresh
 

Keep Current with 黒木玄 Gen Kuroki

黒木玄 Gen Kuroki Profile picture

Stay in touch and get notified when new unrolls are available from this author!

Read all threads

This Thread may be Removed Anytime!

PDF

Twitter may remove this content at anytime! Save it as PDF for later use!

Try unrolling a thread yourself!

how to unroll video
  1. Follow @ThreadReaderApp to mention us!

  2. From a Twitter thread mention us with a keyword "unroll"
@threadreaderapp unroll

Practice here first or read more on our help page!

More from @genkuroki

Jan 28
#数楽

a(n+1)=3a(n)+2ⁿ は Ta(n)=a(n+1) を使えば

(*) (T-3)a(n)=2ⁿ

と書き直せる。(T-2)2ⁿ=0なので、

(*)⇒(T-2)(T-3)a(n)=0.

ゆえに(*)の解は

a(n)=A×3ⁿ+B×2ⁿ

と書ける。このとき(*)⇔B=-1.

以上の完全に機械的な解法は大幅に一般化可能。
#数楽 Ta(n+1)=a(n)と書く。

(Tⁿ+p₁Tⁿ⁻¹+…+pₙ)a(n) = 0

の形の斉次方程式の解の形が完全にわかっていることを使えば、f(n)がそのような形の斉次方程式の解であるときの

(Tⁿ+p₁Tⁿ⁻¹+…+pₙ)a(n) = f(n)

の形の非斉次の場合も機械的に解ける。技巧的な式の変形技術は無用になる。
#数楽 そういう技巧を不要にする機械的解法は、

 ある種の方程式を満たす数列全体の集合が具体的に完全にわかっていること

から、ただちに出て来る。

ある街の様子を完全に知っていれば、その街で苦労無しに快適に暮らせるのと似ている。
Read 8 tweets
Jan 27
#統計 mdsc.kyushu-u.ac.jp/lecturesmdsc.kyushu-u.ac.jp/wp/wp-content/… の内容が滅茶苦茶。添付画像を参照。

①信頼区間の説明で「母平均の分布もわかる!」と書いてある。酷い!

②「t分布する二つに値の「差」も、やはりt分布」と書いてある。酷い!

③Wilcoxonの順位和検定は中央値の差の検定法ではない。
#統計 P値や信頼区間に関するより現代的な知識は論文 journals.sagepub.com/doi/10.1177/02… で得られる。

統計的有意性とP値に関するASA声明 biometrics.gr.jp/news/all/ASA.p… は必読で、講義動画 ocwcentral.com/subjects/01GB4… には時代遅れな説明が書いてある教科書に批判的コメントがある。

これらの代替案に従えば無難。
#統計

mdsc.kyushu-u.ac.jp/lectures

slideshare.net/ssuserf64eb4/s…

にも同様に酷い説明がある。

①真の平均が正規分布しているかのようなグラフの下に【真の平均は,95%の確率で,標本平均±1.96σ/√Nの範囲にある!】と書いてある!酷い。

②【t分布する二つの値の「差」も,やはりt分布】とある!酷い!
Read 5 tweets
Jan 27
#統計 「全部pだと困る問題」について。個人のノートでは

p₁(y|x,c)p₂(x|c)p₃(c)p₁(yₐ|a,c)

の代わりに、

p(y|x,c)p(x|c)p(c)p(y=yₐ|x=a,c)

と書くことにしている。引数名を固定して、引数xにaを代入する場合には引数をx=aと書くという方針。

#Julia言語 のp(; y, x, c)と同じ仕様を採用😊
#Julia言語 での p(; x=y, μ=0, σ) のような書き方はこんな感じ。

using Distributions

p(; x, μ, σ) = pdf(Normal(μ, σ), x)

y = 1.96
σ = 1

p(; x=y, μ=0, σ) using Distributions  p(; x, μ, σ) = pdf(Normal(μ, σ), x)
プログラミング言語の仕様になっている書き方であれば、well-definedな表記法であることが保証されていると考えてよい。

#Julia言語 との類似は、変数名が違えば型も違うことにすると、同一の名前の函数(メソッド)の多重ディスパッチの仕組みによって、より完璧になる。
Read 4 tweets
Jan 27
#統計 2009年頃に、添付画像の場合に傾向スコア法を使うとバイアスが生じたりしないのか、という質問にルービン先生がまともに答えることができなかった件はもっと知られてよいと思う。

この件については、ルービン先生的な因果推論を学んだ人達もルービン先生個人に批判的になるべきだと思いました。
#統計 ある程度以上、統計的因果推論について学んだ人であれば、Cによる条件付けで調整すると、EのOutcomeへの効果にバイアスが生じ、因果効果の見積もりを誤る危険性があることを理解しているはずです。

易しい話です。
#統計 ルービン先生は、「この場合の因果推論では、傾向スコア法に限らず、Cによる条件付けをしてはいけない」とクリアに答えればよかった。

ルービン先生は単にCによる条件付けに警告を発し、警告する機会を与えてくれたことについて、質問者にお礼を述べればよかった。
Read 31 tweets
Jan 27
#数楽 差分作用素をTf(n)=f(n+1)と書く。

a,b,cが異なるとき、

A aⁿ + B bⁿ + C cⁿ

は(T-a)(T-b)(T-c)の作用で消える。

(bⁿ-aⁿ)/(b-a)のb→aの極限naⁿ⁻¹なので

A aⁿ + A' naⁿ⁻¹ + C cⁿ

は(T-a)²(T-c)の作用で消える。続き
#統計 c=a+hとおくと、

cⁿ = aⁿ + naⁿ⁻¹h + n(n-1)/2 aⁿ⁻² h² + O(h³)

なので、h→0のとき

(cⁿ - aⁿ - naⁿ⁻¹h)/h² →n(n-1)/2 aⁿ⁻².

ゆえに

A aⁿ + A' naⁿ⁻¹ + A'' n(n-1)/2 aⁿ⁻² = (nの2次以下の多項式) aⁿ

は(T-a)³の作用で消える。

一般の場合も同様。
#数楽 特性方程式が重解を持つときにはJordan標準形を使うと覚えてしまった人がいるかもしれませんが、重解を持たない場合からの極限で重解を持つ場合も理解できます。

系を摂動したときの解の挙動の変化は重要なので、重解を持つ場合を持たない場合で近似することも重要です。
Read 11 tweets
Jan 26
冷える。 Image
さらに冷えた。 Image
Image
Read 4 tweets

Did Thread Reader help you today?

Support us! We are indie developers!


This site is made by just two indie developers on a laptop doing marketing, support and development! Read more about the story.

Become a Premium Member ($3/month or $30/year) and get exclusive features!

Become Premium

Don't want to be a Premium member but still want to support us?

Make a small donation by buying us coffee ($5) or help with server cost ($10)

Donate via Paypal

Or Donate anonymously using crypto!

Ethereum

0xfe58350B80634f60Fa6Dc149a72b4DFbc17D341E copy

Bitcoin

3ATGMxNzCUFzxpMCHL5sWSt4DVtS8UqXpi copy

Thank you for your support!

Follow Us on Twitter!

:(