#統計 繰り返し述べていることですが、95%信頼区間の誤解する可能性の低い定義の仕方は「データから有意水準5%の検定で棄却されない(統計モデルの)パラメータの範囲」です。

例えば、パラメータは「ワクチンの効果」の指標を意味していたりする。
#統計 「検定で棄却されないこと」は「データからはそういう可能性があることに配慮し続ける必要があるという程度のことしか言えない」ということに過ぎず、棄却されないから正しいかのように考えてはいけない。

これは検定論のイロハのイにあたること。
#統計 例えば、ワクチンの効果の大きさと解釈されるパラメータを持つ統計モデルを適切に設定したとき、データから計算したそのパラメータの95%信頼区間が0をまたいでいたとする。
#統計 そのとき、我々は、

使用したデータからは、ワクチンの効果が0を含むその区間に含まれる値になっている可能性に配慮し続ける必要がある

程度のことしか言えない。弱い結論しか出せない。
#統計 実際には、統計モデルが実際のデータの取得の仕方と整合していないせいでそういう結果が得られた可能性やその他諸々の失敗の可能性も疑う必要がある。単に得られたデータが運悪くひどく偏っていた可能性さえある。

そういう諸々の事柄を無視してもその程度のことしか言えない。
#統計 そういう弱い結論しか出せない信頼区間であっても、あるとないでは大違いです。

ワクチンの効果がどのくらいの期間有効であるかに関する目安は現実の意思決定に必要な情報です。

統計学は、「お墨付き」を得るためには使えないが、複雑な現実世界に立ち向かうためには必須の道具だと思います。
#統計 非常に不幸なことに、経歴的に高等教育を受けているはずなのに、社会的な意思決定に関わる重大な事柄について、真っ当な意見を述べている人たちを馬鹿にするために統計学を使って得られた結果についてめちゃくちゃな解釈を堂々と述べて利用する人がいる。単なる間違いとは違った邪悪さがある。
#統計 そういう邪悪な人に騙されずに済むように、さまざまな教養を身につけておくことは大事なことだと思いました。

みんなで勉強して社会的に共通の了解にしておかないと、邪悪な人たちが力を持ち易くなる。

そして、以上の話と「人間なら誰でも犯す馬鹿な失敗の話」を区別して行く必要がある。
#統計 信頼区間は「データから棄却されないモデルのパラメータの範囲」だとみなせるという話は、売れ線の教科書では、

竹内啓『数理統計学』
竹村彰通『現代数理統計学』
久保川達也『現代数理統計学の基礎』

に書いてあります。
#統計 インターネット上には、信頼区間についておかしな解説が溢れています。日本語圏だけの問題ではなさそうですが、日本語圏では困った人が「95%信頼区間の95%は確率ではなく割合だ」という間違っていてかつピントの外れた意見を広めているので注意が必要です。

これが高等教育の現実で結構厳しい。
#統計 95%信頼区間の95%は統計モデル内で測った確率(の近似値)になっています。

統計モデル抜きではP値について理解できなくなることは、ASA声明でも強調されています。

P値に関するASA声明翻訳版
biometrics.gr.jp/news/all/ASA.p…

P値もモデル内確率です。P値の理解抜きに信頼区間も理解できない。
#統計 P値については、ASA声明の翻訳者でもある佐藤俊哉さんの講義動画を視聴しておけば誤用を防げると思います。



さらに

jstage.jst.go.jp/article/jjb/38…
ASA 声明と疫学研究におけるP値
佐藤俊哉

も参照。添付画像はその最後の段落。信頼区間もP値から得られる。
#統計 1つ前のツイートの添付画像中に登場するRothmanさん達の有名な疫学の教科書でも、

95%信頼区間
=データから得られたP値が5%以上のモデルのパラメータの範囲

という定義が採用されています。実際にはさらにすすめて、パラメータ値にP値を対応させるP値函数の系統的利用をすすめている。
#統計

jamanetwork.com/journals/jama/…
Use of Confidence Intervals in Interpreting Nonstatistically Significant Results
Hawkins and Samuels
2021

でも、データから有意水準5%で棄却されないモデルのパラメータ(例えば治療効果を意味するパラメータ)の範囲として、95%信頼区間を定義しています。
#統計 P値から信頼区間は

95%信頼区間=P値が5%以上になるパラメータの範囲

で作れます。逆に、信頼係数1-αの信頼区間の実装のコードを見て、そこから逆にP値函数を作ることの実演を以下のリンク先で行いました(数学的には自明な構成)。

信頼区間とP値は表裏一体です。
#統計 P値と信頼区間の概念は表裏一体で、それらは

95%信頼区間=P値が5%以上になるモデルのパラメータの範囲

という関係になっている。

ゆえに、有意水準5%で「パラメータ値が0である」というモデル内仮説が棄却されることと、95%信頼区間に0が含まれないことは同値。
#統計 有意水準5%で「パラメータ値が0である」という仮説が棄却されることを「有意差がある」と言う場合には、95%信頼区間が0を含まないことと有意差があることは同値。
#統計 注意・警告:統計ソフトの多くはP値と信頼区間の表裏一体性に無頓着で、P値と信頼区間を別の考え方で実装しており、「パラメータ値は0である」という帰無仮説のP値が5%を切っていても、95%信頼区間に0が含まれている場合が生じる。P値と信頼区間の黒歴史が統計ソフトに詰まっている感じ。
#統計 再注意:統計学用語としての「有意差がない」は、差がないことの証拠が得られたことを意味しない。単に

 そのデータだけからはよーわからん

ということでしかない。

検定論のイロハのイなので、この辺の判断で間違うと相当にまずい。
#統計 しかもその「よーわからん」という判断は、必然性がない5%の有意水準(閾値)の設定をしていたり、現実への適用に注意を要する統計モデルを前提にしていたりと、そう単純な話にならない。

現実の意思決定ではその統計分析外の知識を総合的に用いる必要がある。
#統計 ついでに述べておくと、○○も効果を意味するモデルのパラメータ値の点推定の結果が負の値になっていても、「○○の効果は負である」と判断してはいけない。

推定の誤差が単に大きいせいで、本当は正の値なのに、推定結果は負の値になっただけの可能性がある。

普通は信頼区間の方を見る。
#統計 普通は点推定の値だけで判断せずに信頼区間も見る。だから「○○の効果は負である」とおかしなことを述べてしまった人も信頼区間を見ているだろうと推測することは、かなり好意的な推測の仕方になる。「点推定の結果が負だから○○の効果は負である」のような判断の仕方はあまりにも論外すぎる。
#統計 例えば、サイコロを3回ふったら3回とも奇数の目が出たとする。このとき、奇数の目が出る確率の点推定の結果は100%になる。

その結果を見て「このサイコロは奇数の目だけが100%の確率で出るイカサマのサイコロだ!」などと叫ぶと、賭場では大変なことになってしまふだろう(笑)。
#統計 細かい注意:1つ前のツイートでは点推定の方法として二項分布モデルでの最尤法を使った。点推定の方法には最尤法以外にも沢山の選択肢がある。多くの目的について最尤法は最適戦略にならないので、最尤法が至上であるかのような説明はミスリーディングで好ましくない。
#統計 少し脱線:「P値」の利用と「有意水準」(閾値)の利用の問題は明瞭に区別することが必要。後者のみに重大な問題がある。Rothmanさん達の有名な疫学の教科書では、有意水準という名の閾値を設定する二値的判断よりも、P値函数全体を使った総合的判断をすすめている。
#統計 続き:さらに厳密に細かいことを言うと、有意水準(もしくは信頼係数)という名の閾値を設定することと、現実での意思決定で安易に二値的判断をすることの区別も必要。後者には問題があるが、例えば、閾値の設定を単にグラフを見易くプロットするために使うことには大して問題はないと思う。

• • •

Missing some Tweet in this thread? You can try to force a refresh
 

Keep Current with 黒木玄 Gen Kuroki

黒木玄 Gen Kuroki Profile picture

Stay in touch and get notified when new unrolls are available from this author!

Read all threads

This Thread may be Removed Anytime!

PDF

Twitter may remove this content at anytime! Save it as PDF for later use!

Try unrolling a thread yourself!

how to unroll video
  1. Follow @ThreadReaderApp to mention us!

  2. From a Twitter thread mention us with a keyword "unroll"
@threadreaderapp unroll

Practice here first or read more on our help page!

More from @genkuroki

Mar 15
#統計 n回中k回奇数の目が出たというデータが得られたとき、

pᵏ(1-p)ⁿ⁻ᵏ

を最大化するpの値k/nを奇数の目が出る確率の推定値とするのが、二項分布モデルでの最尤法に一致します。

その最尤法では、n回中k回奇数の目が出たら、奇数の目が出る確率はk/nだと推定される。非常に安易!続く
#統計 データからの最も安易な推定法は、シンプルなモデルを使った最尤法に一致することが多いです。

上の例では、3回中3回とも奇数の目が出ると、奇数の目が出る確率は3/3=1だと推定される。

この推定結果は真実を意味するわけでも何でもなくて、特定の方法による単なる推定結果に過ぎません。
#統計 最尤法については、入門的な教科書の多くに妙な説明がよく書いてあります。

東大出版会の『統計学入門』は最尤法に限らず統計学における基本概念についてことごとくミスリーディングな説明をしているのに、標準的教科書の地位を占めてしまった。

これが高等教育の現実で結構厳しい。
Read 9 tweets
Mar 15
#統計

データと統計モデルが与えられたときに、モデルのパラメータ値にP値を対応させる函数をP値函数と呼びます。

P値函数全体の情報は尤度函数全体の情報に近似的に等しくなる場合が多い。

その場合には、P値函数が最大になるパラメータ値は最尤法による点推定の結果に近似的に等しくなる。続く
#統計 さらに、尤度函数全体の情報はベイズ統計での事後分布の情報にも近い。(事前分布の違いしかない(笑))

このように、Rothmanさん達の疫学の有名教科書がすすめているP値函数全体を使うという考え方は、尤度函数全体の様子を見ることとの関係を通して、ベイズ統計と地続きで繋がっています。
#統計 データと統計モデルから決まる

 P値函数、尤度函数、事後分布の3つ

はほぼ同じような使い方をできる統計量になっています。

こういう理解の仕方ができれば、「主義が違う別の統計学がある」という有害な言説に騙されることなく、柔軟に統計学的ツールを使いこなし易くなると思われます。
Read 6 tweets
Mar 13
#数楽

S_n = Σ_{k=n}^∞ 1/(2ᵏk) > 0

とおくと、

S_1 = log 2

なので

a_n = 2ⁿ⁻¹(1 + log 2 - S_n)

となることがわかる。ゆえに

a_n < 2ⁿ⁻¹(1 + log 2) < 2ⁿ.

a_n は 2ⁿ⁻¹(1 + log 2) でよく近似されます。 ImageImage
#数楽 数式処理ソフトはレルヒの超越函数を知っていてよく答えの中に混ぜて使って来る。

wolframalpha.com/input/?i=a%281… Image
#数楽 不等式による評価は「よりシャープなものを追い求める」ことを考えると楽しくなることが多い。

例えば

a_n < 2ⁿ

よりも

a_n < 2ⁿ⁻¹(1 + log 2)

の方がずっとシャープな結果になっている。

特に教える側は、易しく解けること以上のことを知っていた方がより楽しみやすいと思う。
Read 5 tweets
Jan 16
#数楽 子が次の問題を解き始めたので、私が心の中で「正9角形だから各頂点での外角は40度で云々」と考え始めた直後に、「できた!」と言われてくそびっくりした。

10秒で解いた!

解き方が本質を突いていて非常に感心してしまった。

色々な解き方に続く。
#数楽 問題に付属の模範解答はこれだった。

6角形の内角の和から分かっている角度を引く方法。

実はこれは問題の出し方の罠にはまっているとみなせる解法。無駄に難しく問題を解いている。
#数楽 私は以下の解法を考えていた。

外角の和の360度から分かっている外角を引く方法。
Read 5 tweets
Jan 14
#超算数 ことごとく正しいことを述べていても、証拠となる資料を引用していなければ、「観戦者」への説得力はゼロに近付き、証拠の資料抜きに信じてしまうような人達だけにアピールしてしまうことにもなります。

自分の主張の大部分に証拠資料を添付するようにした方がベターだと思いました。
#超算数 算数教育界が100年以上ずっとおかしな教え方を続けているという問題については、具体的にどういう問題であるかが世間的にほとんど何も知られていません。

自分の意見を述べるよりも、事実を示す資料の拡散の方が重要であり、資料拡散のツイートをする人が増えないと非常にまずいと思います。
#超算数 最近、再拡散した方が良いと思って実際にそうした資料
Read 23 tweets
Jan 13
#数楽 「ε-Nやε-δにも触れることが多い」程度であれば、偏ったサンプルの元でなら、大学1年生の講義で「習う」というのが大勢と言って良いかも知れませんが、現実にはほとんど触れない場合も多いと思います。

多分長くなるので、引用RTにしました。続く
#数楽 ε-Nやε-δ以前の問題として、高校での微積分のカリキュラムには沢山の問題があります。大学1年生向けの微積分の講義の最低目標は「その修正」です。

例えば、積分を不定積分で導入して、定積分を "F(b) - F(a)" で導入するのは、積分の実用的な応用の観点から見ても相当に酷いと思います。続く
#数楽 実用的観点から重要な無限区間での積分が高校の数学のカリキュラムではなぜか教えないことになっているようです。

Gauss積分、ガンマ函数、Fourier変換、Laplace変換などの応用上知らないと確実に困る事柄がごっそり高校数学での微積分から抜け落ちている。
Read 42 tweets

Did Thread Reader help you today?

Support us! We are indie developers!


This site is made by just two indie developers on a laptop doing marketing, support and development! Read more about the story.

Become a Premium Member ($3/month or $30/year) and get exclusive features!

Become Premium

Don't want to be a Premium member but still want to support us?

Make a small donation by buying us coffee ($5) or help with server cost ($10)

Donate via Paypal

Or Donate anonymously using crypto!

Ethereum

0xfe58350B80634f60Fa6Dc149a72b4DFbc17D341E copy

Bitcoin

3ATGMxNzCUFzxpMCHL5sWSt4DVtS8UqXpi copy

Thank you for your support!

Follow Us on Twitter!

:(