#統計 n回中k回奇数の目が出たというデータが得られたとき、

pᵏ(1-p)ⁿ⁻ᵏ

を最大化するpの値k/nを奇数の目が出る確率の推定値とするのが、二項分布モデルでの最尤法に一致します。

その最尤法では、n回中k回奇数の目が出たら、奇数の目が出る確率はk/nだと推定される。非常に安易!続く
#統計 データからの最も安易な推定法は、シンプルなモデルを使った最尤法に一致することが多いです。

上の例では、3回中3回とも奇数の目が出ると、奇数の目が出る確率は3/3=1だと推定される。

この推定結果は真実を意味するわけでも何でもなくて、特定の方法による単なる推定結果に過ぎません。
#統計 最尤法については、入門的な教科書の多くに妙な説明がよく書いてあります。

東大出版会の『統計学入門』は最尤法に限らず統計学における基本概念についてことごとくミスリーディングな説明をしているのに、標準的教科書の地位を占めてしまった。

これが高等教育の現実で結構厳しい。
#統計 【「現実の標本は確率最大のものが実現した」という仮定】(東大出版会『統計学入門』より)と本当に書いてある!

最尤法ではデータに最もフィットするパラメータ値を求めているだけです。そのようにして得た推定値は現実における真の値からかけ離れた値になっている可能性もある。
#統計 likelihoodで日常用語的には「もっともらしさ」という意味を持ちますが、数学的に正確に定義された概念について日常用語的な解釈を与えることはよく見る典型的にダメな考え方です。

尤度は「もっともらしさ」の指標ではありません。モデルのデータへの適合度の指標の1つに過ぎない。
#統計 Fisherさんが専門用語としてのlikelihoodという用語を正確に定義するまでには、「ひとり伝言ゲーム」をやっています(おそらく誤解を含んでいた)。専門用語は偉い人が使ったものがそのまま使われて続けることがあり、そういう悪しき事情と無関係に理解するようにしないとまずい。
#統計 いずれにせよ、「現実の標本は確率最大のものが実現した」のように仮定することは馬鹿げています。

最尤法では、統計モデル内で現実から得た標本と同じ数値が生成される確率密度が最大化されるパラメータ値を求めているだけ。その方法で求めたパラメータの推定値は的を外しているかもしれない。
#統計 最尤法の基礎は「データサイズが十分に大きいならば、データにフィットするようにモデルのパラメータ値を調節すれば、現実を近似する推定結果が得られるだろう」という考え方。

データからの推定値がどれだけ的を外すかに関する評価を行うと、本質的に信頼区間及びその一般化の話になる。
#統計 最尤法が有用であることの理解には、「現実の標本は確率最大のものが実現した」のような不合理な仮定は無用です。必要なのは、最尤法の数学的性質の理解です。
#統計 「現実の標本は確率最大のものが実現した」の解釈で重要なのは最尤法の文脈でその意味での「確率」は現実世界におけるなんらかの適切な意味での確率という意味ではなく、数学的フィクションである統計モデル内部で測った確率(尤度)という意味に過ぎないこと。
#統計 現実が、おまえが設定した統計モデル内での確率を最大化するように標本を生成するとおまえが思って良いとすることは文句無しに馬鹿げた考え方です。

現実の法則はおまえの考え方とは無関係に働いている。
#統計 例えば、現実の標本は平均μ₀と分散σ₀²を持つ未知の正規分布から程遠い確率分布(のiid)に従って生成されている状況に、正規分布モデルを使った最尤法を適用したとしましょう。

すると、最尤法による平均μと分散σ²の推定量はそれぞれ標本平均と標本分散になります。続く
#統計 以上の状況では、正規分布から程遠い母集団分布の標本に、正規分布モデルの最尤法を適用している。

はっきり間違ったモデルを適用しているのに、標本サイズ→∞の極限で、正しく母平均と母分散を推定できることを証明できます。

続く
#統計 平均と分散の推定では、正規分布モデルの最尤法が一応いつでも使える。

しかし、正規分布モデルよりも母集団分布をよく近似できてパラメータ数も少なめの統計モデルを使った方が、より小さな標本サイズでより正確な最尤推定が可能になる。

不合理な仮定ではなく、こういう数学の理解が大事。
#統計 最尤法の数学的性質をある程度理解していれば、

* 母平均と母分散の推定にいつでも正規分布モデルを使えること

* 分野固有の知識を使ってより適切な統計モデルを設定できれば確率的に誤差をより小さくできること

などが分かります。こういう類の知識は明らかに役に立ちます。
#統計 専門知識を使って設定したモデルがある程度以上複雑になると、最尤法のコンピュータでの実装自体が結構面倒になったり、得意モデルに近い状況が生じて最尤法の使用が不適切になるリスクも増えます。そういう場合にはベイズ法やその変種の採用の検討も必要になる。
#統計 「異なる主義思想哲学に基く別の統計学がある」(それぞれ別のお墨付きが得られる)のような有害に見える言説に乗っかる必要は皆無で、普通に地道に理解するべきことを理解して道具を使って行けばよいと思います。

• • •

Missing some Tweet in this thread? You can try to force a refresh
 

Keep Current with 黒木玄 Gen Kuroki

黒木玄 Gen Kuroki Profile picture

Stay in touch and get notified when new unrolls are available from this author!

Read all threads

This Thread may be Removed Anytime!

PDF

Twitter may remove this content at anytime! Save it as PDF for later use!

Try unrolling a thread yourself!

how to unroll video
  1. Follow @ThreadReaderApp to mention us!

  2. From a Twitter thread mention us with a keyword "unroll"
@threadreaderapp unroll

Practice here first or read more on our help page!

More from @genkuroki

Mar 15
#統計

データと統計モデルが与えられたときに、モデルのパラメータ値にP値を対応させる函数をP値函数と呼びます。

P値函数全体の情報は尤度函数全体の情報に近似的に等しくなる場合が多い。

その場合には、P値函数が最大になるパラメータ値は最尤法による点推定の結果に近似的に等しくなる。続く
#統計 さらに、尤度函数全体の情報はベイズ統計での事後分布の情報にも近い。(事前分布の違いしかない(笑))

このように、Rothmanさん達の疫学の有名教科書がすすめているP値函数全体を使うという考え方は、尤度函数全体の様子を見ることとの関係を通して、ベイズ統計と地続きで繋がっています。
#統計 データと統計モデルから決まる

 P値函数、尤度函数、事後分布の3つ

はほぼ同じような使い方をできる統計量になっています。

こういう理解の仕方ができれば、「主義が違う別の統計学がある」という有害な言説に騙されることなく、柔軟に統計学的ツールを使いこなし易くなると思われます。
Read 6 tweets
Mar 14
#統計 繰り返し述べていることですが、95%信頼区間の誤解する可能性の低い定義の仕方は「データから有意水準5%の検定で棄却されない(統計モデルの)パラメータの範囲」です。

例えば、パラメータは「ワクチンの効果」の指標を意味していたりする。
#統計 「検定で棄却されないこと」は「データからはそういう可能性があることに配慮し続ける必要があるという程度のことしか言えない」ということに過ぎず、棄却されないから正しいかのように考えてはいけない。

これは検定論のイロハのイにあたること。
#統計 例えば、ワクチンの効果の大きさと解釈されるパラメータを持つ統計モデルを適切に設定したとき、データから計算したそのパラメータの95%信頼区間が0をまたいでいたとする。
Read 26 tweets
Mar 13
#数楽

S_n = Σ_{k=n}^∞ 1/(2ᵏk) > 0

とおくと、

S_1 = log 2

なので

a_n = 2ⁿ⁻¹(1 + log 2 - S_n)

となることがわかる。ゆえに

a_n < 2ⁿ⁻¹(1 + log 2) < 2ⁿ.

a_n は 2ⁿ⁻¹(1 + log 2) でよく近似されます。 ImageImage
#数楽 数式処理ソフトはレルヒの超越函数を知っていてよく答えの中に混ぜて使って来る。

wolframalpha.com/input/?i=a%281… Image
#数楽 不等式による評価は「よりシャープなものを追い求める」ことを考えると楽しくなることが多い。

例えば

a_n < 2ⁿ

よりも

a_n < 2ⁿ⁻¹(1 + log 2)

の方がずっとシャープな結果になっている。

特に教える側は、易しく解けること以上のことを知っていた方がより楽しみやすいと思う。
Read 5 tweets
Jan 16
#数楽 子が次の問題を解き始めたので、私が心の中で「正9角形だから各頂点での外角は40度で云々」と考え始めた直後に、「できた!」と言われてくそびっくりした。

10秒で解いた!

解き方が本質を突いていて非常に感心してしまった。

色々な解き方に続く。
#数楽 問題に付属の模範解答はこれだった。

6角形の内角の和から分かっている角度を引く方法。

実はこれは問題の出し方の罠にはまっているとみなせる解法。無駄に難しく問題を解いている。
#数楽 私は以下の解法を考えていた。

外角の和の360度から分かっている外角を引く方法。
Read 5 tweets
Jan 14
#超算数 ことごとく正しいことを述べていても、証拠となる資料を引用していなければ、「観戦者」への説得力はゼロに近付き、証拠の資料抜きに信じてしまうような人達だけにアピールしてしまうことにもなります。

自分の主張の大部分に証拠資料を添付するようにした方がベターだと思いました。
#超算数 算数教育界が100年以上ずっとおかしな教え方を続けているという問題については、具体的にどういう問題であるかが世間的にほとんど何も知られていません。

自分の意見を述べるよりも、事実を示す資料の拡散の方が重要であり、資料拡散のツイートをする人が増えないと非常にまずいと思います。
#超算数 最近、再拡散した方が良いと思って実際にそうした資料
Read 23 tweets
Jan 13
#数楽 「ε-Nやε-δにも触れることが多い」程度であれば、偏ったサンプルの元でなら、大学1年生の講義で「習う」というのが大勢と言って良いかも知れませんが、現実にはほとんど触れない場合も多いと思います。

多分長くなるので、引用RTにしました。続く
#数楽 ε-Nやε-δ以前の問題として、高校での微積分のカリキュラムには沢山の問題があります。大学1年生向けの微積分の講義の最低目標は「その修正」です。

例えば、積分を不定積分で導入して、定積分を "F(b) - F(a)" で導入するのは、積分の実用的な応用の観点から見ても相当に酷いと思います。続く
#数楽 実用的観点から重要な無限区間での積分が高校の数学のカリキュラムではなぜか教えないことになっているようです。

Gauss積分、ガンマ函数、Fourier変換、Laplace変換などの応用上知らないと確実に困る事柄がごっそり高校数学での微積分から抜け落ちている。
Read 42 tweets

Did Thread Reader help you today?

Support us! We are indie developers!


This site is made by just two indie developers on a laptop doing marketing, support and development! Read more about the story.

Become a Premium Member ($3/month or $30/year) and get exclusive features!

Become Premium

Don't want to be a Premium member but still want to support us?

Make a small donation by buying us coffee ($5) or help with server cost ($10)

Donate via Paypal

Or Donate anonymously using crypto!

Ethereum

0xfe58350B80634f60Fa6Dc149a72b4DFbc17D341E copy

Bitcoin

3ATGMxNzCUFzxpMCHL5sWSt4DVtS8UqXpi copy

Thank you for your support!

Follow Us on Twitter!

:(