#統計 「尤度」=「もっともらしさ」と説明している人は何も理解せずに説明しているので要注意。

尤度の定義は「モデル内で観測されたデータと同じ数値が生成される確率または確率密度」です。モデルのデータへの適合の良さの指標と言って良いのですが、「もっともらしさ」と言えるとは限らない。
#統計 例:「正規分布のi.i.d.でデータが生成されている」というモデルの確率密度函数は

p(x_1,…,x_n|μ,σ²) = p(x_1|μ,σ²)…p(x_n|μ,σ²)
(ここでp(x_i|μ,σ²) = exp(-(x_i-μ)/(2σ²))/√(2πσ²)).

観測データの数値X_1,…,X_nが得られたとき、このモデルの尤度は

p(X_1,…,X_n|μ,σ²)

になる。続く
#統計 尤度が大きいほどモデルはデータによくフィットしていると思ってよいです。

観測データに関するモデルの尤度をモデルのパラメータの函数とみなしたもの、例えば上の例では

L(μ,σ²) = p(X_1,…,X_n|μ,σ²)

を観測データX_1,…,X_nに関するモデルの尤度函数と呼びます。

続く
#統計 尤度の大きさは、モデルのデータへの適合の良さを意味すると考えて良いので、尤度函数を最大化するモデルのパラメータを求めることは、モデルをデータに最もよく適合させるパラメータを求めているとみなせます。これを最尤法と呼びます。

続く
#統計 ただし、データに最も良くフィットするようにモデルのパラメータを調節しても、もっともらしい結果が得られるとは限らないことに注意が必要です。

モデルをデータにフィットさせ過ぎたせいで、モデルによる予測が外れまくるようになる場合があります。これをオーバーフィッティングと言う。
#統計 オーバーフィッティングが引き起こされていないという条件のもとで、最尤法はモデルの範囲内でベストに近い結果を近似的に得る方法として便利に使えます。

例えば、上で例に挙げたパラメータが2個しかない正規分布モデルの最尤法はそのような最尤法が有効な場合になっています。続く
#統計 仮に観測データが未知の真の分布のi.i.d.としてランダムに生成されているならば、nが十分大きなとき、上の正規分布モデルによって、未知の真の分布の平均と分散を正しく推定できます。

未知の真の分布に最もフィットする正規分布は同じ平均と分散を持つ正規分布になります。
しかし、未知の真の分布が正規分布から程遠い場合には、正規分布を正規分布と違う分布にフィッティングさせていることになり、予測の誤差は大きくなります。

モデルの適切さは非常に重要です。
#統計 最尤法はモデルのパラメータ数が増えたり、構造を持ったモデル(特異モデル)では実用的でなくなります。

そういう場合には事前分布を使う方法がより実用的な推測法になります。

(主観確率でベイズ統計について解説している人達は社会的に負の貢献をしているので要注意!)
#統計 観測データに関するモデルの尤度函数を最大化するようなパラメータを求めることは、観測データにもっともモデルをフィットさせるようなパラメータを求めることになっている、と理解しておき、「もっともらしさ」のような曖昧でミスリーディングな言い方で理解したつもりにならないことが重要。
#統計 「尤度」はlikelihoodの訳語で、その単語は「もっともらしさ」という意味を持つので、英語では「尤度=もっともらしさ」だとひどく誤解してしまう可能性が高くなっているものと思われます。

科学的合理性ではなく、歴史的な理由で不適切な単語が専門用語として固定されてしまうことがあります。
#統計 以上のように、「尤度=もっともらしさ」ではないとはっきり説明してくれればクリアなのに、統計学入門の教科書がそうなっていないせいで、多くの人が誤解したり、「尤度、理解できん」となっていると思う。

そこに「尤度原理」などの「主義」に関わるデタラメの解説が投入されると悲惨!
#統計 以下のリンク先動画は、正規分布とは違うが正規分布っぽくも見えるガンマ分布のi.i.d.で生成されたデータによる正規分布モデルの最尤法の様子です。

正規分布とは違う分布が正規分布で最良近似されて行く様子を見れます。
#統計

データはドットで表示。データは y = sin(πx) + ノイズ で生成。

添付画像1: 3次式によるパラメータ数5個のモデルの最尤法によるフィッティング。最大対数尤度=4.2

添付画像2: 21次式によるパラメータ数23個のモデルの最尤法によるフィッティング。最大対数尤度=27.8 (上より大きい)
#統計 尤度は、添付画像1より2の方が高いです。

だから、「尤度=尤もらしさ」だと信じている人は、「添付画像2のフィッティングの方がもっともらしい」と言わなければいけません。

理屈を知らなくても、普通の感覚でそれはおかしいと思うのが普通だと思います。

これがオーバーフィッティング。
#統計 大事なことなので繰り返す。

尤度は観測データへのモデルの適合の良さ(フィッティングの良さ)の指標とみなせるが、「もっともらしさ」の指標ではない。

尤度を大きくすることは単に観測データにフィットするモデルを探しているに過ぎず、データにぴったりフィットすれば良いわけではない。
#統計 「尤度の定義を見ても、どうしてこれが『もっともらしさ』なのか理解できない」と思った人は非常に正常に頭が働いていると思います。

「尤度」を「もっともらしさ」と言い換えて理解した気分になった人はすでにあっちの世界に行きかけていると思う。少なくとも論理的思考は諦めている。
#統計 統計学入門の教科書的解説はそういうパターンが実に多い。

論理的な理解を諦めさせることに繋がるような書き方がほとんど至る所でされている。

例えば、論理的な人なら「正規分布を仮定して有意差を出して本当にいいの?」と当然思うはずで、実際に多くの人がそう思っている。

• • •

Missing some Tweet in this thread? You can try to force a refresh
 

Keep Current with 黒木玄 Gen Kuroki

黒木玄 Gen Kuroki Profile picture

Stay in touch and get notified when new unrolls are available from this author!

Read all threads

This Thread may be Removed Anytime!

PDF

Twitter may remove this content at anytime! Save it as PDF for later use!

Try unrolling a thread yourself!

how to unroll video
  1. Follow @ThreadReaderApp to mention us!

  2. From a Twitter thread mention us with a keyword "unroll"
@threadreaderapp unroll

Practice here first or read more on our help page!

More from @genkuroki

26 Dec
#統計 検定やP値の扱いについてのFisherさんやNeymanさんとPearsonさんの幾つかの発言を拾うと、「頻度論」「頻度主義」という用語で不当に戯画化・過激化されてしまっているP値と検定の姿は消え去り、科学的常識の範囲内で普通に理解できる穏健なものになります。

errorstatistics.com/2017/11/19/eri…
を参照
#統計 errorstatistics.com/2017/11/19/eri… で統計学の哲学者のMayoさんは、統計学者のLehmannさんによるFisherさんやNeymanさんとPearsonさん達(以下NPさん達)の発言の引用を紹介しています。

それらの引用を読むと、FisherさんとNPさん達の意見の違いを強調するための戯画化・過激化は不当であることがわかる。
#統計 検定の理論について突っ込んだ勉強をしたい人は、Lehmannさんの教科書

Testing Statistical Hypotheses
google.com/search?q=Lehma…

を読むと良いと思います。
Read 14 tweets
25 Dec
#数楽 数学だとか、物理だとか、統計学だとか、機械学習だとか、そういう分野によらず、数学は本質的に難しいので、数学を使っている文献は大抵読み難いと私は思います。

数学が専門であっても、あらゆる数学に精通しているわけではないので、自分の専門分野に閉じこもらない限り、当然そうなる。
#数楽 めっちゃ読み難くても理解したときのあの「視界」がクリアになって広がる感覚は他ではなかなか得られない。脳みそに直接来る感じ。

かなり危ない。
#数楽 自分の専門分野外の文献を読んで不満が出る場合には、単にかけている時間が足りないんではないかと思う。

数学を使っている文献は数ヶ月かけても読めないものが多く、多くの場合、数年以上かかります。

数ヶ月しか目を通していない人達はきっと理解していないんだろうなと私は思います。
Read 4 tweets
25 Dec
#統計 私はよくない本だと判断して読んでいないソーバー『科学と証拠―統計の哲学 入門―』(2012)を参照している人達と、統計学の哲学に関する杜撰な意見を持っている人達はかなり重なっているように私には見えています。

添付画像に引用した私の疑問について教えてくれる人を募集中。 ImageImageImage
#統計 尤度は「モデル内で観測データと同じデータが生じる確率(密度)」でしかないし、データとモデルを尤度函数に要約すると多くの重要な情報が失われます。

そういう代物でしかない尤度や尤度函数を「証拠」(の度合い)に昇格させるのはどうかしています。
#統計 ベイズ統計を時代遅れで技術的に劣っているベイズ主義と同一視して議論を進めることが論外なだけではなく、所謂「頻度主義」について戯画化された極端な考え方を割り当てることも卑怯な議論の仕方です。

その辺については以下のリンク先も参照↓
errorstatistics.com/2017/11/19/eri…
Read 4 tweets
24 Dec
#統計 私が最近積極的に紹介している統計学の哲学が専門のMayoさんなどは全然違うのですが、「尤度原理」を安易にまともなもの扱いするような(率直に言ってレベルが低い)人が統計学の哲学を語っている場合があるという問題だけではなく、~続く
#統計 続き~、連続的なパラメータを持つモデルを扱うことが普通のベイズ統計と仮説の真偽を問題にする型の哲学的なベイズ主義が相当に毛色が違った話に見えることに無頓着なまま、哲学的なベイズ主義のスタイルでベイズ統計の哲学について語るダメな人達の問題もあると思います。

続く
#統計 続き。「複数の仮説の真偽に関する事前の主観的信念の度合いがデータに基く信念の更新によって変わって行く」という見方をして良い場合もあるでしょうが、Gelman-Shalizi (2013)では実践的なベイズ統計の使い方とは全然違うことを指摘されています。続く

stat.columbia.edu/~gelman/resear…
の第1節を参照
Read 6 tweets
24 Dec
#統計 「尤度原理はBirnbaumによって証明されている」とか、「証明されていると〇〇さんが書いていた」の類のことを言っていた人について、あきれるのは、自分でその「証明」とやらを説明しようとせず(おそらく説明できない)、誰か偉い人に名前を出すだけですましていることです。続く
#統計 そのBirnbaumの「証明」とやらは、前提がアドホックである疑いや、正確に定式化すると穴があるという疑いを払い切れるものでなかったことは、歴史が証明しています。

すでに私はその証拠として、赤池弘次さんの論文とMayoさんのウェブサイトを紹介しています。
#統計 「尤度原理はBirnbaumによって証明されていると〇〇さんが書いていた」のように述べてしまった人は、その〇〇さんが証明の詳細をきちんと説明していたか、強い疑いがかけられて続けていることを正直に説明していたかを確認し、自分自身が騙されている可能性を疑うべきです。
Read 11 tweets
24 Dec
その問題には私も興味があるので、ツイッターで「周囲の人たち」をよく観察しているのですが、一般に数学的能力が高い人はアホなタイポが結構目立ちます。

研究者であるかどうかは無関係だと思います。

自戒するより、細かなノイズに強くなる方法を積極的に教えて行った方が生産的だと思う。
教える側が細かなミスを無くすことに膨大なリソースを割くのは非生産的で、みんなでノイズに強い思考法を身につけた方がお得。

細かなミスを無くすことに膨大なリソースが必要であることを理解していれば、細かな誤りの存在を親切に教えてくれる人のありがたみも深まる。
そして、ノイズに強い思考法の存在が常識化していれば、細かなミスを見つけたときにイライラしてしまう原因がノイズに弱い自分自身の思考法にあるのではないかと考えて成長できる余地が増えるかもしれない。
Read 5 tweets

Did Thread Reader help you today?

Support us! We are indie developers!


This site is made by just two indie developers on a laptop doing marketing, support and development! Read more about the story.

Become a Premium Member ($3/month or $30/year) and get exclusive features!

Become Premium

Too expensive? Make a small donation by buying us coffee ($5) or help with server cost ($10)

Donate via Paypal Become our Patreon

Thank you for your support!

Follow Us on Twitter!