#統計 以前にも述べたことですが、

ism.ac.jp/editsec/toukei…
情報量規準 AIC の統計科学に果たしてきた役割
小西 貞則
2019

の添付画像の部分はひどいです。

BICもあるKL情報量(+モデルによらない定数)の(大胆な)推定値になっていることを小西さんは理解していないっぽい。

リンクに続く
#統計 続き

以前に述べていたことは以下のリンク先すれっどにある。

BICは対数周辺尤度の-2倍の大胆な近似とみなされ、対数周辺尤度の-1倍の標本の確率的揺らぎに関する期待値は

 あるKL情報量+モデルによらないある定数

に一致している。

渡辺澄夫『ベイズ統計の理論と方法』を参照。
#統計 渡辺澄夫『ベイズ統計の理論と方法』のようなよく普及している教科書レベルの内容を理解していれば、【納得いきます】とは言ってはいけない案件。

その本に書いてあるように、BICの近似先の対数周辺尤度の-2倍は2KL情報量+定数の推定値だとみなされるので、情報量規準という呼び方は自然。
#統計 「対数周辺尤度の期待値」という発想をできるかどうかが分かれ目になる。

その発想から自然にKL情報量+定数が出て来る。

順番に説明すれば大学1年生でも理解できそうな非常に易しい話。

対数周辺尤度のLaplace近似についても説明できればBICは簡単に出て来る。
#統計 「主義に基く統計学」に頭が染まっていると「対数周辺尤度の期待値」を考えることが阻害されそう。

難易度的に大学1年レベルの話題でこういうことになってしまうのは多分そういうことなのだと思う。

「ベイズ主義では真の分布を考えない」のようなことを平気で言えてしまう人達は要注意。
#統計 続き。主義に基く統計学に気を使うことが大事なことであるかのように振る舞うことは、ひどく不合理に見える。

2つ上のツイートで危惧していたことが現実の問題であることが示された。
#統計 現代のP値の正しい使い方に関する専門的な議論は、ネイマン=ピアソンだとかフィッシャーの名前と「頻度論」「頻度主義」というような用語を出す議論からかなり遠く離れています。

そういう意味でも「頻度論」「頻度主義」という用語を使うときには要注意。

以下のスレッドを参照。
#統計 BICは対数周辺尤度の-2倍の大雑把な近似になっています。だから本質的に周辺尤度を見ていることになる。

周辺尤度も尤度なのでデータとモデル(事前分布を含む)の適合度の指標の1つとみなせる。

データとモデルがよくフィットしていても、それがオーバーフィッティングである危険性が常にある。
#統計 だから、尤度をモデル選択のための指標として使う場合にはオーバーフィッティングの問題に配慮する必要がある。

特にパラメータを尤度最大化(周辺尤度最大化を含む)で調節している場合には、パラメータ数を大きくするとオーバーフィッティングが起こり易い。続く
#統計 最尤法の予測分布の尤度をオーバーフィッティングのし易さで補正したものが、AIC(赤池情報量規準)。

ベイズ法で周辺尤度最大化で(ハイパー)パラメータを調節した場合に同様のことを行った結果がABIC。

ABICは(ハイパー)パラメータ数が0のとき、対数周辺尤度の-2倍になり、BICで近似される。
#統計 尤度は周辺尤度も含めて、モデルのデータの数値との適合度もしくは相性の良さの指標の1つに過ぎません。

尤度や周辺尤度が高い方が良いという考え方をしてはいけない。

こういう基本的な事柄と主義に基く統計学の相性は非常に悪いのです。
#統計 主義にこだわるダメなベイズの人は「周辺尤度最大化でハイパーパラメータを調節する経験ベイズは尤度原理を破るので使用禁止」のような滑稽なことを述べて、からかわれているようです。続く
#統計 しかし、赤池弘次さん達の仕事によって、オーバーフィッティングの可能性に配慮していれば、周辺尤度最大化によるパラメータの調節も現実における複雑な現象の統計分析法として有用であることがわかっています。

こういう歴史があるので、主義にこだわるのは滑稽だとわかっているわけです。
#統計 オーバーフィッティングに配慮したモデル選択のための適切な指標を用意しておけば、周辺尤度最大化による(ハイパー)パラメータの調節も役に立つことについては、小西さんの解説では以下の添付画像の部分にあります。

ism.ac.jp/editsec/toukei…
普通は、ピュア~な主義に殉じるために有用で優れた方法を捨て去りたいとは普通思わないので、普通に説明するときには、主義の話はする必要がないと思います。

主義の話は「主義に取り込まれないようにしようね!」という形式で別にするのが良いと思います。
#統計 小西さんの論説にはそういう尖った解説を期待していたのですが、BICの説明の部分で無用に「軟化」した態度になっているのを見て、がっかりしてしまいました。

そのせいで、BICもKL情報量+定数の(かなり大雑把な)推定値であるという一般読者にとって重要な情報が抜け落ちてしまっている。
#統計 赤池さんのAICやABICに関する仕事は、我々が知りたいことは「モデルとデータの数値の相性の良さ」そのものではないという点を明確化することに成功しました。

統計学ユーザーは、データの数値の背後に隠された大事な何かについて知りたいので統計学を使っています。
#統計 主義に基く統計学に取り込まれると、我々が本当に知りたいこととは別の「モデルとデータの数値の相性の良さ」に特別な価値があるかのように誤解することになり易いと思う。

その辺については以下のリンク先の解説を参照。

watanabe-www.math.dis.titech.ac.jp/users/swatanab…
小さな世界と大きな世界
渡辺澄夫

続く
#統計 続き

watanabe-www.math.dis.titech.ac.jp/users/swatanab…
「主義」を心配するみなさまへ
渡辺澄夫

「真の分布」の部分は「データの数値の背後に隠された大事な何か」に一般化した方が受け入れやすい説明になると思います。
#統計 例えば、薬Xとプラセボをそれぞれ与えたm人とn人がどれだけ重症になったかに関するデータがあったときに、我々が真に知りたいことは、そのデータの数値そのものではなく、薬Xには実際にどれだけ効き目があるかについてです。

データは偏っているだろうし、モデルも間違っているだろう。
多分その話は私によるこのスレッドへの反応です。

仮にそうならその話の解説を書いたのは私が先。

文脈を明瞭化するためにリンクをはってくれればうれしかった。

文脈を明瞭化することが都合が悪いと思ったのかな、とも思いました。
#統計 ポイントを再度説明

①対数周辺尤度の-1倍の標本の確率的揺らぎに関する期待値はちょうどKL情報量+定数の形になる。

②対数周辺尤度の漸近挙動から、対数周辺尤度の実現値はその期待値のそう悪くない近似になることもわかる。

③対数周辺尤度の-2倍のLaplace近似でBICが得られる。

続く
#統計 続き

④以上によって、BICは

 サイズ0の標本から得られる
 サイズnの標本のモデル内予測分布の
 予測誤差+モデルによらない定数の点推定値の近似値

とみなされる。ただし予測誤差はKL情報量で測る。
#統計 BICは周辺尤度にLaplace近似を適用できる場合にしか使えない。モデルが正則である必要がある。WBICならモデルが正則でなくても使える。
#統計 AICやWAICは

 サイズnの標本から得られる予測分布の
 予測誤差の期待値+モデルによらない定数の点推定値

とみなされる。期待値はサイズnの標本の確率的揺らぎに関する期待値。予測誤差はKL情報量で測る。

期待値を取る前の予測誤差そのものとAICやWAICは逆相関しているので要注意。
#統計 この手の話題は、簡単な場合の具体的計算例を最初に見るようにしないと何も理解できないので要注意。

nbviewer.org/gist/genkuroki… には最もシンプルなベルヌイ分布モデルの場合のAIC, BIC, WAIC, LOOCV, 対数周辺尤度, WBICの計算例の詳細がある。
#統計 横軸は確率の大きさに比例するようにスケールしてある。確率スケールにしないと印象が全然違うグラフが得られるので注意!

以下のグラフを見れば、予測分布の予測誤差とAIC, WAIC, LOOCVが綺麗に逆相関していることがわかります。

この逆相関は普遍的に成立。

nbviewer.org/gist/genkuroki…

• • •

Missing some Tweet in this thread? You can try to force a refresh
 

Keep Current with 黒木玄 Gen Kuroki

黒木玄 Gen Kuroki Profile picture

Stay in touch and get notified when new unrolls are available from this author!

Read all threads

This Thread may be Removed Anytime!

PDF

Twitter may remove this content at anytime! Save it as PDF for later use!

Try unrolling a thread yourself!

how to unroll video
  1. Follow @ThreadReaderApp to mention us!

  2. From a Twitter thread mention us with a keyword "unroll"
@threadreaderapp unroll

Practice here first or read more on our help page!

More from @genkuroki

Sep 30
この発言はひどいので、きくちさんにすみやかに謝罪して、撤回するべき。

勘違いして擁護していた側が批判側に回ること自体が結構大きめの貢献になる場合は結構多いので、意見を変えることを躊躇する必要はないと思いました。
【僕にもバイアスはありますが、それでファクトチェックが不当に歪まないように〜自分を日々チェックしてます。】

これを信用してもらうためには、

HPVワクチンについての朝日新聞の報道については徹底的にファクトチェックする

と言う必要があります。これを言えないようだとアウト。
参考資料

JFCファクトチェックガイドライン

docs.google.com/document/d/1lX…
Read 25 tweets
Sep 29
#Julia言語 以下のリンク先と同じことをやってみたい人のための解説

①まず、 julialang.org/downloads/ からCurrent stable releaseで自分のパソコンに合っているものをダウンロードし、自分のパソコンにインストールする。

②インストールしたJuliaを起動する。

添付画像はnightly build。続く
#Julia言語

③添付画像1のように julia> プロンプトに

using Plots

と入力してエンターキーを押します。

そして添付画像2のように y と入力しエンターキーを押します。

すると添付画像3,4のようにPlots.jlパッケージがインストールされます。
#Julia言語

github.com/genkuroki/publ… にアクセスし、そこの In[1] のusing Plots以外の部分を、julia> プロンプトの側にコピー&ペーストして下さい。

そして、最終行の確定のためにエンターキーも押しておく。

そしてしばらく待ちます。
Read 15 tweets
Sep 29
#統計 「信頼区間」のような入門的な統計学用語を定期的にツイッターで検索しているのだが、

❌P値の使用はやめるべき



❌P値ではなく信頼区間を使うべき

がワンセットになっている誤解をよく見る。

⭕️95%信頼区間の各点には5%以上のP値達が乗っている

というイメージが見えていないらしい。
#統計 95%信頼区間は「P値が5%以上になるパラメータ値全体の集合」なので、本質的に

❌P値を使わずに、信頼区間を使うこと

は不可能です。

信頼区間に含まれるパラメータ値達の立場は同等ではなく、それぞれにP値というデータの数値とモデル+パラメータ値の相性の良さの指標が対応しています。
#統計 95%信頼区間の両端の点に対応しているP値は5%で、一般に100(1-α)%信頼区間の両端の点に対応してP値はαになります。

αを動かして、さまざまな幅の信頼区間を計算すれば、パラメータ値にどのようなP値が対応しているかがわかる、のように考えることができます。
Read 19 tweets
Sep 28
#統計 以下のリンク先で引用されている jakevdp.github.io/blog/2014/06/1… のExample 2: Jaynes' Truncated Exponential の内容がひどかったので、Jaynes(1976) bayes.wustl.edu/etj/articles/c… の関連箇所を見たらもっとひどかったので、ひどさが分かるようにノートを作りました。

github.com/genkuroki/publ…
#統計 Jaynes(1976) bayes.wustl.edu/etj/articles/c… (doi.org/10.1007/978-94…)のpp.196-198がびっくりするぐらい酷い。

__不適切な__信頼区間の構成法と平坦事前分布のベイズ信用区間を比較して、信頼区間を強くdisり、さらにp.198辺りでそのことについて講演したときの様子を偉そうに説明している。 ImageImageImage
#統計 統計学の内容以前に人間性が疑わしく思えて来そうなほど偉そうに書いている。

私には、単にJaynesさんは切断指数分布モデル(truncated exponential distribution model)の場合に、適切な信頼区間の構成法を見付けることができなかっただけに見えました。

github.com/genkuroki/publ…
Read 17 tweets
Mar 15
#統計 n回中k回奇数の目が出たというデータが得られたとき、

pᵏ(1-p)ⁿ⁻ᵏ

を最大化するpの値k/nを奇数の目が出る確率の推定値とするのが、二項分布モデルでの最尤法に一致します。

その最尤法では、n回中k回奇数の目が出たら、奇数の目が出る確率はk/nだと推定される。非常に安易!続く
#統計 データからの最も安易な推定法は、シンプルなモデルを使った最尤法に一致することが多いです。

上の例では、3回中3回とも奇数の目が出ると、奇数の目が出る確率は3/3=1だと推定される。

この推定結果は真実を意味するわけでも何でもなくて、特定の方法による単なる推定結果に過ぎません。
#統計 最尤法については、入門的な教科書の多くに妙な説明がよく書いてあります。

東大出版会の『統計学入門』は最尤法に限らず統計学における基本概念についてことごとくミスリーディングな説明をしているのに、標準的教科書の地位を占めてしまった。

これが高等教育の現実で結構厳しい。
Read 17 tweets
Mar 15
#統計

データと統計モデルが与えられたときに、モデルのパラメータ値にP値を対応させる函数をP値函数と呼びます。

P値函数全体の情報は尤度函数全体の情報に近似的に等しくなる場合が多い。

その場合には、P値函数が最大になるパラメータ値は最尤法による点推定の結果に近似的に等しくなる。続く
#統計 さらに、尤度函数全体の情報はベイズ統計での事後分布の情報にも近い。(事前分布の違いしかない(笑))

このように、Rothmanさん達の疫学の有名教科書がすすめているP値函数全体を使うという考え方は、尤度函数全体の様子を見ることとの関係を通して、ベイズ統計と地続きで繋がっています。
#統計 データと統計モデルから決まる

 P値函数、尤度函数、事後分布の3つ

はほぼ同じような使い方をできる統計量になっています。

こういう理解の仕方ができれば、「主義が違う別の統計学がある」という有害な言説に騙されることなく、柔軟に統計学的ツールを使いこなし易くなると思われます。
Read 6 tweets

Did Thread Reader help you today?

Support us! We are indie developers!


This site is made by just two indie developers on a laptop doing marketing, support and development! Read more about the story.

Become a Premium Member ($3/month or $30/year) and get exclusive features!

Become Premium

Don't want to be a Premium member but still want to support us?

Make a small donation by buying us coffee ($5) or help with server cost ($10)

Donate via Paypal

Or Donate anonymously using crypto!

Ethereum

0xfe58350B80634f60Fa6Dc149a72b4DFbc17D341E copy

Bitcoin

3ATGMxNzCUFzxpMCHL5sWSt4DVtS8UqXpi copy

Thank you for your support!

Follow Us on Twitter!

:(