#統計 渡辺澄夫さんを悪い意味での「形式的ベイズ統計」の解説者扱いする人が登場するという事件がありました。

そこでは美添泰人さんが書いた1994年の文献が引用されていたのですが、それは参照できていない。しかし、

yoshizoe-stat.jp/stat/reference…



yoshizoe-stat.jp/stat/textbook/…
ベイズ推論

を発見。
#統計 おそらく、「13 ベイズ推論」 yoshizoe-stat.jp/stat/textbook/… は、ウェブサイト主の美添泰人さんが1989年に行った放送大学での講義のテキストからの抜粋だと思う。

これは読み易くて、内容的にひどいので、事情がよく分かる良い資料だと思いました。

キーワードである「主観確率」の扱いも杜撰。
#統計 別の資料

yoshizoe-stat.jp/stat/reference…

yoshizoe-stat.jp/stat/stat9602.…
ベイジアン統計学はいつでも有用か 「統計」1996年2月

添付画像はこれのp.5より。この批判は正当かもしれない。

しかし、批判している側も主観主義的ベイジアンの流儀の強制も意図しているなら問題ありすぎ。
#統計 「推測用のモデルの確率分布族+事前分布+データ→事後分布→事後分布の要約」という手続きだけで、何かまともな統計分析をしたつもりになるのは馬鹿げています。

しかし、複雑なモデルを採用して事前分布をテキトーに取ったという理由だけで、まともでないとは言えません。
#統計

yoshizoe-stat.jp/stat/stat9602.…
ベイジアン統計学はいつでも有用か 「統計」1996年2月

のp.2より。典型的な主観確率に基くベイズ主義者の言い分。

仮に各個人の合理的な行動の結果として主観確率がwell-definedに確定すると認めても、推測が当たるか外れるかという重大な問題は扱えません。続く
#統計 ある人が、適当なギャンブルの設定によって適切に計測した自分自身の真の効用に基く主観確率によって事前分布を決定し、自分自身にとってベストの推測用モデルの確率分布族を用意し、データに基くベイズ更新によって事後分布を求めたとします。

問題:その人はそれだけで常に合理的か?

続く
#統計 「合理性」を「自分自身の主観的効用に基いて最良の行動を取ること」と定義したならば、「その人はそれだけで常に合理的か?」という問いへの答えはYesです。

Savageさんなどの名前を持ち出しがちな、主観確率のベイズ主義者にとってにベイズ統計の合理性はそういう意味になってしまいます!
#統計 そういう主観主義ベイジアンの態度を否定している論文 Gelman-Shalizi (2013) stat.columbia.edu/~gelman/resear… は何が問題なのかが分かりやすくなる引用(脚注34)をしてくれています。

【我々はすでに合理的なのに、どうして真理への収束というもう1つの規準について心配する必要があるのかね?】ひどい
#統計 自分自身にとっての最良の知識と情報をもとに、自分自身が本当に信じている事前の主観確率と、自分自身が最良だと信じているモデルの確率分布族と、実際に得られたデータから、ベイズの定理を使って正しく計算された事後分布による判断はすでに十分合理的なので、別の規準は無用である、と。😱
#統計 そういう意味での「合理性」を外で振り回されても迷惑なだけ。

普通の常識的な合理性はもっと穏健なものです。

事前分布を自分の事前の主観的信念の忠実な表現とすること自体は、まともな統計分析をできるかどうかと無関係であると、謙虚に考えられる人だけが通常の意味で合理的な人です。
#統計 仮に主観確率の概念が正当化されて、それで事前分布を決めても、まともな統計分析をできるかどうかとは無関係。

これを知っていれば、「サヴェジによれば云々」と言って来る人達がどれだけ考えの足りない人達であるかが明瞭になります。
#統計 実際には、赤池弘次さんなども指摘しているように、Savageさんが主観確率の正当化に用いている前提自体がアドホック

ismrepo.ism.ac.jp/index.php?acti…
の第7節

バケツの底が抜けている上に、仮にバケツの底を修理しても、まともな統計分析をできるかどうかとは無関係の話をしているだけなのです。
#統計 以上のような予備知識のもとで

Gelman-Shalizi (2013)
Philosophy and the practice of Bayesian statistics
stat.columbia.edu/~gelman/resear…

を読めば、この論文の著者達が主観確率のベイズ主義の哲学を全否定せざるを得なかった理由がよくわかると思います。

詭弁潰しのために必要な訳です。
#統計 GelmanさんやShaliziさん以外のベイジアンがどのようにおかしなことを言っているかについては、Mayoさんのウェブサイトの

errorstatistics.com/2017/04/01/er-…

がとても面白いです。GelmanさんとShaliziさんは添付画像のように言っている。

真っ当なことを言っている人達の苦労がよくわかる感じ。
#統計 論文のGelman-Shalizi (2013)ではそれほど直接的にひどい表現はしていなかったと思うのですが、Gelmanさんは「標準的な主観主義的ベイジアンのやり方は統計学を傷つけてきた」と言ったらしい。Shaliziさんも「ベイズ統計の標準的な哲学の大部分が間違っている」と。

非常にごもっとも。
#統計 知らない人のために補足しておくと、Gelmanさんは

stat.columbia.edu/~gelman/book/
Bayesian Data Analysis

というベイズ統計の有名な教科書の著者の一人で、Stan開発者の一人でもあります。上の教科書はPDFを誰でもダウンロードできます。

「8割おじさん」の西浦博さん達もStanを使っています。
#統計 Stanを使っている人達は、その開発者の1人でベイズ統計の有名な教科書の筆者が2010年(preprint)に、標準的な主観主義ベイジアンの考え方を否定する論文を書いており、その後も否定する発言を続けていることを思い出しながら、ベイズ統計教育をどうするべきかについて考えるとよいと思います。
#統計 私が思うに、穏健な謙虚な合理性を兼ね備えた人が統計学に求めていることは、

 自分自身のベストの判断を否定してくれる可能性のある道具

を用意してくれることだと思います。
#統計 自分自身の能力的にベストの主観確率に基く事前分布から得られる事後分布が、単峰型で非常に狭い範囲にしか分布が広がっていないときに、どう思うかが問題。

穏健で謙虚な合理性を持っていれば「自分自身によるモデル(事前分布を含む)の設定は大外ししているかもしれない」と心配できる。続く
#統計 しかし、「自分自身のベストの統計分析の結果で、しかも事後分布がいい感じに収束しているのだから、これで十分に合理的である」などと言える余地が残っていて、それに誘惑されてしまうとダークサイドに取り込まれる。

事後分布だけを見ても自分が妥当な統計分析をできているかは分からない。
#統計 日本語圏では、心理統計の人たちの中に、主観主義ベイジアンの問題のある考え方を広めている人達が目立つ。例の『瀕死本』の豊田秀樹さんが代表例。

騙されないように要注意。

事後分布で計算した「仮説が正しい確率」を真面目に受け取るとトンデモさんになってしまう。続く
#統計 困りもののベイズ主義宣伝者達は「ベイズ統計なら仮説が正しい確率が得られるので分かり易い」などとトンデモないことを平気で言って恥じません。

実際には、事後分布がどのような意味で的を射ているか、いないかは非自明な難しい問題です。(「仮説が正しい確率」は事後分布で計算される。)
#統計 「事後分布を見ただけでは、まともに統計分析できたかどうかどうかは分からない」とはっきり教わった人だけが、トンデモさんでない人にベイズ統計を教わったことになると思います。

• • •

Missing some Tweet in this thread? You can try to force a refresh
 

Keep Current with 黒木玄 Gen Kuroki

黒木玄 Gen Kuroki Profile picture

Stay in touch and get notified when new unrolls are available from this author!

Read all threads

This Thread may be Removed Anytime!

PDF

Twitter may remove this content at anytime! Save it as PDF for later use!

Try unrolling a thread yourself!

how to unroll video
  1. Follow @ThreadReaderApp to mention us!

  2. From a Twitter thread mention us with a keyword "unroll"
@threadreaderapp unroll

Practice here first or read more on our help page!

More from @genkuroki

20 Dec
【私自身も直方体の面積[ママ]は縦×横×高さでないとダメだと言う学年主任と組んだこともあります。来年以降そういった先生に当たっても困らないよう丸にしつつも順序を気にする先生もいるから気をつけろと伝えています。】

学年主任の側に「ごめんなさい」と言わせるべき。子の側に言うことじゃない。
#超算数

(悪しき)掛算順序指導の定番の1つは「3×2ならウサギの耳が3本になっちゃう」の類です。

この教え方の狙いは子供に「あれ?」と思わせること。3がウサギの耳の本数じゃないことを子供が分かっていることを前提にしている。

数の意味ではなく、掛算順序を教える方法になっています。
#超算数 で、とある先生による調査によれば、子供が書く掛算順序と掛算使用のための絵を正しく描けることの間に関係はない。

ところが、その先生はそういう結果が得られたのに、掛算の意味=掛算の順序をもっとしっかり教え込まなければいけないと結論を出しています。

mnavidata.edu-c.pref.miyagi.jp/manage/wp-cont…
Read 8 tweets
19 Dec
#統計 あと、小杉考司さんの添付画像のツイートが見えたので、クリックしてチラ見したら、

【2.「主観確率」「意思決定論」によるベイズ解釈は役に立つのか ⇒ 役に立つ/立たないでなく、それが前提である。】

と書いてあって、そっと閉じた。

確かに「ほんとうにわかりやすい」🤣
#統計 さらに

【3.ベイズ統計学において「パラメータは確率変数、データは定数」という説明は正しいか ⇒ 主義による。しかしながら、特に説明をおかないのであるば、メジャーである主観ベイズ主義で解釈すべきであろうから、この説明は正しいとすべき。】

とも書いてあった。

確かに「良記事」🤣
#統計

主義による
↓しかし
特に説明をおかないのであるば、
メジャーである主観ベイズ主義で解釈すべきであろう
↓ゆえに
この説明は正しいとすべき

こういう代物を「良記事」と紹介できる程度に恥知らずだと、議論では「無敵」だよね。

検索すれば小杉考司さんが書いた杜撰な解説も見つかります。
Read 15 tweets
19 Dec
面倒くさいが優先していて、全部正解していて、正解をバツにされても気にしない!我が道を行く!痛快で良い。

めっちゃ、数学が向いていそう。

将来が楽しみ。
「筆算でしましょう」という指示に従っていないからバツにするのが当然だと言っている人達がいてうんざり。

私なら、添付画像のように、プリントの側を訂正して、全部マルにします。

私のうちでは実際にこれに類することを当然やる。

宿題の算数プリントが提出前に「訂正」されたこともある(笑)
提出前に家庭内で「訂正」された算数プリントの採点はマルになっていたそうです。

ツイッター上ではひどい結果が目立っていますが、そういう良い先生もたくさんいると思います。
Read 5 tweets
18 Dec
#統計 反省

正直な話、以前は、単純な統計モデルであるベルヌイ分布モデルの教育的価値をものすごく過小評価していました。

その過小評価にもそれなりに理由があって、ベルヌイ分布モデルのベイズ統計には予測分布に事後分布の情報がほとんど伝わらないという教育用題材としての欠点があります。
#統計 一般に、事後分布の分散が大きいと、対応する予測分布もその分だけ広がったものになります。しかし、ベルヌイ分布モデルでは値が0, 1しかないので、そうなりようがない。

「事後分布がぼやけていると、予測もぼやける」というベイズ法の重要な特徴についてベルヌイ分布モデルだと説明不可能。
#統計 そういう理由で、ベルヌイ分布モデルはベイズ統計について説明するときの例として、教育的価値が余り高くないのではないかと、以前は思っていました。

しかし、実際にはそれは短慮に過ぎなかったのです。

反省。

でも、統計学は難しいのでこういうミスを犯すなと言われても正直言って無理。
Read 11 tweets
18 Dec
#Julia言語 私のちょっと古めのパソコンでも、Juliaならば

N = 10^4
シングルスレッド→ 0.174 sec
8スレッド並列→ 0.047 sec

でした。よくあるπのモンテカルロ計算では

N = 10^9
シングルスレッド→ 3.4 sec
8スレッド並列→ 0.8 sec

ソースコード↓
gist.github.com/genkuroki/7f4c… ImageImageImageImage
#Julia言語 大雑把に10^9回の単純なループに換算できる計算はすぐに終わってくれないと困る。
#Julia言語 Juliaを使っていると言語やパッケージの開発者達が気を使ってくれているおかげで大丈夫なのですが、「どのライブラリを使って計算するか」で計算速度が決まってしまう場合が結構あります。

πのモンテカルロ計算では擬似乱数発生器の質と速度が決定的に重要。選択に失敗するとはまる。
Read 7 tweets
18 Dec
#統計 リンク先スレッドでは仮説「表が出る確率は0.5以上」という仮説について「止め方の違い」を扱いました。

今度は、「表の出る確率の推定」について「止め方の違い」を扱ってみました。

gist.github.com/genkuroki/20c0…

Image
#統計 続き。最適な事前分布として Beta(a, a) の形のものを探しました。n=12, k=3の場合を扱う。真の分布での表の出る確率はq=0.005:0.005:1を動かした。

二項分布モデル(試行回数n=12を固定)の場合には、qを動かしたときの期待予測誤差の最大値を最も小さくするaの値は0.51だと計算できました。 Image
#統計 雑な計算なので、二項分布モデルの場合には、おそらく本当は a=1/2 のJeffreys事前分布を使うのがよいということなのだと思います。
Read 30 tweets

Did Thread Reader help you today?

Support us! We are indie developers!


This site is made by just two indie developers on a laptop doing marketing, support and development! Read more about the story.

Become a Premium Member ($3/month or $30/year) and get exclusive features!

Become Premium

Too expensive? Make a small donation by buying us coffee ($5) or help with server cost ($10)

Donate via Paypal Become our Patreon

Thank you for your support!

Follow Us on Twitter!