#統計 あと、小杉考司さんの添付画像のツイートが見えたので、クリックしてチラ見したら、

【2.「主観確率」「意思決定論」によるベイズ解釈は役に立つのか ⇒ 役に立つ/立たないでなく、それが前提である。】

と書いてあって、そっと閉じた。

確かに「ほんとうにわかりやすい」🤣
#統計 さらに

【3.ベイズ統計学において「パラメータは確率変数、データは定数」という説明は正しいか ⇒ 主義による。しかしながら、特に説明をおかないのであるば、メジャーである主観ベイズ主義で解釈すべきであろうから、この説明は正しいとすべき。】

とも書いてあった。

確かに「良記事」🤣
#統計

主義による
↓しかし
特に説明をおかないのであるば、
メジャーである主観ベイズ主義で解釈すべきであろう
↓ゆえに
この説明は正しいとすべき

こういう代物を「良記事」と紹介できる程度に恥知らずだと、議論では「無敵」だよね。

検索すれば小杉考司さんが書いた杜撰な解説も見つかります。
#統計 正確に引用するだけで、

「(笑)これってネタ?」
「いいえマジみたいです」
「(笑)」「(笑)」

となるような代物を「良記事」とみなして、ツイッターで拡散しちゃうような人が日本語圏の心理統計においてベイズ統計の宣伝を行なっていたというのはかなり不幸なことだよね。
#統計 【「渡辺ベイズ解釈」】なる文字列も発見できるが、もちろん馬鹿げたことしか書かれていない。
#統計 日本語圏ではなく、英語圏での議論についてはMayoさんのウェブサイトが面白いです。

例えば、添付画像の

errorstatistics.com/2017/04/01/er-…

Gelman-Shaliziについては私のツイログ

twilog.org/genkuroki/sear…

も参照。
#統計 Gelmanさん達の有名かつ影響力に強い本

stat.columbia.edu/~gelman/book/
Bayesian Data Analysis
(非商用目的ならpdfをダウンロードできる)

で添付画像のように、渡辺澄夫『ベイズ統計の理論と方法』のメインディッシュであるWAICが紹介されています。
#統計 「8割おじさん」の西浦さん達の研究では、Gelmanさん達が開発しているStanが使われており、渡辺澄夫さんによる情報量規準WAICでモデルの比較を行おうとしています。
#統計 検索の都合でミュートしまくった状態でツイッターを使用しているのでよく分からないのですが、大昔のサヴェジさんが言っていたようなことを根拠に主観確率のベイズ主義が至高であるかのような発言をした人がいたとしたら、さすがに機械学習の技術が普及した現代においてはひどい時代錯誤です。
#統計 穏健に「事前分布は事前の主観的信念の表現だと思う必要は全然ないよね。そのような制限をつけた人達は単純に間違っていた。事前分布という道具をみんなで自由に使って行こうね」とどうして言えないかが不思議。

掛算順序問題に非常に似ている。
「掛算の式の順序はどちらでもいいよね。100年以上前から掛算順序が逆なら誤りだとしていたのは単純に間違っていた。これからは子供達に掛算の順序はどちらでもいいよと教えて行こうね」となれない人たちがいるという問題が掛算順序問題。
高等教育に従事している人達は、掛算順序問題に代表される算数教育の問題について、「自分達ならああいうことはしない」とはそう簡単に言えないと思う。結構みんな統計学を使っていますよね。
「大昔からそういうことになっている」とか「偉い人が書いた教科書にもそう書いてある」の類は正しいことの根拠にならないという教育を高等教育機関では徹底するべき。

ある程度以上難しい事柄については教えている側もひどい誤りを犯すことも謙虚に認めて、みんなで賢くなって行ければ良い。
結構みんな統計学を使っているようですが、「大昔からそういうことになっている」とか「偉い人が書いた教科書にもそう書いてある」の類を根拠に使っていたりする場合が多いのではないか?

根拠にならない根拠を挙げるのではなく、「本当は理解していない」と言えればスッキリする。
#統計 言うまでもない補足

AICやWAICの情報量規準やLOO-CVのような交差検証は、未知の真の分布に対する事後予測分布の汎化誤差(もしくはその期待値)の推定量です。

それらは「真の分布」を想定したときの各モデルごとのリスクの指標なわけです。

「真の分布」の想定も大事な基本の1つ。

• • •

Missing some Tweet in this thread? You can try to force a refresh
 

Keep Current with 黒木玄 Gen Kuroki

黒木玄 Gen Kuroki Profile picture

Stay in touch and get notified when new unrolls are available from this author!

Read all threads

This Thread may be Removed Anytime!

PDF

Twitter may remove this content at anytime! Save it as PDF for later use!

Try unrolling a thread yourself!

how to unroll video
  1. Follow @ThreadReaderApp to mention us!

  2. From a Twitter thread mention us with a keyword "unroll"
@threadreaderapp unroll

Practice here first or read more on our help page!

More from @genkuroki

20 Dec
#統計 渡辺澄夫さんを悪い意味での「形式的ベイズ統計」の解説者扱いする人が登場するという事件がありました。

そこでは美添泰人さんが書いた1994年の文献が引用されていたのですが、それは参照できていない。しかし、

yoshizoe-stat.jp/stat/reference…



yoshizoe-stat.jp/stat/textbook/…
ベイズ推論

を発見。 Image
#統計 おそらく、「13 ベイズ推論」 yoshizoe-stat.jp/stat/textbook/… は、ウェブサイト主の美添泰人さんが1989年に行った放送大学での講義のテキストからの抜粋だと思う。

これは読み易くて、内容的にひどいので、事情がよく分かる良い資料だと思いました。

キーワードである「主観確率」の扱いも杜撰。
#統計 別の資料

yoshizoe-stat.jp/stat/reference…

yoshizoe-stat.jp/stat/stat9602.…
ベイジアン統計学はいつでも有用か 「統計」1996年2月

添付画像はこれのp.5より。この批判は正当かもしれない。

しかし、批判している側も主観主義的ベイジアンの流儀の強制も意図しているなら問題ありすぎ。 Image
Read 23 tweets
20 Dec
【私自身も直方体の面積[ママ]は縦×横×高さでないとダメだと言う学年主任と組んだこともあります。来年以降そういった先生に当たっても困らないよう丸にしつつも順序を気にする先生もいるから気をつけろと伝えています。】

学年主任の側に「ごめんなさい」と言わせるべき。子の側に言うことじゃない。 Image
#超算数

(悪しき)掛算順序指導の定番の1つは「3×2ならウサギの耳が3本になっちゃう」の類です。

この教え方の狙いは子供に「あれ?」と思わせること。3がウサギの耳の本数じゃないことを子供が分かっていることを前提にしている。

数の意味ではなく、掛算順序を教える方法になっています。
#超算数 で、とある先生による調査によれば、子供が書く掛算順序と掛算使用のための絵を正しく描けることの間に関係はない。

ところが、その先生はそういう結果が得られたのに、掛算の意味=掛算の順序をもっとしっかり教え込まなければいけないと結論を出しています。

mnavidata.edu-c.pref.miyagi.jp/manage/wp-cont… Image
Read 8 tweets
19 Dec
面倒くさいが優先していて、全部正解していて、正解をバツにされても気にしない!我が道を行く!痛快で良い。

めっちゃ、数学が向いていそう。

将来が楽しみ。
「筆算でしましょう」という指示に従っていないからバツにするのが当然だと言っている人達がいてうんざり。

私なら、添付画像のように、プリントの側を訂正して、全部マルにします。

私のうちでは実際にこれに類することを当然やる。

宿題の算数プリントが提出前に「訂正」されたこともある(笑)
提出前に家庭内で「訂正」された算数プリントの採点はマルになっていたそうです。

ツイッター上ではひどい結果が目立っていますが、そういう良い先生もたくさんいると思います。
Read 5 tweets
18 Dec
#統計 反省

正直な話、以前は、単純な統計モデルであるベルヌイ分布モデルの教育的価値をものすごく過小評価していました。

その過小評価にもそれなりに理由があって、ベルヌイ分布モデルのベイズ統計には予測分布に事後分布の情報がほとんど伝わらないという教育用題材としての欠点があります。
#統計 一般に、事後分布の分散が大きいと、対応する予測分布もその分だけ広がったものになります。しかし、ベルヌイ分布モデルでは値が0, 1しかないので、そうなりようがない。

「事後分布がぼやけていると、予測もぼやける」というベイズ法の重要な特徴についてベルヌイ分布モデルだと説明不可能。
#統計 そういう理由で、ベルヌイ分布モデルはベイズ統計について説明するときの例として、教育的価値が余り高くないのではないかと、以前は思っていました。

しかし、実際にはそれは短慮に過ぎなかったのです。

反省。

でも、統計学は難しいのでこういうミスを犯すなと言われても正直言って無理。
Read 11 tweets
18 Dec
#Julia言語 私のちょっと古めのパソコンでも、Juliaならば

N = 10^4
シングルスレッド→ 0.174 sec
8スレッド並列→ 0.047 sec

でした。よくあるπのモンテカルロ計算では

N = 10^9
シングルスレッド→ 3.4 sec
8スレッド並列→ 0.8 sec

ソースコード↓
gist.github.com/genkuroki/7f4c… ImageImageImageImage
#Julia言語 大雑把に10^9回の単純なループに換算できる計算はすぐに終わってくれないと困る。
#Julia言語 Juliaを使っていると言語やパッケージの開発者達が気を使ってくれているおかげで大丈夫なのですが、「どのライブラリを使って計算するか」で計算速度が決まってしまう場合が結構あります。

πのモンテカルロ計算では擬似乱数発生器の質と速度が決定的に重要。選択に失敗するとはまる。
Read 7 tweets
18 Dec
#統計 リンク先スレッドでは仮説「表が出る確率は0.5以上」という仮説について「止め方の違い」を扱いました。

今度は、「表の出る確率の推定」について「止め方の違い」を扱ってみました。

gist.github.com/genkuroki/20c0…

Image
#統計 続き。最適な事前分布として Beta(a, a) の形のものを探しました。n=12, k=3の場合を扱う。真の分布での表の出る確率はq=0.005:0.005:1を動かした。

二項分布モデル(試行回数n=12を固定)の場合には、qを動かしたときの期待予測誤差の最大値を最も小さくするaの値は0.51だと計算できました。 Image
#統計 雑な計算なので、二項分布モデルの場合には、おそらく本当は a=1/2 のJeffreys事前分布を使うのがよいということなのだと思います。
Read 30 tweets

Did Thread Reader help you today?

Support us! We are indie developers!


This site is made by just two indie developers on a laptop doing marketing, support and development! Read more about the story.

Become a Premium Member ($3/month or $30/year) and get exclusive features!

Become Premium

Too expensive? Make a small donation by buying us coffee ($5) or help with server cost ($10)

Donate via Paypal Become our Patreon

Thank you for your support!

Follow Us on Twitter!