【こわい人たちの議論に巻き込まないで🥲】←有害なトンデモ本の宣伝をしながら、こういうことを平気で言う?怖い😰

【P値の不適切解釈】については豊田『瀕死本』以外の文献にも書いてあります。

『瀕死本』がトンデモ本なのはP値の代わりに【仮説が正しい確率】の使用を勧めているからです。続く
豊田『瀕死本』ではP値ではなく【仮説が正しい確率】を使うことを勧めているのですが、【仮説が正しい確率】の具体例を見ると漸近的にP値と一致している数値になっていたりするので、この本は実質的にP値ではなくP値を使うことを勧めていることになっています(笑)。続く
例えば豊田『瀕死本』の図5.2, 5.3のphc=「仮説が正しい確率」はそれぞれに対応するP値にほぼぴったり一致しています。

添付画像のグラフとソースコード nbviewer.jupyter.org/gist/genkuroki… を見て下さい。

この一致は偶然ではなく、一般的に成立しています。
豊田『瀕死本』が有害なトンデモ本であることを見抜くことができない人が『統計学を哲学する』も面白い本だと感じていることはとても印象的です。

「仮説が正しい確率」と言われてもトンデモ感を何も感じない人は『統計学を哲学する』における統計学の杜撰な解説にも違和感を感じないかもしれない。
例えば、『統計学を哲学する』p.17には添付画像のように書いてあります。楕円の長軸と回帰直線が異なることは入門的な話題の一つです。

分布を特徴付ける値をその期待値と呼んでいたりもする。(p.31)

そもそも統計学は【お墨付き】を得るための【特権的な機能】(p.1)を持っていません。
豊田『瀕死本』について補足。

豊田『瀕死本』における「仮説が正しい確率」は漸近的に対応するP値に一致しているので、実質的にP値の使用を勧めている本になっています(笑)。

そのような解釈のもとでは、ゴールを厳しめにずらすことによって不正をやりにくくすることを提案しているとみなせます。
P値と事後分布の関係を理解していれば、どちらを使っても結果は同じで、ゴールを厳しめにずらすことはどちらの道具を使っても可能です。

『瀕死本』のベイズ云々や尤度原理云々は単なるトンデモで完全に無視できます。そして、そういう無視を実行されちゃうと『瀕死本』の存在価値は無くなる。
P値を使った不正行為と同様の方法で、ベイズ統計における事後分布で測った確率を使っても不正行為が可能です。

P値ではなく、ベイズ統計を使えば「尤度原理」によって不正行為が許されるかのように語っている点は豊田『瀕死本』の最も有害な部分だと思います。

研究不正の勧めはシャレにならない。
『統計学を哲学する』については、その良いところを褒めつつ、統計学の解説部分がひどく杜撰であることも正直に指摘している書評は出てき難いだろうと予想していました。

その予想は現時点では完璧に当たっている。

これは何を意味しているんでしょうかね?

怖い、怖い、本当に怖い😰
豊田『瀕死本』と『統計学を哲学する』の読者層は近いと思う。

『瀕死本』をトンデモ本だと見抜けない人は、『統計学を哲学する』にある統計学の解説におかしな部分があることにも気付かないでしょう。そういうレベルの人達がその本で統計学で【お墨付き】が得られる理由を学ぶわけ。怖すぎ。
豊田『瀕死本』での「仮説が正しい確率」が対応するP値にほぼぴったり一致していることを見抜くには、P値について統計学入門を超えた理解が必要になります。

だから、統計学入門しか終えていない人がトンデモを見抜けないことはよく理解できる。
しかし、統計学入門で単なる「やり方」ではなく、各概念についてどのように定義されるべきものなのかまできちんと理解してしまっていれば、入門レベルの知識+理解に基く自力での一般化で、トンデモを見抜くことができます。

しかし、統計学入門は「やり方」重視で行われがちだと思う。
#統計 AICは、1000人分のデータを使って作った予測分布による未知の1001人目のデータの予測を問題にするのに、毎年1000人分のデータを集める話をするのは「まことに奇妙」と言わざるを得ない。

この本を読む前にAICについて理解していないと気付けない問題。

添付画像は『統計学を哲学する』より。
#統計 統計学そのものを未習だったり、数学が難しくて理解するの大変だと思っている人達が、『統計学を哲学する』のような本を読んで「当たりをつけようとすること」はやめた方が良いし、そうしようとしている人には統計学の解説部分がずさんであることを教えてあげる方が親切だと思います。
#統計 『統計学を哲学する』については、その良いところを褒めつつ、統計学の解説部分がひどく杜撰であることも正直に指摘している書評は出て来難いだろうという予測は大変な精度で当たっています。

もう1つの悲観的な予想はこれがその杜撰な部分を無視して哲学業界内部で高く評価されてしまうこと。
AIC (an information criterion(笑))については赤池さん本人により解説が名調子でわかり易いです。数学抜きで理解不可能な話になっていることにも注意。

jstage.jst.go.jp/article/butsur…
エントロピーとモデルの尤度
赤池弘次
1980

これを読めば対数尤度の概念の統計力学的な位置付けもわかります。
AICに関する解説を読むときに注意するべきことは、「AIC自身は予測の良さそのものを表して__いない__」という事実です。

実際、AICによる判断は微妙な場合に間違う確率が結構高い(ある場合には有意水準を十数パーセントにした感じになる)。

予測の良さそのものは汎化誤差(またはKL情報量)の方です。
AICを使うと、データが運悪く偏っているときに、予測分布の汎化誤差がひどく大きくなった側のモデルを選択することになり、そうなる確率はサンプルサイズ→∞の極限でも0になりません。

AIC系の情報量規準は「数学的にぎりぎりを攻めている規準」なので、使用時のリスクに気を配る必要があります。
精緻な数学的道具に関する杜撰なまとめによって「哲学的な教訓」を引き出す行為は、伝統的なトンデモの定番のパターンです。

AICについても伝統的なトンデモのパターンがこれから盛り上がるということなんですかね?すでに盛り上がっていたりする?

• • •

Missing some Tweet in this thread? You can try to force a refresh
 

Keep Current with 黒木玄 Gen Kuroki

黒木玄 Gen Kuroki Profile picture

Stay in touch and get notified when new unrolls are available from this author!

Read all threads

This Thread may be Removed Anytime!

PDF

Twitter may remove this content at anytime! Save it as PDF for later use!

Try unrolling a thread yourself!

how to unroll video
  1. Follow @ThreadReaderApp to mention us!

  2. From a Twitter thread mention us with a keyword "unroll"
@threadreaderapp unroll

Practice here first or read more on our help page!

More from @genkuroki

20 Jan
#数楽

Xを[0,1]上の一様分布に従う確率変数とすると、その分配函数(モーメント母函数)は

Z(β) = E[exp(-βX)] = (exp(-β) - 1)/(-β).

これの逆数が β/(1 - e⁻ᵝ).

カノニカル分布の密度函数

p(x) = exp(-βx)/Z(β)

はBernoulli多項式の母函数。続く
#数楽 [0,1]上の一様分布をℝ上の適切な弱い条件を満たす任意の分布に一般化することによっても、Hurwitzのゼータ函数やBernoulli多項式を一般化できる。

正規分布の場合のBernoulli多項式の類似物はHermiteの多項式になり、正規分布に対応するHurwitz型ゼータ函数の特殊値として出て来る。
#数楽 というような話よりもずっと色々なことが

nbviewer.jupyter.org/github/genkuro…
Hurwitzのゼータ函数の話

に書いてあります。
Read 6 tweets
19 Jan
まさに数学教育の闇

kanielabo.org/edmath/thirdme…
RIMS研究集会 
教育数学の一側面-高等教育における数学の多様性と普遍性-
研究代表者:岡本和夫
副代表者:蟹江幸博
RIMS420号室,2018.2.13-2018.2.16

大島 利雄(城西大学)
大学における数学教育の問題点と工夫
kanielabo.org/edmath/thirdme…
全然、関係ない話題と繋げてしまうことになるが、上で引用した大島さんの文章は【妖怪について扱った文章であるにも関わらず具体的な妖怪の実例がほとんど皆無で抽象論に終始している】の類のものとは正反対。

ものすごく具体的!
私は大島さん的な文章が好きで、意味のある具体例がない抽象的な文章は有害だと考えている。

数学の研究者間では、抽象化・一般化はやろうと思えば幾らでもできるので、価値ある抽象化・一般化であることを示す具体的な例を示さないとダメだという非常に良い習慣があると思う。例がショボいとアウト。
Read 24 tweets
17 Jan
8割おじさんの西浦博さんの数学セミナー誌での連載を読んだときの印象は、「数学に強い人が、疫病が広がる様々なパターンで経験を積めば、沢山の人達を救える可能性が出て来る!面白い!」でした。

現代版ナイチンゲール!

世界中にいる西浦さんの仲間達の経験の蓄積が西浦さんの分析の背景にある。
そういう経験蓄積部分は単独のモデルを見ても絶対に分からない。

これ、普通に非常に面白い話なので、西浦博さんには面白い話を継続的に気持ちよくしてもらった方が、我々の次の世代を守るために役に立つと思います。

西浦さんに連載を依頼した数学セミナー誌はすごい。
少女時代のナイチンゲールさんに数学を教えたのは6歳年上のシルベスターさんや24歳年上のケトレーさんです(家庭教師)。

数学の知識はナイチンゲールさんの「闘争」で非常に役に立ちました。

wakara.co.jp/mathlog/202005…
Read 4 tweets
13 Jan
#Julia言語

Juliaでの最適化では、函数の定義で

function f(x::Float64)::Float64

end

のように「型指定」しても全然__速くならない__ことを理解しておく必要があります。

function f(x)

end

のままで最適化できることを知らずに、一所懸命「型指定」するのは時間の無駄。
#Julia言語 函数の引数の「型指定」をするのは、multiple dispatchを使うためです。例えば

function f(x)
広く通用するアルゴリズムのコード
end

と定義しておいて、Float64専用の同名の函数を

function f(x::Float64)::Float64
Float64に最適化されたコード
end

と定義するとよい。
#Julia言語 しかし、

function f(x)
広く通用するアルゴリズムのコード
end

の段階で十分高速なコードを書ける場合も多いです。

それを可能にするのが、型の伝搬を促すコードの書き方です。

Juliaでは「型指定」ではなく、「引数の型の伝搬」で考える。
Read 35 tweets
12 Jan
#数楽 そうなんです!ベータ函数や超幾何函数達は非常に面白い!高校で微積分を習っていればめっちゃ楽しめる。

B(p,q)=∫_0^1 x^{p-1}(1-x)^{q-1}dx

がよく使われるが、

B(p,q)=∫_0^∞ t^{p-1}/(1+t)^{p+q} dy

およびさらにt=u^{1/p}やt=u^2とおいた場合も応用上重要な点は盲点になり易い。 Image
#数楽

B(p,q)=∫_0^∞ t^{p-1}/(1+t)^{p+q} dy

型のベータ函数の表示で t を t²/ν で置き換えて、p=1/2, q=ν/2 とおけば、本質的に自由度 ν のt分布が得られます。

t分布は非常に基本的な確率分布なのですが、ベータ分布の特別な場合(p=1/2)の変種と思えます。F分布はp=1/2の特殊化をやめた場合。 Image
#数楽

B(p,q)=∫_0^∞ t^{p-1}/(1+t)^{p+q} dy

型のベータ函数の表示を知っていれば

Γ(p)Γ(q)=Γ(p+q)B(p,q)

を y = tx (yを直線の傾きtに変数変換)の形の積分変数変換で示せます。その計算の過程も面白いので知っておいて損がないです。

大学新入生向けの計算練習の題材としてもよい。 Image
Read 19 tweets
11 Jan
#Julia言語

Juliaでは

foo(f::函数, X::配列など)

の形式で、配列Xなど(generatorやiteratorを含む)のすべての要素に函数fを施した結果に "foo" の操作を施せる場合が多数あります。

例えばXの要素の絶対値の最大値と和はそれぞれ

maximum(abs, X)
sum(abs, X)

二乗和は

sum(x->x^2, X)
#Julia言語 二乗和は

X = randn(10^6)
sum(Base.Fix2(^, 2), X)
sum(abs2, X)

のようにも書ける。Fix2(f, a)は本質的に x->f(x, a) です。読み易さは x->f(x,a) の方が上のことが多い。

1.96より大きい要素の割合は

count(>(1.96), X)/length(X)

using Statistics
mean(>(1.96), X)
#Julia言語

Xのすべての要素に手続き f を施すには

foreach(f, X)

返り値はforループと同じnothingになります。

Xの要素に函数 f を作用させた結果を集めたものは f.(X) だけではなく

map(f, X)

で作れる。

これら以外にもmaximum, minimum, count, sum, mean, …も似た使用法が可能。
Read 15 tweets

Did Thread Reader help you today?

Support us! We are indie developers!


This site is made by just two indie developers on a laptop doing marketing, support and development! Read more about the story.

Become a Premium Member ($3/month or $30/year) and get exclusive features!

Become Premium

Too expensive? Make a small donation by buying us coffee ($5) or help with server cost ($10)

Donate via Paypal Become our Patreon

Thank you for your support!

Follow Us on Twitter!