大学生相手であっても、必要な数学の実力は結構高いので、統計学を教えるのに苦労しています。

高校生相手に検定が「お墨付きが得られる道具」であるかのように教えられてしまうようになったら最悪。

あと、信頼区間がモデル依存であることも(大学生と同様に)教えることにならないと思う。
現実には世界的にかなり悲惨なことになっていて、論文を日常的に書いている研究者であっても、統計的検定を「お墨付きが得られる道具」扱いしている人達が沢山いるんじゃないか?

そういう現状は若くて優れた研究者が育つことを妨害していると思う。

こういう問題を維持固定しないような教育が必要。
まだ高校生なのに、「統計的に有意である!」を水戸黄門的な「ひかえおろう!」と同じ意味で使うようになったら最悪(笑)
#統計 簡単な確率を計算できる能力抜きに、統計学を理解できるはずがない。

例えば、表と裏が等確率で出るコインを10回投げたとき、表の回数が2回以下になる確率を求められないなら完全にアウト。

高校で統計学を無理に教えずに、統計学を見据えた確率の話をしっかり教えた方がうまく行くと思う。
#統計

統計学をまともに(=無害な形で)理解するためには、ある程度以上の数学的実力が必須。

そして、実際の使い方を学ぶためには、数学以外の事柄に関するしっかりした教養が必要。

あと、大学生向けの統計学の教科書の内容も結構ひどい場合があることを理解できるレベルの人が教える必要がある。
#統計 たぶん、大学でもこれらの基準をクリアできている場合は稀だと思う。

そういう難しいミッションを安易に高校側に押し付けるのは良くないと思います。
これ、大学の先生でコメントした方が良い人達がツイッターにも結構いるんじゃないか?

直接制度設計に関わったことがない人であっても、大学で統計学の講義をする仕事もしたことがある人なら(多分苦労しているはず)、高校数学への統計の導入の仕方が強引すぎることのまずさは明らかだと思う。
#統計 コインの表と裏がそれぞれ1/2の確率で出て、さらに10回のコイン投げが独立になるという仮想的なモデルの中で確率を計算している、という理解の仕方ができないと、統計学の理解は出発点から非科学的でめちゃくちゃなものになっちゃうんだよね。

数学的モデルの中での確率計算になっている。
#統計 現実と無関係に、数学的モデルを考えることができることを納得するためには、まず数学的抽象化に耐える数学的実力が必要で、さらに科学的な常識も身に付けていないといけない。

多分、大学生向けの統計の講義でもこの辺を理解してもらうことはあんまりうまく行っていない。
#統計 検定におけるP値は、数学的モデルの中における確率の近似値の一種で、現実において起きる可能性が高いとか低いと言うときの確率ではない。

95%信頼区間の95%も同様で、数学的モデルの中における確率の近似値でしかない。モデルが現実で妥当でなければ95%という数値も現実において妥当ではない。
#統計 博士号を取った人であっても、「仮に現実でサンプルを何度も取り直して、95%信頼区間を繰り返し計算し直したならば、その中で真の値を含むものの割合は95%程度になる」と教科書通りに誤解していることがあります。

95%信頼区間の95%はモデル内における割合でしかないことを忘れている。
#統計 数学的モデル内部での値を計算しているだけなのに、その値を現実における値だと混同してしまうことは、モデルと現実の混同という典型的に非科学的な考え方をしているわけです。

博士号を取っていてもそういう非科学的な統計学(しかも初歩的な区間推定)の理解の仕方しかできていない場合がある。
#統計 多分、金銭が絡む仕事で統計学の技術を使った人なら、モデルと現実の混同はないと思う。

モデルを使った統計的な予測が結構外れることが分かっていても、その道具を使った方が仕事全体の効率を統計的に上げてくれる可能性がある。こういう使い方が実際には多いのではないか?
#統計 それに対して、P値や95%信頼区間の95%については誤解が非常に多い。

誤解が多くなる理由はP値や95%信頼区間を「お墨付きを得るための手段」だと思っているから。

モデル内数値に過ぎないもので「お墨付き」が得られるはずがないので、モデル内数値に過ぎないことを無視し易くなる。
#統計 多分、検定や信頼区間を「お墨付きを得るための手段」だと誤解している人は、統計モデリング(最尤法やベイズ法を使う)にまで「お墨付きを得る方法」を求めて、どこまで行ってもおかしな考え方から抜け出せないのではないか?

お墨付きを得るための手段はどこを探したってあるはずがないのに。
各分野固有の信頼できそうな知識を積み重ねて、再現性がありそうな主張をすることに集中するしかない。
#統計 現実の硬い金属製の精巧なコインで試すと、「表と裏の確率はそれぞれ1/2で、10回のコイン投げは独立」というモデルは極めて適切なモデルであることを確認できます。

サイコロでも同様のことをできる。

それらの場合は、数学的モデルの現実への適用が妥当な場合。

妥当性が不明の場合もある。
#統計 例えば、新型コロナの感染者の推移をあるモデルで予測する場合には、そのモデルの妥当性は大いに疑われるべきでしょう。

現実への統計学の応用ではその手のモデル自体の妥当性が不明な場合の方が多いと思う。
#統計 関連スレッド

accept, rejectという用語選択は不幸な失敗だった。(統計的検定でお墨付きが得られるという考え方は誤り)

フィッシャーさんとネイマン&ピアソンのピアソンさんによれば、統計的検定は「学習の手段」。

「統計的に有意!」は「ひかえおろう!」という意味ではない(笑)
#統計 新型コロナ関連の推定や予測という困難な仕事でなくても、モデルの妥当性について考えるべき場合は普通にあります。

例えば共通テストの得点の分布の分析では、統計学入門の教科書によくある「正規分布の仮定」は妥当ではありません。

現役生と浪人生では分布が違う。続く
#統計 続き。得点分布を平均と分散の値で代表することは、実質的に正規分布モデルで考えているのと同じです。

現役生と浪人生の特典分布が違っていることが分かっているのですから、単純な正規分布モデルをやめた方が生産的でしょう。

ct.u-tokyo.ac.jp/images/koudai-…

#統計 高校数学での統計の導入の強引な押し付けを批判するときには、それと同時に「統計学は面白いよ」とにおわせるような話も必要だと思ったので長々と書くことになりました。

批判する側も批判しながら統計学への理解を深めて行くとよいと思いました。
#統計 中1での確率の話は、某所でのケースでは、教科書本体には掲載されておらず、別の薄い冊子に5ページだけ載っていました。

ペットボトルを投げる話が書いてありますが、全部で5ページなので薄っぺらい内容。

さすがにこれで中1で確率について習ったという扱いは無理。

中2については知らない。
#統計 訂正

❌ペットボトルを投げる話
⭕️ペットボトルのフタを投げる話

• • •

Missing some Tweet in this thread? You can try to force a refresh
 

Keep Current with 黒木玄 Gen Kuroki

黒木玄 Gen Kuroki Profile picture

Stay in touch and get notified when new unrolls are available from this author!

Read all threads

This Thread may be Removed Anytime!

PDF

Twitter may remove this content at anytime! Save it as PDF for later use!

Try unrolling a thread yourself!

how to unroll video
  1. Follow @ThreadReaderApp to mention us!

  2. From a Twitter thread mention us with a keyword "unroll"
@threadreaderapp unroll

Practice here first or read more on our help page!

More from @genkuroki

26 Mar
#Julia言語 の多重ディスパッチを強く支持している人達は、「多重ディスパッチのJuliaにはクラスベースのOOPの機能を追加するべきではない」「OOPのデザインパターンはOOPの欠陥を補完するものであり、多重ディスパッチではよりシンプルな方法で解決できる場合が多い」と主張しています。続く
#Julia言語 多重ディスパッチとは、x,y,zの型の組み合わせを変えたとき同名の函数f(x,y,z)で異なるメソッドを実行可能にする機能のことです。x,y,zは平等に扱われる。

f(x,y,z)におけるxおよびその型のみを特別扱いしてx.f(y,z)と書けるようにすれば、よく見るOOPのスタイルになる。

続く
#Julia言語 資料

C++の開発で知られるBjarne Stroustrupさんは、f(x,y,z)をx.f(x,y)と書くスタイルの採用は浅い考えに基く失敗で、多重メソッド(=多重ディスパッチ)の採用が良さそう、のように言っているように見えます。

discourse.julialang.org/t/is-julias-wa…

open-std.org/jtc1/sc22/wg21… Image
Read 13 tweets
25 Mar
#数楽

多項式f∈ℝ[x]に「a∈ℝをf(a)∈ℝを対応させる函数」を対応させる写像は単射なので、多項式fとそれに対応する実数の函数を区別しなくも大丈夫。(無限体でもOK)

有限体F上の多項式g∈F[x]に「a∈Fをg(a)∈Fを対応させる函数」を対応させる写像は単射でないので、それらを同一視できない。
#数楽 例えば二元体𝔽₂={0,1} (1+1=0)について、𝔽₂上の多項式としてxとx²は異なるが、𝔽₂上の函数としてはどちらも恒等写像になって等しくなってしまう。

xとx²を𝔽₂の2次拡大𝔽₄=𝔽₂[α] (α²=α+1)上の函数とみなしたものは互いに異なる。

こういう具体例がノータイムで出て来ることが大事。
#数楽 面倒なのは有理函数(多項式環の分数体の要素)に対応する「函数」の場合。

有理函数ごとに定義域も変わるので、異なる定義域を持つ函数達を同時に扱うための「処理」が必要になる。(これには複数の処方箋がある。)

結果的に、無限体の場合には、有理函数と対応する「函数」は同一視可能になる。
Read 7 tweets
25 Mar
#Julia言語 リポジトリの方の公式マニュアルに以下が追加されましたね。

* 引数の型の過剰な制限はよくある間違いです。疑わしいなら引数の型を書くのをやめましょう。

* Juliaでは戻り値の型宣言はほとんど使われません。一般に「型安定」な函数を書くべきです。

github.com/JuliaLang/juli…
#Julia言語 具体的には

fib(n::Int) = n ≤ 2 ? one(n) : fib(n-1) + fib(n-2)

はよくある間違で、

fib(n)::Int = n ≤ 2 ? one(n) : fib(n-1) + fib(n-2)

も誤りです。どちらでもBigIntによる計算が不可能になる。よく分からないなら

fib(n) = n ≤ 2 ? one(n) : fib(n-1) + fib(n-2)

でよい。
#Julia言語 無用に引数の型を制限してしまううようだと、NASAでは仕事をできなくなります。(NASAでもJuliaを使っている)
Read 11 tweets
24 Mar
#Julia言語 (1-2^(1-s))ζ(s) は交代級数になりEuler変換が使える。Euler変換を使えば数十項でFloat64の精度を使い切った計算が可能。

①オイラー変換のウェイトのグラフ
②64項の和の計算結果
③正確な値との相対誤差の常用対数、横軸Lは項数

Euler変換はかなり強力。

nbviewer.jupyter.org/gist/genkuroki…
#Julia言語 Euler変換とは、1つ前のツイートの1つ目の添付画像で示された謎のウェイト w^{(L)}_k をかけて (-1)^k a_k を k=0からL-1まで足し上げると、(-1)^k a_k のk=0から∞までの和の良い近似になるという魔法のような話。

1つ前のツイートのLは2^6=64.
#Julia言語 #数楽 (1-2^(1-s))ζ(s) のEuler変換は複素平面全体で収束するので、ζ(s)の近似計算にも使える。

効率はそんなに良くないが、リーマン予想の数値的確認や視覚化をそれで行うこともできる。

非自明な零点の周囲のプロットもオイラー変換を知っていれば容易に可能である。
Read 4 tweets
24 Mar
#Julia言語 もう何度目になるか分かりませんが、私もdual numbersを実装してみた。

添付画像2の @ code_warntype と @ btime の結果に注目。この2つの確認は必ずやった方がよい。続く

ソースコード↓
nbviewer.jupyter.org/gist/genkuroki…
#Julia言語 自動微分の仕組みのdual numberパートは易しい部分。

難しいのは大量の函数を合成してできる函数の微分をどのように効率的に求めるか。

行列A,B,C,Dのサイズによって、A(B(CD))と((AB)C)Dで計算にかかる時間が大きく違う場合がある(そのことは行列の積の定義さえ知っていれば理解可能)。
#Julia言語 Juliaで積極的に計算を遅くするには、

① グローバル変数の値を引数を経由せずに函数の中で中で使う。

② structを

struct Foo
a
b
end

のように定義して使う。もしくはこれのバリエーション。

あとほとんどの場合に mutable struct は必要ない。
Read 8 tweets
24 Mar
悪ふざけ論文のネタ:

* f(a,b,c,…)の中の個人aを特別扱いして、a.f(b,c,…) のように書き、函数fをaの所有物とするアイデアは極めて資本主義的。

* それに対抗する解放運動として多重ディスパッチが提案されて来たが、ことごとく資本主義に敗北して来た。

* 解放運動にとってJuliaは(略)
上のツイートはネタ(冗談)なので要注意。
axiom of equality を「平等の公理」だと誤解させて(本当は「等号の公理」)、さらに axiom of choice を「(産むか産まないかの)選択(を認める)公理」と読ませることに成功したパロディ論文は有名。
physics.nyu.edu/faculty/sokal/…

他にも滅茶苦茶で笑えるのですが、アクセプトされて大騒ぎになった。
Read 4 tweets

Did Thread Reader help you today?

Support us! We are indie developers!


This site is made by just two indie developers on a laptop doing marketing, support and development! Read more about the story.

Become a Premium Member ($3/month or $30/year) and get exclusive features!

Become Premium

Too expensive? Make a small donation by buying us coffee ($5) or help with server cost ($10)

Donate via Paypal Become our Patreon

Thank you for your support!

Follow Us on Twitter!