#統計 2009年頃に、添付画像の場合に傾向スコア法を使うとバイアスが生じたりしないのか、という質問にルービン先生がまともに答えることができなかった件はもっと知られてよいと思う。

この件については、ルービン先生的な因果推論を学んだ人達もルービン先生個人に批判的になるべきだと思いました。
#統計 ある程度以上、統計的因果推論について学んだ人であれば、Cによる条件付けで調整すると、EのOutcomeへの効果にバイアスが生じ、因果効果の見積もりを誤る危険性があることを理解しているはずです。

易しい話です。
#統計 ルービン先生は、「この場合の因果推論では、傾向スコア法に限らず、Cによる条件付けをしてはいけない」とクリアに答えればよかった。

ルービン先生は単にCによる条件付けに警告を発し、警告する機会を与えてくれたことについて、質問者にお礼を述べればよかった。
#統計 実際のルービン先生の態度は真逆でした。

まず最初のShrier さんの質問はこうでした。

Mバイアスの図を示し(この図はパールさん的)、その場合についてルービン先生的な傾向スコア法はどうなるかについて質問しています。こういう質問が出るのはよいことです。

onlinelibrary.wiley.com/toc/10970258/2…
#統計 それに対するルービン先生の返事は以下の通り。

Mバイアスの場合に傾向スコア法でバイアスが生じたりしないのか、という質問にルービン先生は何も答えていません!

単に「そのような場合にはCによる条件付けをしてはいけない」と答えればよいだけだったのに!

onlinelibrary.wiley.com/toc/10970258/2…
#統計 いやあ、ルービンさんがパールさんの本でディスられているのは知っていましたが、ルービン先生のようなとてつもなく権威のある人がここまで酷い態度を取っていたとは知らず、非常にびっくりしてしまいました。
#統計 ルービン先生からの返事に対するShrierさんの返答は以下の通り。

【Rubin博士は以前、DAGは有用ではないと回答しているが[4]、多くの研究者が、この状況では傾向スコア法の基礎となる仮定が破られることに気付かなかったであろうことは明らかである。】

onlinelibrary.wiley.com/toc/10970258/2…
#統計 その後もやりとりが少し続くのですが、ルービン先生がどんどんまずい方向に進んでしまい、大変気まずい状況になってしまったように見えました。
#統計 Mバイアスの解説
#統計 Mバイアスに関する別のノート
#統計 因果関係の向きによって、条件付けをするかどうかを変える必要があることについては、最近拡充されたLord's paradoxのウィキペディアの解説も参照。

en.wikipedia.org/wiki/Lord%27s_…
#統計

因果関係の情報も含むモデル



同時確率分布としてのモデル

は全然違っていて、相関係数や回帰係数の推定は後者の同時確率分布のパラメータの推定に過ぎず、因果関係の情報は一切使わないことにも注意。

モデルが何であるかの理解は非常に重要。
#統計 その後のやりとりについては、パールさんが書いた

ftp.cs.ucla.edu/pub/stat_ser/r…

のReferencesの欄からたどれます。

ルービン先生個人によるパールさん的なスタイルの拒否については真面目に相手をしてはいけないことは明らかだと思いました。

思っていたより酷かった。

どうしてこんなことに?
#統計 パールさん的なスタイルで記述されたモデルに、ルービン先生的な潜在アウトカム変数Yₖを付け加える方法
#統計 Judea Pearl, Causality: Models, Reasoning and Inference, 2009 でのpotential outcome変数Y(x,u)の作り方の説明は以下のページにある。

❌「パールさんの因果推論の枠組みに potential outcome はない」という印象を持っている人は誤解している。
#統計

causality.cs.ucla.edu/blog/index.php…
December 3, 2012
Judea Pearl on Potential Outcomes

こじれているのは知っていたが、こういうのに書いてあることはちょっと大袈裟に書いてあると思っていた。誤解だった。不毛なイジメみたいなことが起こっているように感じられた。21世紀の黒歴史かも。
#統計 広めるべき知識は、

 矢印で記述されるモデルの側で、
 potential outcome変数をどのように作ればよいか

実際に広まれば、矢印によるモデルの記述に慣れるだけで、潜在結果変数も即理解できるようになる。

例えば、 ftp.cs.ucla.edu/pub/stat_ser/r… では添付画像の部分以降に説明がある。
#統計 potential outcomeについて「欠測値」というイメージで説明されてしまうと、「欠測値はモデルを決めないと埋められないだろ?モデルは何?」という疑問が即出て来てしまうことです。
#統計 ルービン先生流の説明の仕方だとignorabilityなどの条件が「欠測値」というイメージで捉えたpotential outcomeのモデルの記述になっているのですが、多分初学者がそのように理解するのは苦しい。
#統計 最初から、potentialでない方のoutcomeが確率変数Yとしてモデル化されているときに、そのモデルに新たに付け加えられる確率変数Yₓとしてpotential outcomesを曖昧さなく定義してしまえば、ignorabilityのような理解が難しい条件の理解を後回しにして、潜在結果変数のモデルを理解可能。
#統計 理解が難しい話を後回しにして、最初から潜在アウトカムのモデルを設定して先に進めることの教育面でのメリットは大きい。

テクニカルな「やり方」の話を後回しにして、potential outcomesについて概念的にクリアなイメージを持っておくことは、テクニカルな事柄の理解にも役に立ちそう。
#統計 潜在アウトカムは現実には観測不可能なので想像上の話になります。勝手にデタラメに想像しても意味がないので、何らかのモデルを設定して、そのモデルを使って現実とは異なる状況での結果を推測する必要がある。

そのモデルが何であるかは、できるだけ早く説明した方がよいと思いました。
#統計 モデルを明瞭に定義せずに、得られた観測データの数値の操作の仕方だけを説明されてしまうと、

* データの数値を使ったモデルのパラメータ推定



* 推定で得たパラメータ値を使った潜在アウトカム関連の結果の計算

がごちゃ混ぜになり、そういうことをやっていることが見えなくなる。
#統計 関連

(以下のリンク先でもMバイアスを例に使っている)
#統計 「回帰」の一般形は 、適当な仮定の下で観察データの数値を使って、Xに依存するYの確率分布P(Y|X)を推定することです(Xの部分は複数の変数の場合に拡張可)。

「回帰」では、因果関係に関するモデルの仮定を一切使わないので、「因果」とは何も関係がありません。続く
#統計 続き。統計的因果推論の肝は

①因果関係に関する設定をモデルに組み込むと、他の変数からの因果的影響を全て遮断してXの値を決めたときのYの値への影響を定義できる。

②それを因果関係の情報を一切使用しない通常の回帰によって計算できる場合がある。
#統計 観察データの生成のされ方に関するモデルは観察データの数値の同時確率分布(パラメータ付き)として記述され、因果関係の情報を一切組み込む必要がありません。

通常の「回帰」や「予測」はそのようなモデルを使って行われます。続き
#統計 統計的因果推論を行うためには、データの数値に関するパラメータ付き同時確率分布をモデルとして与えるのでは足りず、因果関係もモデル化する必要があります。続く
#統計 そのとき問題になることは、通常の統計学における定番の道具である「回帰」や「予測」は因果関係の情報を一切使用しないので、それらの道具を使っても、因果関係に関する結果が得られそうもないように思える所です。続く
#統計 実際にはそうではなく、因果関係の情報を一切使わずに計算されたある特定の(←ここ重要)「回帰」の結果が、因果関係に関する結果ともみなせることを数学的に示せます。

このことを理解すれば統計的因果推論の概念的な理解が得られることになります。
#統計 「回帰」は因果関係の情報を一切使わずに計算できるので、どんなに「回帰」を行なっても決して「因果」に関する結果は得られそうもないように思われるのですが、因果関係の情報も使えば、特定の「回帰」のみが「因果」を扱っているとみなせ、どの「回帰」がそうなっているかがわかるわけです。

• • •

Missing some Tweet in this thread? You can try to force a refresh
 

Keep Current with 黒木玄 Gen Kuroki

黒木玄 Gen Kuroki Profile picture

Stay in touch and get notified when new unrolls are available from this author!

Read all threads

This Thread may be Removed Anytime!

PDF

Twitter may remove this content at anytime! Save it as PDF for later use!

Try unrolling a thread yourself!

how to unroll video
  1. Follow @ThreadReaderApp to mention us!

  2. From a Twitter thread mention us with a keyword "unroll"
@threadreaderapp unroll

Practice here first or read more on our help page!

More from @genkuroki

Jan 28
#統計 P値や信頼区間に関する大学での講義は(数え切れないくらい強調していることですが)、論文 journals.sagepub.com/doi/10.1177/02… の内容(過信や自信過剰を引き起こさない考え方)に従うように改訂されるべきだと思います。

過去の大学の講義のほとんどがその意味では失格。
#統計 帰無仮説は統計モデルのパラメータの値に関する仮説になっており、P値を得るための確率の(近似)計算は帰無仮説下の統計モデル内で行うことになるので、統計モデルについての説明がない仮説検定の説明は最初から相手にする価値がないということになります。
#統計 仮説検定における「統計モデル」は「P値の計算に使われる数学的仮定の全体」のようにざくっと定義しておくと便利です。

例えば、P値の計算に確率の近似計算を使うならば、その近似がうまく行くという条件が統計モデルの中に含まれていると考えると便利。
Read 10 tweets
Jan 28
#数楽

a(n+1)=3a(n)+2ⁿ は Ta(n)=a(n+1) を使えば

(*) (T-3)a(n)=2ⁿ

と書き直せる。(T-2)2ⁿ=0なので、

(*)⇒(T-2)(T-3)a(n)=0.

ゆえに(*)の解は

a(n)=A×3ⁿ+B×2ⁿ

と書ける。このとき(*)⇔B=-1.

以上の完全に機械的な解法は大幅に一般化可能。
#数楽 Ta(n+1)=a(n)と書く。

(Tⁿ+p₁Tⁿ⁻¹+…+pₙ)a(n) = 0

の形の斉次方程式の解の形が完全にわかっていることを使えば、f(n)がそのような形の斉次方程式の解であるときの

(Tⁿ+p₁Tⁿ⁻¹+…+pₙ)a(n) = f(n)

の形の非斉次の場合も機械的に解ける。技巧的な式の変形技術は無用になる。
#数楽 そういう技巧を不要にする機械的解法は、

 ある種の方程式を満たす数列全体の集合が具体的に完全にわかっていること

から、ただちに出て来る。

ある街の様子を完全に知っていれば、その街で苦労無しに快適に暮らせるのと似ている。
Read 8 tweets
Jan 27
#統計 mdsc.kyushu-u.ac.jp/lecturesmdsc.kyushu-u.ac.jp/wp/wp-content/… の内容が滅茶苦茶。添付画像を参照。

①信頼区間の説明で「母平均の分布もわかる!」と書いてある。酷い!

②「t分布する二つに値の「差」も、やはりt分布」と書いてある。酷い!

③Wilcoxonの順位和検定は中央値の差の検定法ではない。 ImageImageImage
#統計 P値や信頼区間に関するより現代的な知識は論文 journals.sagepub.com/doi/10.1177/02… で得られる。

統計的有意性とP値に関するASA声明 biometrics.gr.jp/news/all/ASA.p… は必読で、講義動画 ocwcentral.com/subjects/01GB4… には時代遅れな説明が書いてある教科書に批判的コメントがある。

これらの代替案に従えば無難。
#統計

mdsc.kyushu-u.ac.jp/lectures

slideshare.net/ssuserf64eb4/s…

にも同様に酷い説明がある。

①真の平均が正規分布しているかのようなグラフの下に【真の平均は,95%の確率で,標本平均±1.96σ/√Nの範囲にある!】と書いてある!酷い。

②【t分布する二つの値の「差」も,やはりt分布】とある!酷い! ImageImageImageImage
Read 5 tweets
Jan 27
#統計 「全部pだと困る問題」について。個人のノートでは

p₁(y|x,c)p₂(x|c)p₃(c)p₁(yₐ|a,c)

の代わりに、

p(y|x,c)p(x|c)p(c)p(y=yₐ|x=a,c)

と書くことにしている。引数名を固定して、引数xにaを代入する場合には引数をx=aと書くという方針。

#Julia言語 のp(; y, x, c)と同じ仕様を採用😊
#Julia言語 での p(; x=y, μ=0, σ) のような書き方はこんな感じ。

using Distributions

p(; x, μ, σ) = pdf(Normal(μ, σ), x)

y = 1.96
σ = 1

p(; x=y, μ=0, σ) using Distributions  p(; x, μ, σ) = pdf(Normal(μ, σ), x)
プログラミング言語の仕様になっている書き方であれば、well-definedな表記法であることが保証されていると考えてよい。

#Julia言語 との類似は、変数名が違えば型も違うことにすると、同一の名前の函数(メソッド)の多重ディスパッチの仕組みによって、より完璧になる。
Read 4 tweets
Jan 27
#数楽 差分作用素をTf(n)=f(n+1)と書く。

a,b,cが異なるとき、

A aⁿ + B bⁿ + C cⁿ

は(T-a)(T-b)(T-c)の作用で消える。

(bⁿ-aⁿ)/(b-a)のb→aの極限naⁿ⁻¹なので

A aⁿ + A' naⁿ⁻¹ + C cⁿ

は(T-a)²(T-c)の作用で消える。続き
#統計 c=a+hとおくと、

cⁿ = aⁿ + naⁿ⁻¹h + n(n-1)/2 aⁿ⁻² h² + O(h³)

なので、h→0のとき

(cⁿ - aⁿ - naⁿ⁻¹h)/h² →n(n-1)/2 aⁿ⁻².

ゆえに

A aⁿ + A' naⁿ⁻¹ + A'' n(n-1)/2 aⁿ⁻² = (nの2次以下の多項式) aⁿ

は(T-a)³の作用で消える。

一般の場合も同様。
#数楽 特性方程式が重解を持つときにはJordan標準形を使うと覚えてしまった人がいるかもしれませんが、重解を持たない場合からの極限で重解を持つ場合も理解できます。

系を摂動したときの解の挙動の変化は重要なので、重解を持つ場合を持たない場合で近似することも重要です。
Read 11 tweets
Jan 26
冷える。 Image
さらに冷えた。 Image
Image
Read 4 tweets

Did Thread Reader help you today?

Support us! We are indie developers!


This site is made by just two indie developers on a laptop doing marketing, support and development! Read more about the story.

Become a Premium Member ($3/month or $30/year) and get exclusive features!

Become Premium

Don't want to be a Premium member but still want to support us?

Make a small donation by buying us coffee ($5) or help with server cost ($10)

Donate via Paypal

Or Donate anonymously using crypto!

Ethereum

0xfe58350B80634f60Fa6Dc149a72b4DFbc17D341E copy

Bitcoin

3ATGMxNzCUFzxpMCHL5sWSt4DVtS8UqXpi copy

Thank you for your support!

Follow Us on Twitter!

:(