にんじんブログ

にんじんの生活・勉強の記録です。

MENU にんじんコンテンツを一望しよう!「3CS」

にんじんと読む「統計学を哲学する(大塚淳)」🥕 終章

carrot-lanthanum0812.hatenablog.com

終章 統計学存在論・意味論・認識論

あらゆる経験科学は、その対象がどのような存在物であり、またその説明に際してどのようなものが仮定されなければならないのかについての想定を有している。では統計学においては、何が所与として与えられており、またどのようなモノが仮定されなければならないのか。このような推論や説明のための素材についての前提を本書では統計学存在論と呼んだ。

統計学を哲学する

 

 統計学の基礎的存在物は「データ」である。記述統計はデータを要約するが、未観測の事象について帰納推論を行なうためには自然の斉一性を仮定しなければならずこれを数理的にモデル化したものが「確率モデル」であり、推測統計は、データ/確率モデルの枠組みにおいて進む。

 しかし推測統計は「予測」に貢献するが、世界に介入を行った場合の評価についてはわからなかった。因果推論は反事実的な状況を想定しなければならず、さまざまな可能世界のあいだの関連性を探らなければならないからである。このために「因果モデル」が登場し、間世界的な法則性については「データ」だけでも「確率モデル」だけでも記述され尽くすわけではなく、新たに条件をつけたうえで推定を行わなければならない。

一般に、存在論がより豊かであるほど、可能な推論の幅は広がる。しかし他方で、豊かな存在論は認識論的には負担となる。新たな存在が導入されるほど、それをデータから正確に推論することは難しくなるのである。

統計学を哲学する

  因果関係についての推論は、まずデータが正しくなければならず、存在論的な前提も正しくなければならず、論理ステップも正しくなければならない。だから進めば進むほど難易度が高くなり、不確実になっていく。「説明力と認識論的負荷のトレードオフ

 しかし私たちに与えられるものはひとまずデータだけである。これ以降、掘り進めるのは上述の通り、非常な困難を伴う。掘るためにはまず相手を単純化しなければならない(確率種:それ自身では捉えどころのない真なる確率分布を、明示的に書き下せる関数として切り出している)。私たちとしてはこうした種が世界の構造を反映していると信じたいのだが、あとになって、「その確率種はコレとコレからできているんですよ」ということが判明するかもしれない。確率種はあくまで存在論的な仮説にすぎない。

 種に期待されるのは客観的な構造の反映であるが、これが唯一の見方というわけではない。種とはあくまで予測に役立つような分節化だとみることもできる。二つは異なる存在論的態度であり、すなわち、認識能力によって持つべき存在論が変わって来ることを含意する。最高に有能なマシンなら、恐ろしく微細なパターンでもそれを検知して予測に役立てることができるだろう。これを実現しているように思えるのが深層学習である。ところがこの「恐ろしく微細」というところが、機械と私たちの自然の切り分け方に齟齬を生じさせ、社会的応用の段階になって、その機械とどう関わるか・どう評価するかといったことが問題になってくる。話が通じない・なんでそんな結論になるんだ・何をしようとしてるんだ、ということがわからなくなってしまうのである。私たちは深層学習のもつ存在論を、たとえそれが無理だったとしても、できるだけ明確にしていく必要に迫られている。

 

 意味論は数理的存在物が現実世界とどのように対応しているかに関わる。モデルの解釈、表現の問題である。意味論は存在論の各階層において成り立つ。確率モデルに対しては主観主義と頻度主義の争いがあった。因果モデルについても意味は問題になる。「XはYの原因である」とは一体なんなのか。もちろんそんなことを考えなくても「数学」をやっていくことはできるのだが、その数理的探究が自然の探究に繋がっていることを担保するのは意味論の仕事である。

 

統計学は以上のように想定され、解釈された確率モデルを、データから推論する。この統計学の本丸に属する推論的営為を、本書では認識論と呼んだ。

統計学を哲学する

 

 統計学的推論はどのような意味で正当化されているのか、という問題に関して内在主義と外在主義の対立を見た。そしてそれがほとんどベイズ主義と古典統計の争いだったわけだが、これらは仮説の客観的正しさを求めていく営為だったのに対して、「役に立つ予測」という観点から認識論的プラグマティズムという真理観もあった。モデル選択理論と深層学習理論は性能の良いモデルを提供してくれる。ベイズ主義や古典統計は、明示的に示された理論と原理に基づいて答えを導こうとする点でデカルトから始まる基礎づけ主義的な発想を有しているが、深層学習モデルにおいてはもはや統一的な理論枠組みは存在しなくなっていた。いったい彼らを認めるべきだろうか、という点について出て来たのが徳認識論という考え方だった。しかし知識の根拠を個別的なモデルや人の徳に求める認識論は時代に逆行しているかのように思え、現在の深層学習の発展に対して人々が抱く期待と不安の奥底にあるものになっている。

 

おわりに

「データ解析に携わる人にちょっとだけ哲学者になり、また哲学的思索を行う人にちょっとだけデータサイエンティストになってもらう」

統計学を哲学する

 

 d(^ω^)

 

 

 

統計学を哲学する

統計学を哲学する

  • 作者:大塚 淳
  • 発売日: 2020/10/26
  • メディア: 単行本(ソフトカバー)
 

 

科学と証拠―統計の哲学 入門―

科学と証拠―統計の哲学 入門―