にんじんブログ

にんじんの生活・勉強の記録です。

MENU にんじんコンテンツを一望しよう!「3CS」
にんじん放送局にて「今日の単語(キョウタン)」配信中!
にんじん放送局にて「おいでませ!湖中町」シリーズ 第三弾「私は知らない」配信中!

にんじんと読む「統計学を哲学する(大塚淳)」🥕 第五章(①)

carrot-lanthanum0812.hatenablog.com

第五章 因果推論(①)

 帰納の問題と因果の問題を同一視したのはヒュームだった。つまり、帰納問題の正当化と、原因から結果への推論の正当化は同じ問題の表裏に過ぎなかった。

 しかしそもそも因果とはなんなのか。ヒューム自身は規則説regurality theoryに立つ。つまり、(1)原因と結果は時空間的に隣接している。(2)原因は結果に時間的に先立っている、(3)原因と結果は恒常的に連接している、の三条件に因果を求める。観察できるのは前の事象、後の事象の一連の生起であり、因果にはこれ以上の条件は必要ない。因果関係は一種の規則性であり、この規則性は確率変数の間の相関によって表される。因果関係はその域を決して出ることはない。

 因果関係を確率的関係と読み替えるという仕事は、当然、その関係の中に既に因果が含まれていてはならない。ところが因果関係そのものを定義するうえで、私たちは既になんらかの因果的知識を持っていることが要請される。たとえば、因果関係と相関関係を本当に一緒くたにすることはできない。あなたが気圧計を見て低い数値を見ることと頭痛に悩まされることは相関しているが、しかしこれは気圧が実際に低いという原因によって引き起こされた偽の相関に過ぎない。そこで因果を定義するにあたっては、二つの共通の原因・交絡要因confounding factorで条件づけておかなければならない。気圧が低いのが真の原因であって、気圧計の目盛りを見るから頭が痛くなっているわけではないのだから、ふつうに考えて、高い日にも気圧計を見てみれば問題は解決するだろう。だから、交絡要因になりそうな要素を考えておいてそれも込みで理論を組み立てていくわけだが、まさにここに、因果的知識をあらかじめ持っていなければならないという部分があらわれている。

 因果は確率とは異なる。では何か。

 私たちは「隕石がぶつかってきて、恐竜が絶滅した」とかいう。ここで意味されていることは、必ずしも規則的連関ではない。なにしろ、恐竜の絶滅は一回きりしか起こっていないのだから、規則がどうとかいう話ではない。むしろ私たちが言いたいのは、「隕石さえなきゃあ絶滅しなかったんだがなあ」ということではないか。そこで出てくるのがデヴィッド・ルイスの反事実条件説counterfactual theory of causationである。彼によると、EがCに因果的に依存するとは、

  1.  もしCであったとしたらEであっただろう
  2.  もしCでなかったとしたらEでなかっただろう

 ということがともに成立するということだ。

 すぐにノージックの知識論に似ていることに気づくが、これもやはり同様に、可能世界意味論によって定められる。一番についてそれが現実世界において真となるのは、どの可能世界においてもCではない、あるいは、CとEがともに成立している可能世界があり(適例世界)、それはCであるがEでないような可能世界(反例世界)のどれよりも現実世界に近い、ということを意味する。前者については論理学上の但し書きなので気にしなくていいが、後者においてはちょっと趣が異なる。ややこしい。

 甘いものは虫歯の原因である。一番の条件を考えよう。これが成立するためには甘党でしかも虫歯になっている適例世界があるとしよう。そのとき、甘党でも虫歯になっていない反例世界のうちで好きなものをとってきたときに、適例世界が常に現実世界と近ければよい。というわけで、たとえば反例世界のうちでは、みんな大変真面目に歯磨きをしている世界もあるだろう。だとするとその反例世界は現実とはたいへん勝手が違っており、適例世界に負ける。二番目の条件も同じようにする。

 しかし問題なのは、やはり可能世界がどうなっているのかなんて私たちにはわからないということだ。反事実条件説は意味論はうまく与えていたとしても、どうやってそれを知るのかという認識論には無頓着である。これを補うのが検定理論であるが、しかしそれすらも十全ではない。なぜなら検定理論が行うことは、背景にそのような因果が成立するとして、その仮説が成り立つかどうかを棄却したり保持したりするものだからだ。だが私たちが知りたいのは、「まさにその因果関係が存在するか」ということなのだ。

 

 

 

現代哲学のキーコンセプト 因果性

現代哲学のキーコンセプト 因果性

 

 

考えたことなど

 

 頭の整理がしたかったため。

 

考えたことなど(標語)

  •  自己は概念の運動である。自己は意識された自我であり、諸側面の束に過ぎない。
  •  自我はある傾向をもった一つの働きである。自我は動物的な快/不快の区別に始まり、成長を含む環境の変化に応じて分化する。分化はまず自我に染み込み、自我は現象から一歩身を引くことによって、言語によって意識を生じさせる。自我は「善きこと」を求める。ニーチェが「力への意志」と呼んだ傾向性はこれに近い。しかし善的なものは内在的ではなく、私たちの誰もが何が善であるか知らないことがある。私たちそれぞれは社会にそれを投げ入れることによって、それを問いかける。私たちを形作るものは内的規範であり、それを問いかけ続ける。
  •  私たちは簡単に「自我」と呼ぶが、なんら実体的なものではなく、それは常に自己を通して把握されるプロセスである。意識は自己に特権的地位を与える(「自己中心化」傾向)。それは現象というものが常にそれを見て取る者によって支えられているからで、私たちはその者を自己として見ることにおいて、自己の優越を認めるのである。しかし、私たちはあまりにそれに慣れ過ぎているがために自己に縛られ、パースペクティズムの網に囚われる。
  •  唯一の自己が虚構であるように、唯一の世界も虚構である。「本当の自分、本当の世界がどこかにあるはずだ」という極端に私たちは振れ、そこで立ち止まらんとする。
  •  ほんとうの規範、真理、美は訊いてみても誰も知らない。ただ、投げ入れればよい。「どうぞ、ご自由に」という言葉を、人は最も恐れる。
  •  社会は闘争の場であると同時に、問いかける場でもある。問いかける。私たちはそれを非常に特殊な営みだと考える。だがそうではない。生活は常に社会のなかにあり、私たちは常に問いかけ続けている。競争を通り抜けよ。だから「論破」はくだらないお遊びに過ぎない。俗物根性。知的スノッブ
  •  コミュニケーションは「目的」ではない。そのフィルターを通して、私たちは「検討」する。私たちに目的たるなにかをあえて言い立てるとすれば、『そのように生き、そのように死んで行ってもよい』とされる生活以外にはない。しかしそのように言ったところで、その内実を決めるのは、自身でしかないのだが。
  •  この点を誤解して、社会などの「大きなコミュニティ」を信奉しようとする人々を、私たちは何人も見て来た。生き方に正当化を求めるのもそのひとつである。生きること自体が無根拠なのに、正当化などない。生き方に自信が必要だと思うのは、暗に正当化を求めているからである。私たちを納得させるのは、「これでいいのだ」以外にはない。自信は必要ない。間違っているかも、という変な心配が必要ないだけだ。自分の正しさを自分が示していかなければ一体だれが示すのか?
  •  私たちは定住生活に順応できていない。共同体、国家、社会、文化、宗教、哲学、経済、差別、戦争、芸術。文明の火たち。
  •  死は経験しないから悩む必要はない。死が怖いのじゃなく死に至る苦しみが怖い ———何を言ってるの? 問題なのは、私にいまそのように現れていることであって、上から覗いて分かった口を聞くことではない。こういう手合いは、みな口をそろえて言う。「生きているとは、死んでいないことだ。故に……」出発点はそこにはない。
  •  生きていることは無根拠である。私たちはその上に、いくつかの世界を渡り歩いて暮らす。それぞれのゲームが、物事のリアルを支える基盤になる。逆にいえば、なにがリアルかはゲームが決める―――私たちはそれを消そうとすべきではない。もちろん、消してもよいのだが。どうぞご自由に。

 反・考えたことなど

  •  生活すること自体が「世に問う」ことでもあるのなら、別に競争意識だけ持ってればいいのでは? 調整なんか勝手にやってくれるんでしょ。

→ たとえばあなたがよい作品を残そうと思うなら、作品をよりよくしようと思うなら、他人の目に触れさせその反応をみなければならない。

  •  出版したときは酷評され、死んでから評価される作品もある。本人としては「これは面白いんだ」と正当な受け取りもないまま信じ続けるか、「俺は駄目なんだ」と落胆する以外にないことになる。集団の””総意””は遅すぎるし、時代に影響されすぎていて、検討の素材としては最悪だと思うが。
  •  また、「良いかどうかは時代に影響される」ということがわかる、という結果が得られたとしても、それは本人がいくら駄目な作品を書こうが「時代が追い付いてない」と言い続けることができないか? そもそも検討などうまく働くのか? 彼が自分をごまかしているのではなく、まったくの本心から、「俺の生活はこれでよい。作品もこれでよい」と、たとえ人から見てどんな最悪な生活を送っていたとしても、そう言われたら終わりではないか。よい作品って、それでいいのか?

→ 客観的に「よい」というものはまず、ない。

  •  つまり「これでいいのだ」に達すればいいという論だが、じゃあ自分の生活に何の疑問も持たない人のほうが幸福だという話にならないか? 「バカやってればよかったなあ」という理論ではないか? 
  •  なんの倫理観もなく、人をだまし、金銭を得ればいいではないか。ドラッグをやるのもいいと思う。何も考えられなくなるのだから! 脅迫し、だまし取り、盗みを働ければいいではないか。

→ もちろんそれでよい。ただし、あなたがそんなに達者ならの話だが。あなたの話はまったく間違っていないし、そんな風にして生きられるならそれに越したことはあるまい(社会は絶対にそれを望まないが)。不法行為を犯さないのはいくつかの理由が考えられる。それは国家によって身体拘束を受けたり、時には生命を奪われたりするからでもあり、それが社会が提供する基礎の抑止力としての制度である。そしてここに制度というものの、文化というものの、ひとつの目標があらわれている。

 

→ 考える時の最も適切なやり方のひとつは、極端な例を挙げることだ。だがその理由は、極端な例が私たちに次の思考を促すからであって、それが何かを結論するからではない。私たちはそのように生きてはいない。そしてそれが「上から覗いてわかったような口をきく」という言葉の意味でもある。

 

→ あなたと話すのは論争のためでもなければ、授業をするためでもない。

 

→ 私たちはそれについて、正しいことを何一つ知らない。常にそこから始めなければならない。いつでも? 理想的には、そうだ。だが痛むことがいいことかを話しあう前に、殴られそうになったら殴り返すのが適当だ。ただし、殴り返す「権利」があるのではない。そうしたいから、そうするだけに過ぎない。

 

→ 私たちは、たとえば小学一年生だった頃の信念を、今も保っていることは少ない。それはあの頃、あまりにも多くのことを間違えていたからではなく、今のほうがより良いと判断して修正を重ねて来たからだ。環境の変化ということもある。

 

→ 人はこの修正を「間違い」と呼びたくなる。これは正当化を求める傾向とほとんど同一のものである。信じたいことをただ信じる段階を過ぎ、正当化を求める段階を経て、私たちは正当化の鎖を外し今度はそれを用いるようになる。―――これを読んで、なるほど僕は論理を武器にしている、と思うならば、まだ勘違いしているかもしれない。

 

→ 人はいつも自分にとって「善い選択」をする。それは脅迫されていた場合でも変わらない。脅迫されていた場合はこうしたほうがよい、と判断しているのだから。これはいくらでも付け足すことができる。「あのときはアレが悪かったから」とあなたが心の中で言うたびに。「アレがあるとき、あなたはそういう判断をすることが善いと思った」。どれほど動くのが面倒くさくても、そのままじっとしていたら痛い目を見るならば、どんなものぐさも飛び上がって逃げるだろう。

 

→ 生きる意味は存在しない。そして、人はいずれ死ぬ。

→ すべてはここから始まり、実は死ぬまでここで足踏みをしている。人生はテーマパークだ。ただし、外部はないし、無料パスの有効期限は不明だが。しかもこのテーマパークの運営は、自らが運営者のひとりであることを忘れて遊び呆けたり、哲学をしたりしている。

 

 

***

 

 

  •  自分のことを信じて自由にやっていけということ?

 

→ それは近似になっているが、実際のところは全然違う。しかしそれで救われるなら、別に以下のことを読む必要はないと思う。

 

 

 

→ まず信じる必要はない。信じようとするから、その根拠が欲しくなる。誰かのやることより自分のやることのほうが正しいという根拠が。

→ 信じるのではなく、ただそのように表現する。自らを「報告」する。むしろ信じてはいけない。あなたはCEOではなく、単なる報道官に過ぎない。そのことをまず強く自覚すること。報道官は外交的な文書を読み上げる、その国の顔である。政治家から上がって来る辛いとか悲しいとか、ここで泣けとか、感情を高ぶらせろとか、そういうパフォーマンスもしなければならない。可哀想に、あなたには「本音」などというものはない。

→ ほとんどのケースにおいて、あなたは自由ではない。なぜなら、ほとんどのケースにおいて、あなたは原稿を読んでいることすら忘れているから。読むべき原稿を、原稿として認識した瞬間だけが自由である。しかし、そうした場合もやはり、原稿から大きく逸脱することはないだろうが。自由は限りなく儚く、そしてそれ自体、正当化することはできない。

 

8マインドフル・ステップス

サーチ・インサイド・ユアセルフ ― 仕事と人生を飛躍させるグーグルのマインドフルネス実践法

 

人類史のなかの定住革命 (講談社学術文庫)

人類史のなかの定住革命 (講談社学術文庫)

 

にんじんと読む「統計学を哲学する(大塚淳)」🥕 第四章②

第四章 モデル選択と深層学習(②)

 予測に特化したアプローチとして、深層学習deep learningを取り上げよう。深層学習の標準的なモデルは多層ニューラルネットワークdeep neural networkである。ニューラルネットの一つ一つの点が確率変数を表しており、これを積み上げる。最初のものが次に影響を与え、次に、次に、次に、で最後に至る。第一ステップのN個の確率変数のすべては、次の第二ステップの一つの確率変数に影響する。この変化の関数を活性化関数と呼ぶ。総パラメータ数はふつう、何千万次元にもおよび、実際に書き下すことは到底かなわない。

 さて、これを具体的に決定していくわけだが、そのアプローチは基本的に今までの道のりとさほど変わらない。誤差関数を用意して、どれぐらいハズれているかをデータから想定していく。とはいえ、今回のケースだとちょっと実験するだけでとんでもない数のデータを処理しなければならないため、誤差逆伝播法backpropagation methodという手法を用いる。とはいえ、理屈ではこの方法でうまくいくのだが、実際やろうとすると値がゼロになったり無限大になったりして具合が悪くなるのがほとんどである。これを勾配消失問題vanishing gradient problemと呼ぶ。しかもこれがうまくいったとしても、誤差関数の形が複雑だと結局求められずに終わる。これをなんとかするために色んな手が講じられているところで、その色んな手を組み合わせることによってなんとか前に押し進めている。

 深層学習の成功とそれによる人工知能ブームはパラダイム・シフトをもたらしている。それはAICで見たように、真理のプラグマティックな転換である。しかしプラグマティストが主張するように、真理が内在的な「役に立つ」という価値しかもたないなら、私たちがものを認識するプロセスは真理を生み出す装置ではなく『こうすりゃ役に立つという道具、技術、習慣に似たもの』となるだろう。

 真理への探究を続けるとしても、私たちは、AIが大量に処理し、弾き出した答えを「知識」としてカウントしてよいのかという認識論的問題に立たされる。アインシュタイン相対性理論を見つけたのと同じように、AIがコレコレの法則を見つけ出したと言ってよいだろうか。言い換えれば、深層モデルによってもたらされる発見は認識論的に正当化されているのか?

 そこで信頼性主義を再び持ち出すのが自然だろう。AIの弾き出しを認識プロセスを、信頼性主義における正当化プロセスのうちに組み込むことは何ら問題ないように思われる。ところが話はこれで終わりではない。古典統計の推論を正当化したときは、それがどの程度の信頼できるのかを数学的な具体的指標(サイズ、検出力)として導き出す理論的手だてがあったのに対して、深層学習においてはそれがいまだにない。モデルの信頼性はむしろ「Googleが作ったんだから」といったような、モデル自体がもつ性質として、属モデル的な仕方で理解されてしまう。

 これを考えるにあたって参照したいのが徳認識論virtue epistemologyである。これは、正当化の根拠を、認識する主体自身が持つ性質や性格に求めるもので、徳倫理学に由来する考え方である。ある信念が正当化されるのは、その信念が認識者の認識的徳の現われであるときだというのだが、なにが認識的徳なのかは意見が分かれるところであるが、なんてことはない、認識的徳というのは認識に関わる限りで人が有する能力や長所の総称に過ぎない。私たちがド素人よりも学者の意見を信頼するのはそのような能力をもっていると考えるからで、このとき私たちたちの裏で働いているのは徳認識論的正当化概念であろう。友人が「先生が言ってたぜ」と言えば、なんの力も持たない私が言うよりも余程知っていると呼べるのだ。

 認識的徳を真理促進的な傾向性、つまりより真理へと導く性質へと言い換える者もいる。聡明で注意深い人は正しい信念を得やすい傾向にあるからだ。だから、適切に学習された深層モデルは認識的徳を有するため、たしかに正当化に成功しているわけだ。そして無論、「適切な仕方で」の部分が問題になるが、この点については、現代認識論入門: ゲティア問題から徳認識論までに詳しい。

 次の課題は認識的徳の解明、つまりなぜその構造だとうまくいくのだろうということだ。深層モデルがデータから何をどのように学習しているのがその機序を理解しなければ、AIを積んだ看板に反応して止まる全自動の車が、看板にちょっと落書きをされるだけで激突することになりかねない。

 私たちは深層モデルを解剖することでこの機序を明らかにすることもできるが、また違った視点もある。ソウザは知識というものを動物的のものと反省的のものとに分けた。奢ってもらったビールの銘柄がナントカであることを私はなんとなく察したとしても、私たちは「なぜ」わかったのかを理解していない。反省的知識はそれについての理解を与えるもので、これを持っていれば「より深い知識を持っている」と言ってもいいだろう。だからAIにこう訊いてみるのだ。「なぜわかった?」と。正当化可能な根拠を示すことができるAIを説明可能な人工知能と呼び、これを目指す試みもある。

 

 ところで私たちはヒトならヒト、イヌならイヌで異なったリアル・パターンの内に生きている。これは深層モデルだって同じようなものである。画像を与えられたシンソウモデルはそれがリンゴであることを私たちと同じように色合いや形から判定しているとは限らない。このことをバッと押し広げてみてみれば、深層モデルが世界のうちに発見してくるパターンが、私たちのリアルと一致する保証はまったくないということでもある。その深層モデル独自の自然種を私たちが反省することはできるのだろうか? というかそもそも、この深層モデルは私たちとは違う自然種を用いているだなんてどうやってわかるのか。

 これはクワインが提示した翻訳の不確定性indeterminacy of translationに通じる。二つの言語間の正しい翻訳なるものはただ一つではなく、複数の可能な翻訳ルールが存在するというものである。未知の部族がウサギを見て「ガヴァガイ!」というからといってそれが「ウサギ」という意味とは限らない。「ご先祖様が来てくれたぞ」と言っているのかもしれない。

 クワインが言いたいことはそもそも私たちがあぶり出そうとしている「真の意味内容」などないのではないか、ということだ。私たちはある種のストーリーを深層モデルの内に見出すかもしれないが、結局解釈の一つに過ぎない。だからもうAIがうまくやっているならそれでいいだろうという気分にもなってくる。とはいえ、あるモデルをよそへ売り出すときに「さあ説明せよ」と言われたら、よその人間に向けてどう説明しろと言うのか。成功事例を見せればいい、というのは所詮内部の人間の感覚である。私たちはこれまでの章で見て来たようなベイズ統計や古典統計などのお話を語るかもしれない。しかしそれは最終的には、形而上学的なお話にほかならず、成功しているとはいいがたいのだった。とはいえ、それは役に立つお話であり、その答えが客観性を欠くものであったとしても容易に切りすぎてることはできない、アカウンタビリティを果たす一つの方法を提供する。

 

 

 

統計学入門 (基礎統計学Ⅰ)

統計学入門 (基礎統計学Ⅰ)

  • 発売日: 1991/07/09
  • メディア: 単行本
 

 

にんじんと読む「統計学を哲学する(大塚淳)」🥕 第四章①

carrot-lanthanum0812.hatenablog.com

第四章 モデル選択と深層学習(①)

 私たちはこれまで、まるで事象の背後にある斉一性=確率モデルが真実と近ければそれが一番よいのだという風に話をしてきた。だが、「予測」に絞って考えれば、実は真実から遠い確率モデルのほうが的確なのである。一定のデータが与えられた時、それに合わせて背後の確率モデルのパラメータを調整するのだが(モデル適合ないし学習と呼ぶ)、この典型的なやり方が最小二乗法least squares methodであった。どのような手法を用いるにせよ、それらはデータをモデルに適合させることだけだって、モデル自体が正しいかどうかには言及していないことに注意しなければならない。

 モデル選択model selectionは極めて重要だが、一体いかにして行うのか。代表的なのは赤池弘次の情報量基準AICである。詳しいことは省くが、ともかくこれに従うと、選択される良いモデルというものは「真実の姿よりゆがめたもの」である。これは一見パラドクシカルに映るかもしれないが、たとえばニュートン力学が理想的な状況を想定して考察していたことを思い出せばそう不審なものではない。逆に言えば、いくつかの個別性を無視しなければ、何もわからない。物理学において「牛はボールだと思え」である(物理学者はマルがお好き (ハヤカワ文庫・NF))。

 そしてこのことは、統計学存在論を見直すきっかけを与える。私たちひとりひとりの人間は原子の集まりとして記述することもできる。だがなぜそうしないのか。それは世界の描写としては正確かもしれないが、説明や予測を行うのには言葉が過ぎるからだ。家に住み着いたツバメが秋には出て行くだろうという予測を、原子レベルの記述がどうして可能とするだろう。ダニエル・デネットは抜き出される類型をリアル・パターンと呼んだ。ツバメという自然種は特定の文脈において予測に寄与するリアル・パターンである。だから確率種にしても厳密から荒っぽいのまで階層性がある。「関数がどんな形をしているか予測するんでしょ。線形的って、そんなわかりやすい形してるわけないよね」と言いたくなっても、そのとき私たちのいう「厳密な形」が説明に役立つとは限らない。AICはデータからリアル・パターンを予測するのだ。

 ここには二つの「リアル」がある。ホントウに近いリアルと、予測に役立つリアル。

 この二つを区別することは重要である。AIC統計学における実在の意義を後者に捉え直そうとする。私たちが統計学をはじめたとき、背後に控える確率モデルを想定しなければならなかったが、それは帰納的推論に必要だという目的のためであって、そもそも統計学というのは最初から道具主義的な側面がある。だとすればAICがもたらした方針転換は首尾一貫しているといえよう。統計学をこのように捉え直すと、科学もその姿を変える。科学は世界がどのようであるかよりも、どのようになるかを探るものになる。ベーコンが述べたように「知は力なり」だ。これはプラグマティズムpragmatismに通ずるもので、ウィルアム・ジェイムズは、真理とは役立つ観念にほからないと言った。ここで大事なことは「役立つ」というのは文脈によって変わることであり、AICはいくらデータが増えようが(無限でも)、「コレ!」というものが選び出されるわけではない。人間にとってカレーの匂いを捉えるのはまともなパターンだが、イヌにとってはカレーでは粗すぎるかもしれない。プラグマティズム実在論は、認識者が異なれば、異なったリアル・パターンを浮き出させる。

 

思考の技法 -直観ポンプと77の思考術-
 
自由の余地

自由の余地

 

 

にんじんと読む「統計学を哲学する(大塚淳)」🥕 第三章②

第三章 古典統計(②)

 仮説検定という検査装置はその仮説自体については何も言わない。棄却するかしないかを、設定した許容範囲で判定をしてくれるが、しかし仮説自体については正しいとも正しくないともいわないのである。こうした事情から検定理論の生みの親であるネイマンは、統計学帰納推論というより帰納行動の理論だと言った。帰納推論はデータから真偽を判定するが、そうではなく、不確実な状況下で私たちの行動をガイドするひとつの指針として統計学を見たのである。私たちは明日も明後日も水を火にかければ湯が沸くと思っている。それはひとつの習慣であり、この習慣がふだん私たちのガイドを行なっている。検定理論はさまざまな案内人の信頼性を見積もるという意味で、「案内人の案内人」の役目を果たすというのである。

 統計学帰納行動の理論とするこの見方が私たちを満足させるものであるかどうかは、私たちがそれに何を期待しているかによる。検定理論が生み出された当時は大量生産品の品質管理が主な目的であり、質の悪いものを出荷するリスクを限りなく小さくすることが肝心なことだった。しかし、たとえば新薬開発において期待されていることは、どれぐらい信頼できる薬を生み出すかではなく、薬が効くか効かないかである。しかし帰納行動の理論は、個別的な仮説の成否については何も言うことができない。帰納行動の理論としての統計学が関わるのはその検定手段の長期的信頼性なのだが、ではズバリその薬は、その製品は、に関する判断は正当化してくれないのだろうか。

 ベイズ主義は主観主義と密接なかかわりがあり、その正当化にあたっては内在主義的な見方が採用されたのだった。しかし正当化の概念に対する考え方は外在的なものもある。この対案はゲティア問題Gettier problemという反例によって生じて来たものである。このゲティア問題においては、「一見正当化されているようにみえる真なる信念」でありながら「直観的には知識とはみなされない」ような例を取り扱っている。

部屋には時計がないのでいつも窓から見える時計台を確認している。正午には席を立って食事に行くことにしており、いつも通り席を立った。そして実際その時は正午であり、食堂にはたくさんの人がいた。ところが部屋に帰ると、時計台はまだ正午である。実はメンテナンスで針が止まっていたのである! ———あなたは「今は正午だ」と知っていたのだろうか?

 内在主義的観点から見れば、明らかに「正午だ」は正当化されている。しかも実際、その時は正午だったのである。だが私たちは、彼が正午だと知っていたと満足に言えるだろうか? 知識というより、偶然の一致ではないか? つまり内在主義の正当化の考え方では「まぐれあたり」を完全には予防できていないのである。

 これをいかに修正するか。無論、正午だという信念の得られ方を問題にするのが自然だろう。止まった時計を見て正午だと思ってしまったのだから。止まった時計は信頼できる情報源ではない。ここにおいて、正当化に関する信頼性主義という見方が起きる。つまり、『ある信念が正当化されるか否かは、それがどのようなプロセスによって形成されたのかによって決まる。信念形成プロセスが信頼のおけるものかどうかが大事である。たとえば、あなたの友人がコーヒーを一日三杯以上飲むと脳卒中のリスクが下がると信じていたとする。「どこで知ったの?」と尋ねると「権威ある学術誌に掲載された大規模メタアナリシスの結果だ」と言い返して来たら「ホンマでっかTVで見た」よりよほど信用できる。つまりテレビより学術誌のほうが正しい情報を伝えてくれる割合が高い、という意味である。同様に、停止した時計が正しい時刻を伝えてくれる可能性は大変低い。

 信頼性主義は正当性を主体の外側に要請する点で外在主義的である。正しい情報を伝えてくれる割合が高いというのは主観的な信念ではなく、客観的な事実として捉えなければならないことに注意しよう。

 

 だがそうしたときに問題なのはそのプロセスが信頼できるとは具体的にどういうことなのかということである。SさんがPを信じていたとしよう。ロバート・ノージック曰く、これが知識と呼ばれるためには、Pであるという事実をしっかり「追跡track」していることである。:

  1.  Pが真じゃなかったら、SさんはPと信じなかった
  2.  Pが真だったら、SさんはPと信じた

 言い換えれば、SさんはPかどうかに応じて信念を形成しているということである。この見方はゲティア問題を回避できる。なぜなら止まっている時計台によって時間を判断していた誰かは、実際に正午でなかったとしても、正午だと信じ続けるだろうからだ。これで(1)の条件に引っ掛かり、知識とは認められなくなる。ノージックの追跡理論は信頼性主義とは別の文脈で提起されたものであるが、これら条件を信頼できるプロセスの条件として読み替えることは可能である。

 たとえば青空を見ているとしよう。私は「空が青い」ことを知っている。視覚というプロセスを通じて青いという判断を下した。もし空が暗ければ、私は青いとは思わなかっただろう。では何か音が鳴って「ドだな」と思ったとしよう。しかし実際はファだった。しかし私は相変わらずドだと信じ続けざるをえない。つまり私の音感は信頼できない。

 以上から何が言いたいかというと、検定というものは、一種の信念形成プロセスだということである。検定は二つに分かれていたことを思い出そう。主たる仮説の対立仮説が偽であるときそれをどれぐらいの確率で見抜けるかを決めて検定を行った。つまり対立仮説が真でなかったら、検定はそれを受け入れない。そして逆に真だったとしたら、検定はそれを受け入れただろう。具体的にいえば「サイズ」と「検出力」という検定理論的な概念はノージックの二つの条件を満たすかを示す指標になっている。検定理論は具体的な道具立てを与えてくれているのだ。

 しかしながら、問題はある。「Pが真じゃなかったら」というが、一体そんなものの真偽をどうやって確かめればいいのかということだ。この標準的な方法は、Pが真でないような世界を考えるという可能世界意味論possible world semanticsに訴えることだ。とはいえ、このことは正当化が現実世界だけからは決まらないことを意味する。即ち、あなたが何かを信じることの正当性は、その何かが成り立っていない世界においてあなたが何を信じているかという状況に依存する。では「私は鳥ではない」はどうなのか。自分が鳥だったときの世界などどうやってアクセスしろというのか。頻度主義においてはこの可能世界という考え方はどうしても必要になって来る(というのも、ある仮説を考える以上、その仮説が成り立たない世界も同時に考えるから)。頻度主義は可能世界のあり方を考える統計学なのだ。

 信頼性主義的な正当化は真理促進的である。つまり、信頼性主義においてはある信念が正当化されるというのはそれが外的な事実と一致するように信念を形成するプロセスによって生み出されたということだからだ。じゃあ検定の結果は鵜呑みにしていいかというとそんなことはない。検定がずさんであっては何の意味もない。ではずさんじゃないかどうかはどうやって保証するのか。それには仮説の対象に対して正しい統計モデルが立てられているという前提が必要である。単に検定の「結果」を見ているだけでは駄目で、「プロセス」にまでキッチリ目を向けないといけない。しかしこれが殊の外、大変なのである。

 たとえば「今日は空が青いなあ」と言う。視覚プロセスは信頼できる! ただし、青いフィルムが貼られていなければの話だが。検定理論においてはそうした外的条件をIID条件はもちろん、さまざまな仮定によって定式化する。だがその仮定が実際どうであるのかは完全に統計理論の範疇を超えている。信頼性を保証する条件は私たちから隠されており、成否を問い続けなければならない。頻度主義のこのあまりの「広さ」が、ベイズ主義から批判を受けるポイントでもある。たとえば停止規則問題stopping rule problemはその有名な例である。全く同じデータをもとにしながら、実験デザインの違いにより正反対の結果が出る。さらに一般性問題generality problemもある。停止規則問題が重箱の隅をつつくように思われたので、ベイズ主義者が繰り出してきた難問である。即ち、一言で「プロセス」といっても、それをどう描き出すかは人によるということだ。

 あなたがとある薬品について考えているとしよう。「この薬は味がしない!」これは単なる味覚プロセスによってしか与えられないだろうか。そんなことはない。「味覚障害を持たないヒトの味覚プロセス」といってもよいし、「味覚障害を持たないヒトが刺激物(昼食の激辛カレー)を食べた後での味覚プロセス」かもしれないし「多細胞生物が刺激受容細胞を通して異物を認識するプロセス」かもしれない。そこで問題は、どのプロセスを基準とするかだ。ふたつの検定プロセスのどっちを正しいとしますか、というのが停止規則問題だったともいえよう。これに対する応答は、まず開き直りがある。正当化概念というのは検定プロセスとセットでね、という。つまり絶対的で一意的な正当化などない。

 

 私たちは誰でも気軽に統計的正当化を行うことができるが、それが認識論的背景に即した意味での正当化になっているかが問題であり、まずその問題について自覚的にならなければならない。

 

現代認識論入門: ゲティア問題から徳認識論まで

現代認識論入門: ゲティア問題から徳認識論まで

 

 

にんじんと読む「統計学を哲学する(大塚淳)」🥕 第三章①

carrot-lanthanum0812.hatenablog.com

第三章 古典統計(①)

 ベイズ統計も古典統計も観測されたデータをもとにその背後にある確率モデルについて知ろうとする点においては同じだが、(1)主観主義vs頻度主義という確率についての意味論がまず異なり、(2)帰納推論についての考え方、もまた異なる。ベイズ統計においては、帰納推論とはデータに基づき確率モデルについての信念を調整していくことだったが、古典統計においてはまず仮説を立て、棄却または保持し、徐々に確率モデルに肉薄していくことなのである。

 まず頻度主義について見てみよう。たとえばコインの表が出る確率は1/2だと誰でも知っているが、頻度主義は、一定の試行を行った際にその事象が生じる回数を試行全体の回数で割ったものだと考える。とはいえ、コインを100回振れば、50回表が出るとは限らないのは当たり前の話である。だから頻度主義は確率を有限系列から無限に引き延ばす。確率とはその収束値なのである。実際、コイン投げの表の相対頻度は試行回数が増えるに従って1/2へと近づいていく。だから、確率は1/2なのである。

 というわけで、極限を用いて確率を定義することが出来る。ベイズ主義においては公理さえ満たしていればなんでも良かったのとは対照的である。もちろん、頻度主義における確率も、確率の公理を満たす。頻度主義の利点は確率を客観的に定めてしまえることにある。とはいえ、当然のように無限回の試行などできるわけもなく、あくまで仮定的なものに留まらざるを得ない。もちろん数学的には極限の値はそうなるとしても、いつそのコインの化けの皮が剝がれるかは、絶対保証できないからである。つまり、1000回目まではいい感じに進んでいたとしても、1001回目からは裏しか出なくなるかもしれない。するとその収束値は0である。これに対処するため、確率を定義する集まりのランダム性条件を仮定する必要があるが、なにがランダムなのかというのは恐ろしく厄介な話なので、これ以上の分析は確率の哲学理論 (ポスト・ケインジアン叢書)に譲ることにしよう。

 さて、頻度主義は確率をはっきりと定義することができたが、もちろん欠陥もある。何回もくり返し起こらないようなことに対しては、定義できない。一方、主観主義においてはそうではなかったことを思い起こそう。「恐竜が絶滅したのが〇年前だ」という命題にも確率を付与することが出来た。「明日は晴れだ」これにもできる。だが、頻度主義にはこれが出来ない。宇宙の歴史が無限回繰り返される結果を考えなければならないが、そんな想定は客観的意味をなさない。これに関連して、たとえば「このコインを投げて表が出る確率は1/2!」とはいえるが、「今投げるけど、表が出る確率は1/2だ」とはいえない。なぜなら今投げるのは一回限りのことだからだ。そしてまた、科学的仮説についても確率を考えることなど不可能である。ベイズ統計であれば実験をして修正をして、実験をして、とアップデートすることが可能だったが、古典統計は正しいか正しくないかであり、アップデートなどあり得ない。

 そこで現れるのが仮説検定である。これはポパー反証主義falsificationismに近いところがある。「まず仮説がある。データと突き合わせる。駄目なら捨てて新しいものを、良ければ””一応は””大丈夫」だ。このサバイバルゲームを繰り返すことの意味は、科学を、真理に近づいていくものというよりむしろ、間違いを斥けていくプロセスとして描き出すことにある。これは、仮説をもとにして見たデータが正しく合致しているからといって仮説が正しいとは限らないが、データが合わなければ仮説はまちがいだというのは論理的に正しい、ということを利用したゲームだ。

 しかし実際の科学的仮説がここまで強力な予測をすることはほとんどない。たとえば『喫煙は肺がんの原因である』という仮説は、ヘビースモーカーのくせに肺がんにならない人間を見つけてしまったが最後、間違いとして棄却されるわけではない。われわれが併せて考えるべきなのは、その仮説がもし間違いだった場合にそのデータが得られる確率である。検定はこの二つの仮説を同時に検証することで、棄却すべきか否かを判定する。手続きとしては棄却域critical region、つまりどれぐらいの確率であれば仮説を切るかの取り決めをしておかなければならない。とはいえ、この取り決めはこっちが勝手に決めるのだから、間違う可能性がある。棄却してはいけないものを棄却することを第一種の誤りと呼び、棄却し損なうことを第二種の誤りと呼ぶ。この誤りのどちらからも完全に逃れることはできない。ふたつはトレードオフの関係にある、即ち、一方を避けようとすれば一方の危険が高まるのだ。