にんじんブログ

にんじんの生活・勉強の記録です。

MENU にんじんコンテンツを一望しよう!「3CS」

にんじんと読む「統計学を哲学する(大塚淳)」🥕 第四章①

carrot-lanthanum0812.hatenablog.com

第四章 モデル選択と深層学習(①)

 私たちはこれまで、まるで事象の背後にある斉一性=確率モデルが真実と近ければそれが一番よいのだという風に話をしてきた。だが、「予測」に絞って考えれば、実は真実から遠い確率モデルのほうが的確なのである。一定のデータが与えられた時、それに合わせて背後の確率モデルのパラメータを調整するのだが(モデル適合ないし学習と呼ぶ)、この典型的なやり方が最小二乗法least squares methodであった。どのような手法を用いるにせよ、それらはデータをモデルに適合させることだけだって、モデル自体が正しいかどうかには言及していないことに注意しなければならない。

 モデル選択model selectionは極めて重要だが、一体いかにして行うのか。代表的なのは赤池弘次の情報量基準AICである。詳しいことは省くが、ともかくこれに従うと、選択される良いモデルというものは「真実の姿よりゆがめたもの」である。これは一見パラドクシカルに映るかもしれないが、たとえばニュートン力学が理想的な状況を想定して考察していたことを思い出せばそう不審なものではない。逆に言えば、いくつかの個別性を無視しなければ、何もわからない。物理学において「牛はボールだと思え」である(物理学者はマルがお好き (ハヤカワ文庫・NF))。

 そしてこのことは、統計学存在論を見直すきっかけを与える。私たちひとりひとりの人間は原子の集まりとして記述することもできる。だがなぜそうしないのか。それは世界の描写としては正確かもしれないが、説明や予測を行うのには言葉が過ぎるからだ。家に住み着いたツバメが秋には出て行くだろうという予測を、原子レベルの記述がどうして可能とするだろう。ダニエル・デネットは抜き出される類型をリアル・パターンと呼んだ。ツバメという自然種は特定の文脈において予測に寄与するリアル・パターンである。だから確率種にしても厳密から荒っぽいのまで階層性がある。「関数がどんな形をしているか予測するんでしょ。線形的って、そんなわかりやすい形してるわけないよね」と言いたくなっても、そのとき私たちのいう「厳密な形」が説明に役立つとは限らない。AICはデータからリアル・パターンを予測するのだ。

 ここには二つの「リアル」がある。ホントウに近いリアルと、予測に役立つリアル。

 この二つを区別することは重要である。AIC統計学における実在の意義を後者に捉え直そうとする。私たちが統計学をはじめたとき、背後に控える確率モデルを想定しなければならなかったが、それは帰納的推論に必要だという目的のためであって、そもそも統計学というのは最初から道具主義的な側面がある。だとすればAICがもたらした方針転換は首尾一貫しているといえよう。統計学をこのように捉え直すと、科学もその姿を変える。科学は世界がどのようであるかよりも、どのようになるかを探るものになる。ベーコンが述べたように「知は力なり」だ。これはプラグマティズムpragmatismに通ずるもので、ウィルアム・ジェイムズは、真理とは役立つ観念にほからないと言った。ここで大事なことは「役立つ」というのは文脈によって変わることであり、AICはいくらデータが増えようが(無限でも)、「コレ!」というものが選び出されるわけではない。人間にとってカレーの匂いを捉えるのはまともなパターンだが、イヌにとってはカレーでは粗すぎるかもしれない。プラグマティズム実在論は、認識者が異なれば、異なったリアル・パターンを浮き出させる。

 

思考の技法 -直観ポンプと77の思考術-
 
自由の余地

自由の余地