集合間距離
「情報」が織り成す世界の構造を調べるための数理的な物差しとして、集合間距離を考えます。
これまでの情報理論は、情報通信の観点から、符号の確率的・統計的な尺度を情報量として定義し、その応用において、データ圧縮や暗号などを含む高度な情報通信システムの実現に寄与するに留まらず、言語の数理的解析にも貢献しています。また、音声や画像などのパターン認識の研究分野では、情報のベクトル表現やベイズ推定の利用により、大規模な情報検索や分類が可能となっています。
しかし、人間が得意とする情報処理の中で、知的な推理、直感、閃きなどについては、現状の電子計算機の性能は遠く及ばず、今後、さらなる研究開発が必要です。そのために、「情報とは何か?」「知能とは何か?」という根源的な問いかけが重要です。それはまた、「生命とは何か?」の答えに至る道筋の一つにもなり得ます。
数理モデルの構築において、数学の根本に立ち返って考ようとすると、現代数学においては、何らかの「集合」として情報を表現することが当然のように思われます。なぜなら、「集合」は、「要素の集まりである」という単純さ故に、ベクトルやグラフなどの様々な数学的対象を「集合」の形式で表現し得るという汎用性を有するからです。そして、その量的尺度の一つとして、集合間距離を重視します。情報の類似性は集合間距離で評価できます。距離が長ければ似ていない。距離が短かいほど類似性が高く、距離が0になると同一の情報を表すとみなします。
そこで、本研究では要素間距離の冪平均に基づく距離関数を提案しています。いわゆる「Jaccard距離」や「Hausedorff距離」をも包含する範囲の広い概念ですから、様々な応用が期待されます。
いくつか単純な集合が与えられると、それだけから要素間の距離空間が導かれ、さらに集合間の距離空間を構築できます。集合、ベクトル、グラフなどの複合した階層的集合についても適用出来ます。そのような複雑な集合で知識体系を表現すると、知識習得や学習過程を数理的にモデル化することが可能になります。