知識科学を知る64のキーワード, 紀伊国屋書店, 分担執筆 Chapter 5. 知のオデッセイ -ネットワークの海図を描く- 57 ネットワーク生態系  [ネットワークはどう自己増殖していくか] ▼ 世間は意外に狭い お互い他人どうしの2人が少し話をしてみたら, 知人の知人くらいを通じて 接点があったということはよく経験することである. 我々の想像以上に世間 は狭い. 統計的には, 6人の知人を介して人々は結び付いており, WWWでは任 意の2つのホーム頁が19回のリンクを介してつながっていることがわかって いる. 実は, 一見無秩序に活動している人間社会やインターネットなどの自律的な ネットワークの構造には, このような「小さな世界」と呼ばれる共通の特徴 (*a)がひそんでいるのである. ▼ インターネットのアキレス腱 '98年, サンタフェ研究所のWattsとStrogatzにより, WWWをはじめ, インター ネットのルータやドメインの結合関係, 俳優の共演関係, 論文の引用, 電力 網, 神経回路網などのさまざまな現実のネットワークは, これまでの研究で 主として扱われてきた規則正しい結合構造でもランダムでもなく, 両者の中 間的な「小さな世界」の特徴をもつことが明らかになった. さらにこれらの現実的なネットワークは, 結合数の疎密な部分が混在する という特徴を持ち, 結合数の少ない非常に多くの頂点と, 結合数が非常に多 い(ハブ的な)ごく少数の頂点からなる「べき乗則」の分布に従う. 統計物理学者Barabasiらはさらに驚くことに, このような「べき乗則」に 従うネットワークが, 単純なたった2つの原理によって生成できることを理 論的に示した. その原理は, 自律的に新たな頂点が追加され続け, 新しい辺 はより多くの辺を持つ頂点に結合しやすい(*b)というもので, 自然現象や社 会現象における多くの対象に当てはまりそうな自然なものである(実際, 「べき乗則」は, 先のWWWや俳優の共演関係などの全ての例で確認され, 自 律成長ネットワーク\footnote{どこか特別な司令塔/司令官がいるわけでな く, それそれがお互いの関係だけで自らネットワークを構成して成長してい くもの.}における普遍則だと考えられている). ただし, 「べき乗則」に従う結合特徴にも欠点はある. 不幸にも, ハブ的 な頂点に相当するサーバがハッカーなどから攻撃されると, ネットワークは 極度にバラバラな状態に分断されてしまう. もちろん, 巨大なネットワーク からそうしたハブを見つけるのは一般に困難なので, すぐに壊滅的な状況が 起きることは予想しがたい. しかしながら, 我々のライフラインの一部としてインターネットはもはや 欠かせないものなので, 自然界の生物の関係連鎖や生息分布のような「生態 系」として, その結合特徴や重要箇所を分析抽出するWebology(*c)の研究は 重要であり, 欧米諸国を中心に近年脚光を浴びている. ▼ うわさの伝搬やウィルスの駆除を科学する ネットワークの研究には, 「小さな世界」や「べき乗則」などの構造的な 特徴のみならず, 伝搬の速さや広がりに関する解析も重要となる. 一般にはあまり広く知られていないことと思われるが, 有名な検索エンジ ンGoogleのPageRankアルゴリズムも, WWW上のランダムウォークによって滞 在率が高い頁を評価する(技術的には遷移行列の優固有ベクトルを求める) ことで検索精度を上げており, 本質的には拡散伝搬\footnote{物質上に熱源 を置いた場合, しばらく時間が経過すると全体が均一な温度になるように, ある頂点から接続辺を介して順に情報が伝わって, 全体に広がること.}の 計算をしていることに相当する. さて, 本論に戻ろう. 統計物理では, さまざな格子上の頂点や辺がでたら めに結合してできる連結部分領域\footnote{例えば, 白黒の碁石を適当に碁 盤の上に並べたとき, 黒石でつながった島の領域ができる. このような島の 部分のことをさす.}(クラスターと呼ばれる)が, ある結合確率を境につな がって, 全体が1つになる現象について理論解析されている. 例えば, 平面 内の点の場合, 平均で5本以上の辺を持てば, 無限に広がった領域ができる. したがって, もし各人が確実に5人以上に話を伝えていけば, それは(あっ という間に)世間全体に広がってしまうのである. これを広告などの宣伝に 使えば効果は抜群であろうし(本書の内容のアピールにも出来れば協力して 頂ければ大変嬉しいが), ウィルスなど悪意な目的に用いれば大きな被害を 生む. 著者らも, WWWのようなネットワークでは, 一様にランダムな結合の場合よ り若干多い5本のリンクを平均的に持てば, 全体の90%以上に情報が蔓延す ることや, 蔓延するまでの時間はネットワークの規模に依存しないことをシ ミュレーションを通じて見つけている. さらに, WWW以外の俳優の共演関係(うわさの広がりに相当)や電力網など も, 同様な特性を持つ. 一方, ランダムな結合の場合は, 蔓延に必要な平均 辺数は3本で, 一様な広がり方をするので規模に比例した時間が必要となる. また, 駆除ソフトとの鼬ごっこの中でコンピュータウィルスの蔓延を防ぐに は, どのようにネットワークを分断・隔離して制御すればよいかなどについ ても検討をはじめている. ▼ フロンティア領域に参入しよう しかしながら, 規則的な格子モデルの理論解析ではなく, 自律的に成長す る(「べき乗則」に従う)実際的なネットワークに関する研究はまだ始まっ たばかりであり, より多くの優秀な研究者がこのフロンティア領域に参入す ることを期待したい. また, 新規産業創出の可能性を秘めたこのようなネットワーク生態系の応 用に対しても, コンピュータネットワークに限らずライフラインの設計や災 害時の復旧などに関わる多くの実務的な課題(環境や生態系の保護も含まれ るだろう)に興味を持つ, 産業界の技術者や先見の明のある経営者からの支 援をお願いしたい. *a: 規則正しい構造でも全くランダムでもなく, それぞれ両者の良い特 徴: 比較的よくクラスター化(相互に結合した塊のような部分が 多数存在)されており, かつ, 任意の2頂点間の距離が短い, を持 つことを明らかにした. 詳細はNature Vol.393, pp. 440-442を参 照されたい. *b: 身近な例で言い換えれば, お金持ちほどより裕福になる傾向がある こと. 富の分布でも, ごく少数の金持ちと大多数の貧民で構成され るような, 「べき乗則」に従う. Nature Vol.406, pp. 378-382も 参照されたい. *c: Webology = Information Ecologies + the World Wide Web 米国西海岸のゼロックスPARC研究所の計算機科学者や理論物理学者 らが提唱した考え方で, コンピュータネットワークの結合特徴や サーバの分布などを生態系として捉え解析することを指す. Feature Reference Book [つながりの科学 -パーコレーション-] 小田垣 孝 著 裳華房 ポピュラーサイエンス 216, 2000 選定理由 本書は, パーコレーション = 浸透による「つながり」が持つ特徴を平易に 解説したものである. 理論的に深い内容をあえて抑え, さまざまな現象を多 くの図を用いて紹介している. 星や生命の誕生, 連鎖反応や液状化など, 素粒子論, 宇宙物理, 生物, 化学, 材料科学(高分子フィルター), 地球科学(温暖化による海面上昇, 石油採 掘など)をはじめ, うわさ, 災害対策(国土計画), 動物保護(道路による 生態系の分断を最小限にする)などの社会問題への幅広い応用が期待される. ------------------------------------------------------------------- 56 情報幾何学 [異分野融合の新たな観点] ▼ 情報の幾何学とは? 情報と言えば, 0と1のビット列で表現されたコンピュータの世界を連想す るだろう. そこには, 論理, アルゴリズム(算法), 代数とった理論が基礎 となる. また, 通信などにおける不確実な情報の量を考えれば確率統計が, 観測データに対するシステム制御の分野では解析学がその土台となる. 一方, 幾何学に基礎を置く理論は以外に少ない. しかしながら, 我々が日常体験するように(おそらく脳内の情報表現や処 理では), ある一連の情報は連続的につながっているし, ある情報はある情 報に近いなど, まさに幾何学的である. 理論研究でも統計の分野では, 既に1945年に確率分布の全体をリーマン空間 (*a)として捉える構想があったが, その後なかなか具体的な成果は得られな かった. ▼ 情報幾何学の進展 情報幾何学は, このような動機をもとに, 先の確率分布の空間に関する理 論を発展させることで, 統計推論の常套手段である「最尤推定法」が何故よ いのかを明らかにした. さらに, その双対な幾何学構造(*b)は, 統計学のみ ならず, システム理論, 情報理論, ニューラルネットの学習, 数理計画の最 適化法, 数理物理の可積分系(*c), 量子観測理論などさまざまな分野に進展 して, 強力な数理解析の方法論を与えている. 情報幾何学では, あるパラメータ値に対する確率密度関数や制御システムあ るいはニューラルネットワークモデルなどが, 空間上の1つの点に対応する. したがって, 異なるパラメータ値のモデルは別の点に対応する. また, そう したモデルがなす空間は曲がったり距離尺度が一定でないものではあるが, モデルの集まりの中でモデルどうしの近さ(距離)を考えることで, それら に共通した幾何学的な扱いが可能となり科学的な議論ができる. そこで情報 幾何学が活躍する. 例えば, 観測データを最もよく近似するパラメータ推定の問題は, 観測デー タとモデルとの距離を最小化するもので, 幾何学的には観測データからモデ ル空間へ直交射影した点におけるパラメータ値を求めることに相当する. 別 の見方では, 距離を評価関数(目的関数とも呼ばれる)とすれば最適化の問 題に帰着するし, データ提示毎に反復的にパラメータを修正すれば学習過程 ともみなせる. さらに, 観測データが部分的にしか得られない場合に, デー タからのパラメータ値の推定(m-step)と, そのパラメータ値を持つモデルが 生成するデータの期待値による欠測部分の補間(e-step)を, 繰り返しながら 解を求めるEMアルゴリズムなどにも応用されている. ▼ さらに新しい試みとして 著者は, 情報幾何学の分布関数がある変数変換を通じて, あいまいな意思 決定を表すファジィ平均化(*d), および, 個人選考や市場シェアを表すマー ケティングモデル(生産関数など)に一致することを指摘した. また, インターネットなどにおける情報探索でも, 人々はさまざまな目的や 観点に従った判断を意識的あるいは無意識に行っていることに着目し, 視点 の重要度に応じて情報の関連性を動的に生成する情報探索の支援モデルに, 情報幾何学を具体的に応用している. さらに別の課題として, 分散ネットワーク上のコンピュータの性能の違い が, リーマン空間的な場所ごとの距離尺度の違いとして表現できそうなこと から, 性能の異なるコンピュータ間の負荷を均一化して, ネットワーク上の 複数のコンピュータで効率的に問題を解く手法なども検討している. ▼ 異分野融合は温故知新 以上, 情報幾何学はこれまで全く異なる分野: 統計 通信, 制御, 最適設 計, 数理物理, さらに, あいまい意思決定, 分散コンピューティングなどと 密接な関係を持ち, 現在もそれぞれの分野でこの方向からの検討が粛々と進 められている. 20世紀後半からコンピュータとネットワークが急成長し, インターネットの ような抽象的な空間も日常的に接する, 実在化したとも言える世界となって きた. 目に見えないミクロな分子や遺伝子の世界や, 相対性理論の重力によ る曲がった宇宙空間とて, すでに実在する対象とは言いがたく, 我々は必然 的に抽象的な空間(対象世界)を考えざるを得ないように思われる. そうした対象をより理解するためにモデルを考えるのだと思えば, 人類の英 知としての難解な数学や抽象的な議論が役立つことも納得できよう. 科学技術が高度化, 細分化した現在, よりいっそう異分野の共通点を見出す 必要があるのかも知れない. 歴史を振り返っても, 何の苦労もなく無から有は生まれるはずもなく, 単 なる寄せ集めの分野からも新しい概念や方法論は生まれてこない. 既成にと らわれず, 物事の見方から創りなおす努力や, 表現や対象にとらわれず, 本 質を見極める洞察力を磨くしかない. 情報幾何学というアプローチには, 次世代に向けたそうした可能性が秘めら れているように思う. *a: 場所ごとに長さの尺度が異なる, 相対論で扱われた非ユークリッド (三角形の内角の和が180度にならない)空間. 例えば, ガリバー 旅行記に登場する小人の国と巨人の国を連想されたい. *b: 相異なる互いに双対な2つの座標系があって, 両者を合わせて考え ると, ピタゴラスの定理などユークリッド空間に類似した性質が成 り立つ構造. 紙面の都合で詳細は述べられないが, 甘利, 長岡: 情報幾何の方法, 岩波講座 応用数学[対象12]を参されたい. *c: ソリトンなど非線形のある変数変換によって厳密解が導ける性質の よい力学系のクラス. 近年, 行列の固有値や連立方程式などに対す る高速な数値計算法と共通する数理構造を持つ連続版として, アル ゴリズム開発の観点からも注目を集めている. *d: 全ての条件や属性を満たすANDと, どれか1つを満たせばよいORと いう論理的判断の, 中間を表す平均値関数. 応用例としては, 消費 者が出しても良いと思う値段が, 高いと思う値段と安いと思う値段 の, 算術平均, 幾何平均, 調和平均など, 商品ごとに異なって決め られているという調査報告がある. Feature Reference Book [電子情報通信と数学] 大石 進一 編著 (社)電子情報通信学会, 1998 選定理由 技術的に興味ある事柄の仕組みは数学的に簡潔に美しく表現され, 逆に数学 によって記述された理論が思わぬ新しい現象を予見することはしばしば起る. 本書は, 数学を軸に電子情報通信分野の全貌を概観したもので, 情報幾何学 のみならず, 短編的に各分野のトピックスを楽しみながら読むことができる. ------------------------------------------------------------------- < 執筆者紹介 > 氏名: 林 幸雄 役職: 助教授 講座: 知識システム構築論講座 主な論文: Yukio Hayashi, Diffusion property of dynamically generated scale-free networks. Proc. of the 7th Artificial Life and Robotics, Vol.1, pp.332-335, (2002). 林 幸雄, グラフのLaplace-Beltrami作用素とその応用, 京大数理解析研・研究集会「数理最適化の理論とアルゴリ ズム」, RIMS講究録 No. 1241, pp. 39-47, (2001). Yukio Hayashi, A New Relation between Information Geometry and Convex Programming - Coincidence with the Gradient Vectors for the Divergence and a Modified Barrier Function. IEICE Trans. on Fudamantals, Vol.E84-A, No.9, pp.2238-2246, (2001). 林 幸雄, 関係の分布空間上の視点に応じた情報探索法, 電子情報通信学会論文誌A, Vol.J83-A, No.2, pp. 217-229, (2000). 林 幸雄, データベースの数理モデルの視点パラメータの 推定と関数空間におけるモデル拡張. 情報処理学会論文誌, Vol.39, No.6, pp. 1-11, (1998). 自己紹介 専門は数理工学で, ニューラルネットや力学系の研究から連続的なつながり に着目し, 最近は分散システムの拡散系に熱中. ネットワークは中央集権の対極なので, 地域社会や, ボランティア計算など にも興味を持つ.