平成22年度 科研「情報爆発IT基盤」領域全体会合 参加報告

2週間ほどたってしまいましたが,微かに記憶があるうちにメモを...


当日は雨で,移動が大変でした.
でも,Google名誉会長の村上さんのGoogleの電力に関連するプロジェクトのお話や,喜連川先生の「情報爆発という言葉が一般に使われるようになってきた」というお話は面白かったです.

以下,一日目のポスターセッションで,特に印象に残ったもののメモです.二日目は参加できませんでした.

  • 情報爆発時代におけるサイバー空間情報定量評価基盤の構築

研究代表者 喜連川東京大学生産技術研究所・教授

    • サイバー空間におけるリンクスパム境界の検出手法

「サイバー空間情報定量」というものを用いて,リンクスパム・リンクハイジャックを自動検出する手法.

  • 情報爆発に対応するコンテンツ融合と操作環境融合に関する研究

研究代表者 田中克己 京都大学大学院・情報学研究科社会情報学専攻・教授

    • 関係の類似性に基づくWebからのオブジェクト検索

「広島とお好み焼きの関係と類似するような,香山に対するもの」という検索を実現する手法.検索結果としては,「うどん」が返ってくる.

  • 構造的言語処理による情報検索基盤技術の構築

研究代表者 黒橋 禎夫 京都大学・情報学研究科・教授

    • PLSIを用いたウェブ検索結果の要約

PLSIとEMアルゴリズムAICを用いてクラスタリングをし,PLSIと独自のスコアリングによって重要な要約文を作成する手法.

  • 情報ネットワークにおける大規模知識処理のための超高速アルゴリズムの研究

研究代表者 ツォイクマン トーマス 北海道大学情報科学研究科・教授

    • 知的情報検索における高速情報検索技術の研究

独自の圧縮方式「STVF符号」を用いて,NCD(Normarized Compression Distance)を使って類似度を計算し,近いものを検索する手法.

  • 自然言語テキスト意味概念の共通的記述によるWeb意味計算基盤

研究代表者 石塚満 東京大学情報理工学系研究科・教授

論文からコピペします.
潜在関係検索とは,単語ペア間の潜在的な関係を利用することにより,入力単語ペアと類似する単語ペアを検索する新しい検索パラダイムである.潜在関係検索エンジンの概要は図3.1に示している.クエリー「(Tokyo, Japan),(?,France)」が入力されたときに,「Paris」を最初にランキングされた結果リストを返す.その理由は,「Tokyo」と「Japan」の関係は「Paris」と「France」との関係に類似するからである(東京が日本の首都,パリもフランスの首都などの関係があるからである).

  • 高次元観測データからの大規模対象状態に関する未来予測と管理戦略策定手法の開発

研究代表者 鷲尾 隆 大阪大学・産業科学研究所・教授

    • 高次元状態空間未来予測問題点の解明

粒子フィルタを用いた超多次元未来予測の高精度化に関する研究.

  • 類義語検索とタグ付き自然言語検索を組み合わせた意外で価値ある情報の発見支援

研究代表者 鳥澤 健太郎 情報通信研究機構・言語基盤グループ・グループリーダー

    • 単語クラス制限付きのパターンを用いた汎用関係抽出エンジン

これも論文から引用です.
例えば,“インフルエンザの熱”のように,XとYが「病気」と「症状」のクラスに属するとすれば, 「X
のY」が因果関係を指す可能性が高いであろう.一方,“京都の清水寺” のように「地名」と「名所」のク
ラスだったらむしろ「所在地関係」になる. 「人物」と「作品」のクラスの場合(例えば,“Stephen King
小説”)はおそらく「作者・作品関係」もしくは「所有関係」を指す.

既に2回出ている,単語間関係の推定研究です.

    • 上位下位関係の日本語WordNetへの拡張手法

Wikipedia,学術研究でも使われているんですね.

  • コミュニティ型コンテンツのコンテンツホール検索に関する研究

研究代表者 灘本 明代 甲南大学・知能情報学部・准教授

    • コミュニティ型コンテンツの単語の曖昧性の解消

あれ,灘本さんって,元同僚の方でした...

こちらもWikipediaと,TF-IDFを使ってます.
コンテンツホールって何かと言うと,
従来の情報検索はユーザが求めている情報を探す類似検索が主流であるが,
本研究ではコミュニティ型コンテンツにおいてコミュニティ内で気づいていない情報つまりは「ないものを
探す」相違検索を目的とする. 「コミュニティ内で気づいていない情報」をコンテンツホールと呼ぶ.

だそうです.単語の類似度には,おなじみのコサイン類似度が使われているようです.

  • 情報爆発に対応する高度にスケーラブルでセキュアなソフトウェア構成・更新方式

研究代表者 柴山 悦哉 東京大学・情報基盤センター・教授

    • Webアプリケーションの脆弱性発見手法に関する研究

自動的に,セキュリティホールをもたらすテストを行う研究です.
SQLインジェクションカバレッジなんかは100%を目指しているそうです.