ディスカッションマイニング:議事録集合からの知識発見

PDF
友部 博教
名古屋大学大学院 情報科学研究科
長尾 確
名古屋大学 エコトピア科学研究機構

1 はじめに

ディスカッションマイニングは、人間同士の知識交換の場であるミーティングにおける活動を記録し、構造化された議事録データを半自動的に生成し、そこから再利用可能な知識を抽出する技術である。蓄積された議事録間には同一あるいは類似テーマという関係付けを行うことができ、類似性計算を行ったり意味的情報(アノテーション)を付与したりすることによって、議事録集合を構造的に表現することができる。

本研究では議事録集合からの知識発見を目指し、蓄積された議事録集合を構造的に表現し、その構造を用いることで重要議事録の発見や関連議事録の発見、そして関連する議事録集合の統合を行った。

2 議事録の作成

会議支援や議事録作成の研究ではミーティングブラウザのように映像や音声の自動認識技術を用いることが多い。ディスカッションマイニングでは、複数のカメラとマイクロフォン、ブラウザベースのツールを用いて実世界の活動(ここでは会議)を収録する。発表者は専用のツールを用いて、自分が発表に用いるスライドやスライドを切替えるタイミングなどを伝達することで、自動的にこれらの情報を議事録に記録する。また、発言内容は書記が専用ツールを用いて記録する。参加者が発言する際には、議論札と呼ばれる札型のデバイスを用いることで、発言者のIDと発言タイプ(質問、回答、コメント)を伝達し、書記の議事録作成を支援するとともに議論の構造化を補助する。使用したスライド、Web資料のURLなどの情報も自動的に議事録に取り込まれ、半自動的に議論が構造化された議事録を生成する仕組みになっている。

議論の記録はXMLとMPEG-4によるマルチメディア議事録としてデータベースに記録される。記録された内容は、Webブラウザを用いて検索・閲覧が可能となっている。議事録では各発言をノードとし、関連があるノード同士にはリンクが張られたグラフとして表現され、グラフは簡単な操作で編集を行うことができる。各発言ノードにはそれに対応する映像と音声がリンクされ、ブラウザ上で再生することができる。これによって、閲覧者は自分に必要な情報を取捨選択して、議論の内容を容易に理解することが可能になる(図 )。

本システムではブレインストーミング等の発表を主体にした議論を対象としているので、個々の発言をほぼ対等に扱うことができるため、比較的容易に構造化できる。構造的アプローチによるグループウェアの代表格であるgIBISのように、議論構造をグラフ状で表示することによって議論内容の把握を容易にしたり、会議の場で有効な発言を促す効果があると考えられる。

議事録の閲覧画面

図1: 議事録の閲覧画面

この議論構造を用いて重要発言を発見することができる。重要発言からリンクがある発言や、重要発言にリンクしている発言は重要であると考えられるので、活性伝播を用いて発言の重要度を計算した。発言の重要度は次式の活性伝播のモデルを用いる。

活性伝播のモデル

図2: 活性伝播のモデル

Atは活性値、Rはネットワーク接続行列、ρは減衰定数、Iは単位行列である。この式を用いて活性値が収束するまで繰り返し計算し、収束した値を重要度とした。また、このように計算された発言の重要度の平均値を議事録の重要度とすることによって、重要議事録を発見することができる。

3 議事録集合の構造化

議事録間には同一あるいは類似のテーマであるという関連性があるため、この関連性に基づいて議事録集合を構造化することができる。そこで、蓄積された議事録集合の構造を鳥瞰できる議事録マップを生成した(図)。

議事録マップでは、それぞれの議事録をノードとし、関連する議事録へのリンクを持ったグラフで議事録集合の構造を表現している。蓄積された議事録のテキスト情報(書記が入力した発言内容と、発表に用いたスライド資料に含まれるテキスト)を用いて自然言語処理を行い、類似度が一定の閾値を超えた場合に、リンクを自動的に張る。

また、議事録マップの閲覧者は簡単な操作で議事録集合の構造を編集することができる。二つの議事録間に関連があると判断した場合には、議事録ノードを関連付けする対象のノードへドラッグすることで、二つの議事録間にリンクを張ることができる。議事録の概要はマウスポインタでポイントするとポップアップするので、その情報を参照にしながら関連付けを行うことができる。

議事録マップ

図3: 議事録マップ

4 関連議事録の統合

議事録を閲覧する際、関連する議事録があればそれを閲覧することでより理解が深まる。また、関連する議事録集合を閲覧することによって、そのテーマに関する一連の議論の流れを掴むことができる。

そこで、関連する議事録集合において重要な発言を抽出することで議事録集合の統合を行い、ユーザの議事録閲覧を支援するシステムを構築した。

議事録集合の統合は、以下の手順で行う。

  1. 関連議事録の収集

    構造化された議事録集合から、ターゲットとなる議事録とリンクを持つ議事録を収集する。

  2. 議事録中の重要発言抽出

    収集した議事録を時系列に並べ、それぞれの議事録から重要発言を抽出する。

  3. 類似発言の発見と関連付け

    抽出した重要発言から類似度の高いものを発見し、それらにリンクを付加する。

  4. 議事録集合における重要発言抽出

    類似する発言間に付加されたリンクを用いて、選択した議事録集合中の重要発言を抽出する。これらの発言の重要度は前述の計算法により算出され、閾値を超えたものが表示される。

5 まとめと今後の課題

本論文では、データベースとして蓄積された議事録集合を構造化し、関連する議事録集合を統合することで閲覧者の知識発見を支援するシステムについて述べた。

ディスカッションマイニングの今後の課題として以下のことがあげられる。

  • 意思決定を目的とする会議における議論構造の可視化や知識発見支援

  • 類似するテーマや議論を持つディスカッション・グループの発見支援のための議事録公開環境の整備