個人の知識活動支援のためのテキストコンテンツの効率的な関連検索
1 はじめに
企業や大学の研究室では,あるプロジェクトやテーマについて新たなアイデアを創出し,それを成果へと昇華させる知識活動が日々行われている.その活動の中で,メモ(覚書)を書くことは個人の思考を文章化する最も一般的な行為である.日々のアイデアをメモに書き出し,その内容をノートに整理する.そして,それをアイデア出しやそのブラッシュアップを目的としたプロジェクトのミーティングやゼミ発表といった議論の場に提示し,それらの議論の内容を参考に新たなアイデアを創出する.このメモとその整理を行うという過程は知識活動において非常に重要な役割を担っており,外山は,メモおよびそれをまとめたノートの整理によって作られる特別なノートをメタ・ノートと呼んでいる.これらメモ(およびノート)やメタ・ノートは,後々にその内容を振り返ることで当時の思考過程を思い返したり,新たなアイデアを創出することに役立つ.しかし,思考・整理・ミーティングへの提示を経て,その成果がミーティングの議事録に記されるまでの過程で,その成果と元のメモに記されていた内容の関連性は時間と共に失われていく.そのため,ある内容の元になったメモを参照することが困難になり,過去の思考内容の想起や,過去の議論を踏まえた議論の妨げになる.
本研究では,メモの一部を引用して構造化したコンテンツをメタ・ノートとし,メモとメタ・ノートおよびミーティングの議事録といったテキスト中心のコンテンツに対して,それらに含まれるテキストの参照関係を記録し,その関係を用いてコンテンツの関連検索を行う.これにより,過去の思考過程を容易に振り返ることを可能にし,個人の知識活動を支援することを目的とする.
2 映像と論文の部分引用関係に基づく映像アノテーション
本研究では,アイデアをメモに書き,整理し,議論し,それを基にまた新たなアイデアを考えるというサイクルを知識活動として捉え,そのサイクルを創出,整理,議論という3つのフェーズから成るものであると定義する.
-
創出
-
整理
-
議論
創出によってメモが,整理によってメタ・ノートが,そして議論によって議事録が生成される.メモはテキストの文字列情報のみを持つ.そして,本研究におけるメタ・ノートにはその文字列情報に加え,テキストの色やサイズといった属性や,テキスト間の親子関係といった構造情報も記される.議事録には更に,テキストの提示者(=議論における発言者)や提案や疑問といった文章内容についての属性,ミーティングそのものの分類といった情報も含まれる.これらのコンテンツが知識活動サイクルの中で相互に活用されることで,より良い知識活動が行えると考えられる.
3 CTSシステムによる知識活動サイクルの実現
前章で定義した知識活動サイクルを実現するために,我々はCTS(Continuous Thinking Support)システムを考案した.
CTSシステムは,iSticky,コンテンツサーバ,TimeMachineBoard(以後,TMBと表記)の3つから構成される.iStickyは,主に創出・整理フェーズを支援するアプリケーションで,メモおよびメタ・ノートを作成・編集する機能を持つ.いつでも手軽に創出・整理を行えるようにするため,iStickyはタブレットデバイスに組み込まれている.iStickyで作成したコンテンツは,コンテンツサーバと呼ばれるデータベースサーバで管理される.TMBは,カジュアルなミーティングにフォーカスした会議支援システムで,議論フェーズにおける議論および議事録の作成を支援する.このシステムは議題や議論内容を大型ディスプレイに表示するボード,ボードに文章や画像を送信してそれらを操作するクライアント,議論の過程や議事録を記録するデータベースから成る.CTSシステムでは,iStickyにTMBのクライアントとしての機能を持たせることで,両者を連携させている.また,TMBで記録した議事録をiStickyで閲覧することができる.iStickyでアイデアをメモに書き出し,内容の整理を経てメタ・ノートを作成し,TMBによるミーティングでその内容について議論し,議論内容を議事録として記録する.その後,iStickyで議事録を閲覧して,その内容を踏まえて新たに創出を行う.このような流れによって,知識活動サイクルを実現する.
このシステムでは,メモからメタ・ノートへ,メタ・ノートからボード(コンテンツとしては議事録)へ,議事録からメモへテキストを取り込むことができる.この取り込むという操作,すなわちあるコンテンツが別のコンテンツのテキストを参照する行為をシステムが把握しているため,コンテンツ間の文章の関連を記録することができる.
4 テキストの参照情報に基づくコンテンツ間の関連検索
先に述べたように,ある思考や議論を行う際に,その内容の元になったコンテンツを探すことは容易ではない.この問題を,コンテンツの閲覧中に関連するコンテンツを容易に検索する手法により解決する.
iStickyでテキストの参照を行う際に,「どのコンテンツのどの位置にあるテキストを,どのコンテンツのどの位置に取り込んだか」という情報をメタデータとして保存する.このメタデータによって関係付けられたコンテンツを関連コンテンツとする.
こうして関連付けられたコンテンツを容易に検索・閲覧する機能をiStickyに追加した
図のように,iSticky上でメモの閲覧中に関連コンテンツが参照できる.コンテンツの閲覧時に,その中のテキストを選択することでメタデータによって関連付けられたコンテンツのサムネイルが表示され,関連付けられたテキストがハイライトされる.このサムネイルを選択すると,当該コンテンツの閲覧・編集画面に移行することができる.システムの使用者は,「この内容は,元々どういう内容でどんな議論を行ったか」または「この内容が,その後どのような過程で変化していったのか」ということを知りたいとき,これら関連するコンテンツを閲覧することで,着目した内容についての過去の思考過程を振り返ることができる.
この検索手法について,関連コンテンツを見つけるために単純なキーワード検索を行わない理由として2点挙げることができる.1点は,ある文章をキーとしてマッチングする文章が見つかったとしても,その文章が本当に関係ある文章であるという保証がないということ.もう1点は,コンテンツ内のテキストは編集過程で改変される可能性が高いため,テキスト検索でヒットしない可能性があるということである.その点,テキストの参照情報は文章の改変に依存しないものであるため,コンテンツが編集されても適切な検索を行うことができる.
5 まとめ
本研究では,個人の思考に関する知識活動サイクルを定義し,そのサイクルで生まれるテキストコンテンツとそれらの関連に基づく検索手法を提案した.今後は,この手法の運用によって得られたデータを分析し,その有用性を評価することを課題の一つとする.
その他の応用としては,文章以外の画像や手書きの図についても同様に参照情報を取得したり,参照情報を用いてコンテンツの繋がりを可視化するといったことを検討している.また,今回は個人の活動にフォーカスしていたが,これをグループ単位に拡張し,より広範囲な知識活動支援に適用することができると考えられる.