オンライン文書閲覧時のアノテーションを用いた論文作成支援システム

PDF
林 亮介
名古屋大学大学院 情報科学研究科
友部 博教
名古屋大学大学院 情報科学研究科
大平 茂輝
名古屋大学 エコトピア科学研究所
長尾 確
名古屋大学 情報メディア教育センター

1 はじめに

組織内外から膨大な情報を入手できるようになっている現在,日々蓄積される情報の中から,知識を抽出し,共有・活用することは重要な研究課題となっている.そのような背景から,文書などのコンテンツに対するアノテーションの研究が進められている.アノテーションとは,コンテンツに対してメタ情報を関連付け,従来困難であった高度な検索や要約などを実現する手法である。本研究では,オンライン文書の閲覧時に付与されるアノテーションを取得・利用して論文作成支援を行う.本研究では,文書閲覧時に付与されるアノテーションを閲覧時アノテーションと呼ぶ.閲覧時アノテーションとして,文書にマーカを引く行為,またはマーカ箇所に対するコメントを付与する行為に焦点を当てる.このようなアノテーションには文脈や個人の知識背景といった様々なコンテキストが含まれる.しかし,これまでのアノテーションでは,論文作成支援のような高度なアプリケーションへの利用は困難である.そこで本研究では,アノテーションの利用方法を考慮した形でアノテーションを取得し,高度なアプリケーションへの適用を試みる.

本論文では,まず,閲覧時アノテーションを取得するための仕組みである文書閲覧支援システムについて述べる.そして,閲覧時アノテーションを用いた応用例として,論文作成支援について述べる.

2 文書閲覧支援システム

システム構成図

図1: システム構成図

2.1 システム構成

本システムの構成図を図に示す.本システムは,オンライン文書の例であり,我々の研究室において作成・共有されているXML形式の論文を対象とする.Javascriptプログラム(クライアント側)はユーザサイドスクリプトを実行するInternet ExplorerプラグインであるTurnabout上で動作する.Turnaboutを利用することで,ユーザサイドの指定によりドメインごとに異なるスクリプトを実行することが可能になる.本システムの設計は,コンテンツはコンテンツ利用者の多様な利用法に対応可能な形で提供されるべきであるという思想に基づいている.

Javascriptプログラムは論文のXMLを受け取ると,ローカルにあるXSLを用いてHTMLに変換する.さらに,その論文の閲覧時アノテーションと辞書のXMLをAjaxを利用して受け取り,データをHTMLに埋め込む.ブラウザ上で行われたユーザの閲覧時アノテーションはXMLに変換される.そして,Ajaxを利用してサーバに送信され,データベースに保存される.

インタフェース画面

図2: インタフェース画面

2.2 文書閲覧支援機能

本研究では,アノテーションを取得するという過程において,ユーザに過度の負担をかけることは好ましくないと考えている.そこで,本システムは文書の閲覧を支援するという過程において,閲覧時アノテーションの取得を行っている.そのインタフェース画面を図に示す.本システムは文書の閲覧支援という観点において以下のような機能を有する.

2.2.1 マーカ機能

ブラウザ上で,マウス操作によりパラグラフ内の任意を文字列に対してマーカを引く機能である.マーカの色は三種類用意されている.Marshallは,マーキングや目印をつける行為は重要箇所の記録であると述べている.そこで,本システムではマーキング箇所がどの程度重要であるのかという点に注目して,次のようにマーカの色に属性を付与する.

  1. 赤色マーカ - 最も重要

  2. 青色マーカ - かなり重要

  3. 緑色マーカ - ある程度重要

2.2.2 コメント機能

マーカ範囲に対して,コメントを付与することが可能な機能である.本システムでは,マーカに含まれる文字列とコメントとの関係を明確にするという観点から,次の四種類の中から属性を付与することを可能にする.

  1. 説明 - マーカ箇所のまとめ,補足,用語説明

  2. アイディア - マーカ箇所より導き出された事柄

  3. 問題点 - マーカ箇所の問題点の指摘

  4. その他

2.2.3 辞書引き機能

マーカ箇所の文字列を自動的に形態素解析し,辞書引きを行う機能である.形態素単位に辞書情報を付与し表示する.研究室内の専門用語辞書とWikipediaを利用する.ユーザは辞書を編集したり,辞書にない語を辞書に追加登録できる.

2.2.4 モード切替機能

ユーザ個人の閲覧時アノテーションのみを表示するプライベートモードと他人の閲覧時アノテーションを表示するパブリックモードの切替機能である.ユーザ個人の閲覧時アノテーションは,既読文書を効率的に閲覧するためのトリガーに,他者の閲覧時アノテーションは未読文書を閲覧する際の文章理解の支援になると考えられる.

3 閲覧時アノテーションを用いた論文作成支援

閲覧時アノテーションは属性情報が付与されているため,様々な利用場面に応じた検索が可能である.例えば,自分の研究の新規性を示すために,他者の研究と対比して関連研究を書きたい場面がある.その場合,対比したい論文の該当箇所にマーカでマーキングし,自分の研究との差分をコメントし,問題点属性を付与する.その後,実際に論文を作成する際に,コメントの問題点属性を指定して検索する.また,アノテーション属性とキーワードを指定することにより,ユーザの文脈に適応した閲覧時アノテーションを検索することが可能である.さらに,検索された閲覧時アノテーションの一覧リストから,文章の流れや組み合わせを考えながら,文章を構成していくことができる.

一般に論文に専門用語を記述する場合,用語の説明を記述する.閲覧時に辞書引き機能で利用・拡張した研究室内の専門用語辞書を用いることで容易に用語の説明を引用することができる.辞書を利用することでユーザが自分の言葉で記述するより,説明に客観性と正確性を持たせることができると考えられる.さらに,専門用語辞書にない場合は説明を記述し,専門用語辞書に追加登録することができる.

閲覧時アノテーションを用いて論文を引用すると,引用論文と被引用論文の間に閲覧時アノテーションを用いてリンクを張ることが可能になる.このリンクには,被引用箇所,引用箇所,引用目的といった情報が含まれる.これらを論文の引用アノテーションと呼ぶ.引用アノテーションを用いることで,ユーザの論文の閲覧を支援することができる.例えば,ある分野において重要とされる論文を閲覧したとする.その際,引用アノテーションにより「この論文のこの箇所を引用して書かれた論文がある」という情報が論文のメタ情報として表示される.さらに,引用目的が付与されているため,引用している論文がどのような目的で引用したのかということが参照可能である.通常,引用方向へ向かってサーベイを行うが,ユーザはリンクを辿ることで,被引用方向へ向かう関連研究のサーベイを行うことが可能になる.

さらに,引用アノテーションが蓄積されていくことにより,論文コンテンツのネットワークが構築される.ネットワークを用いた応用例としては,論文の推薦や関連論文の自動収集などが挙げられる.

4 おわりに

本論文では,閲覧時アノテーションの取得について述べ,閲覧時アノテーションを用いた論文作成支援について述べた.今後の課題としては,まず,本論文で構築した論文作成支援システムの評価が挙げられる.

さらに,他者の閲覧時アノテーションを用いた応用例を検討する必要がある.本論文では,閲覧時アノテーションをユーザ個人で閉じた形で利用したが,ソーシャルブックマークのタグのように共有することによって可能になる応用を実現する必要がある.アノテーション共有による応用例は,マーカ情報を用いた文書の要約などが考えられる.