言語情報の分かりやすさ
人間の言語表現は分かりやすい時もあれば, 分かりにくい時もある.
端的に言えば, こうした「分かりやすさ」を研究する分野としてCoherence研究がある.
Coherence研究は, テキストの各構成要素が, 時間的順序や因果関係, 説明, 対比などの一貫性関係によって結び付けられることにより, 全体として意味がまとまり, 理解しやすくなる仕組みを明らかにする試みである.
例えば, 「私は多くの県を車で横断したい」と「可能な限り多くの山を見たい」という発話があり, その後「私が静岡県に到達したとき」や「富士山に立ち寄った」という文が続く場合, これらの文の間には交差依存性が生じ, 単純な連鎖ではなく複雑な構造を持つことが明らかとなる(Wolf & Gibson, 2006 を元に改変して引用). また, 複数の親を持つ節の例も示され, 一つの文が異なる文群と順接的または方法的に関連付けられることが, 木構造の限界を示す.
このような研究は, 自動情報抽出やテキスト要約などの実用的応用にも影響を及ぼすとともに, 従来の木構造では適切に表現できない構造を扱う手法として連鎖グラフの有用性を示唆している.
参考文献
- Wolf, F., & Gibson, E. (2006). Coherence in natural language: Data structures and applications. MIT Press.