単語の特徴的な分布


以前に一瞬だけ紹介した『言語とフラクタル』という本をまたパラパラとめくっている. その中で非常に面白い内容が紹介されていた. テキスト中で特定の単語が現れた場所を可視化しているというものである. この本の中ではメルヴィルの「白鯨」を題材として, 文中に出てきた”the”という単語の出現位置を可視化していた. すると, ”the”が密集している区間とそうでない部分が現れた. Tanaka (2021) はこれを文脈の変化で説明している. まず, 不定冠詞で導入された概念がその後に議論の中心となり, ”the”が多用される. (私の予想だが)その後一定の議論が行われれば, その概念から別の概念へ議論は移るはずなので, ”the”の使用が落ちるということになると考えられる. この結果を踏まえてTanaka (2021) は直感的な一言として「塊現象」と呼んでいる. これは単語の出現に何かの規則性があるのではないかと考えられる現象である. このような現象は統計的な普遍性として現れる可能性があり, それをもって言語独自の普遍性と断定することは難しいであろう. しかしながら, 言語の本質に迫る試みであることには変わりなく非常に興味深い研究である.

参考文献

  • 田中久美子 (2021)『言語とフラクタル-使用の集積の中にある偶然と必然-』 東京大学出版会.

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です