コーパス中に一度だけ出現する単語


ヒトは語を生産的に使用できるものである, それは毎日のように生み出される新語を思い浮かべれば, イメージが付くであろう.

そういった生産的な語形成を研究する際にはhapax legomenonと呼ばれる, コーパス中に一度だけ出現する単語が重要な役割を担う.なぜならば, 使用頻度の低い単語ほど語形成の“生産性”を示す指標になりやすいからである.

ここからHamzai (2019)に基づいて具体的に見ていくこととする. 形態論研究においてP=n1/Nという式が用いられる. n1はhapax legomenonの数,Nはその単語群全体の出現数を指し,n1が多ければ生産性が高いとみなされる仕組みである.

たとえば法学系の学習者による文章を分析すると, 名詞複合語は数が多い反面, コーパス全体での出現率が高いため生産性は低く測定される場合がある. 一方, あまり登場しない動詞複合語にはhapax legomenonが含まれやすく, 生産性を示す値が高くなる傾向が報告されている. このようにhapax legomenonは, 語彙がいかに新たな形態を生み出しているかを捉えるうえで不可欠な手がかりとなるのである.

参考文献

  • Hamzai, J. (2019). An Investigation of Morphological Productivity of Nominal and Verbal Compounds in Legal Discourse.

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です