データ分布からのパターン推定。
人間の言語習得の文脈で頻繁に対比されるのが、言語習得は生得的な能力として行われるのか、一般的な経験から得る学習能力で行われるのかと言う問いである。
この問いの中で経験から学習すると考える経験主義者たちはその論拠として、言語の中の一定のパターンを統計的に学習することで、これだけ豊かな言語表現を理解もしくは産出可能になると考える場合が多い。
この言語に関する統計的学習の研究は語の分節化(word segmentation)の分野から盛んになった。語の文節化とは一連の発話の中から語の区切れ目を見つけ出す作業のことである。一連の発話の中に語の区切れ目は明示されていない。
例えば、英語で I have a pen. と書くときは空白によって語の区切れ目が明示されている。しかし、発話の中では当然この4つの単語は1つなぎの音で連続して産出される。
これを分割するのが語の分節化(word segmentation)である。
この語の文節化を幼児が習得するさいに使っていると思われるのが語の遷移確率(trasitional probability)と呼ばれる者である。
参考文献
- 畠山雄二. (2017). 最新理論言語学用語事典.