LingPyで歴史言語学的分析を行う 3
引き続き, LingPyの使い方を概観する. 今回はトークン化と音韻クラスの変換を取り上げる.
これを行うことで, 定められたルールに従ったトークン化を実行し, さらには音韻クラスへの変換までが可能となる.
LingPyには多様な関数が備わっており, 非常に興味深い.
from lingpy import ipa2tokens, tokens2class
# 複雑な子音や長母音を含むIPA文字列 (例: ドイツ語 'schwarz' /ʃvaʁts/)
ipa_string = 'ʃvaʁts'
# 1. トークン化 (個々の音素要素に分割)
tokens = ipa2tokens(ipa_string)
# 2. 音韻クラスへの変換
sound_classes = tokens2class(tokens, model='dolgo')
print("--- トークン化と音韻クラス変換 ---")
print(f"元のIPA表記 : {ipa_string}")
print(f"トークン化 : {tokens}")
print(f"音韻クラス(dolgo): {sound_classes}")
参考文献
- List, Johann-Mattis and Forkel, Robert (2024): LingPy. A Python library for historical linguistics. Version 2.6.13. URL: https://lingpy.org, DOI: https://zenodo.org/badge/latestdoi/5137/lingpy/lingpy. With contributions by Simon Greenhill, Tiago Tresoldi, Christoph Rzymski, Gereon Kaiping, Steven Moran, Peter Bouda, Johannes Dellert, Taraka Rama, Frank Nagel, Patrick Elmer, Arne Rubehn. Passau: University of Passau.