LingPyで歴史言語学的分析を行う 3


引き続き, LingPyの使い方を概観する. 今回はトークン化と音韻クラスの変換を取り上げる.

これを行うことで, 定められたルールに従ったトークン化を実行し, さらには音韻クラスへの変換までが可能となる.

LingPyには多様な関数が備わっており, 非常に興味深い.

from lingpy import ipa2tokens, tokens2class

# 複雑な子音や長母音を含むIPA文字列 (例: ドイツ語 'schwarz' /ʃvaʁts/)
ipa_string = 'ʃvaʁts'

# 1. トークン化 (個々の音素要素に分割)
tokens = ipa2tokens(ipa_string)

# 2. 音韻クラスへの変換
sound_classes = tokens2class(tokens, model='dolgo')

print("--- トークン化と音韻クラス変換 ---")
print(f"元のIPA表記      : {ipa_string}")
print(f"トークン化        : {tokens}")
print(f"音韻クラス(dolgo): {sound_classes}")

参考文献

  • List, Johann-Mattis and Forkel, Robert (2024): LingPy. A Python library for historical linguistics. Version 2.6.13. URL: https://lingpy.org, DOI: https://zenodo.org/badge/latestdoi/5137/lingpy/lingpy. With contributions by Simon Greenhill, Tiago Tresoldi, Christoph Rzymski, Gereon Kaiping, Steven Moran, Peter Bouda, Johannes Dellert, Taraka Rama, Frank Nagel, Patrick Elmer, Arne Rubehn. Passau: University of Passau.

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です