Alice in Wonderland における “the”の分布の定常性.
先日からAlice in Wonderland の分析を行なっている.
前回は分布の可視化をしてみたが,今回は時系列データとしての分析を行なってみた.
すると,“the”の分布に定常性が認められた.
以下に実行したコードと結果を示す.(前回のコードの続きであるという前提)
# カラム名の確認
print(df.columns)
# カラム名が 'Word_Index' と 'Occurrence' であることを確認
data = df.copy()
# Word_Indexをインデックスとして設定
if 'Word_Index' in data.columns:
data.set_index('Word_Index', inplace=True)
else:
print("Error: 'Word_Index' column not found")
# ADF検定
adf_result = adfuller(data['Occurrence'])
print('ADF Statistic:', adf_result[0])
print('p-value:', adf_result[1])
ADF Statistic: -25.641994662010042
p-value: 0.0
参考文献
- 田中久美子 (2021)『言語とフラクタル-使用の集積の中にある偶然と必然-』 東京大学出版会.
- https://www.gutenberg.org/files/11/11-h/11-h.htm