Alice in Wonderland における “the”の分布の定常性.


先日からAlice in Wonderland の分析を行なっている.

前回は分布の可視化をしてみたが,今回は時系列データとしての分析を行なってみた.

すると,“the”の分布に定常性が認められた.

以下に実行したコードと結果を示す.(前回のコードの続きであるという前提)

# カラム名の確認
print(df.columns)

# カラム名が 'Word_Index' と 'Occurrence' であることを確認
data = df.copy()

# Word_Indexをインデックスとして設定
if 'Word_Index' in data.columns:
    data.set_index('Word_Index', inplace=True)
else:
    print("Error: 'Word_Index' column not found")

# ADF検定
adf_result = adfuller(data['Occurrence'])
print('ADF Statistic:', adf_result[0])
print('p-value:', adf_result[1])

ADF Statistic: -25.641994662010042

p-value: 0.0

参考文献

  • 田中久美子 (2021)『言語とフラクタル-使用の集積の中にある偶然と必然-』 東京大学出版会.
  • https://www.gutenberg.org/files/11/11-h/11-h.htm

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です