Alice in Wonderland における “the”の出現の時系列分析.


先日からAlice in Wonderland の分析を行なっている.

今回は小説を時系列データのように扱い, “the”の出現に関して季節性の分析を行なってみた.

以下に実行したコードと結果を示す.(前回のコードの続きであるという前提)

import pandas as pd
import matplotlib.pyplot as plt
from statsmodels.tsa.seasonal import seasonal_decompose



# カラム名の確認
data = df.copy()

# 季節性分解
result = seasonal_decompose(data['Occurrence'], model='additive', period=3000)
result.plot()
plt.show()

それぞれの項目は下記である.

1. トレンド(Trend): データの長期的な傾向を示すものである。これは、データが時間とともに増加または減少するパターンを捉えるものである。

2. 季節性(Seasonality): データの周期的な変動を示すものである。例えば、月ごとの売上データにおける年内の季節的な変動などが含まれる。

3. 残差(Residuals): トレンドと季節性を取り除いた後に残るランダムな成分である。これはデータのランダムなノイズや予測不能な変動を示すものである。

参考文献

  • https://www.gutenberg.org/files/11/11-h/11-h.htm

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です