Alice in Wonderland における “the”の出現の時系列分析.
先日からAlice in Wonderland の分析を行なっている.
今回は小説を時系列データのように扱い, “the”の出現に関して季節性の分析を行なってみた.
以下に実行したコードと結果を示す.(前回のコードの続きであるという前提)
import pandas as pd
import matplotlib.pyplot as plt
from statsmodels.tsa.seasonal import seasonal_decompose
# カラム名の確認
data = df.copy()
# 季節性分解
result = seasonal_decompose(data['Occurrence'], model='additive', period=3000)
result.plot()
plt.show()
それぞれの項目は下記である.
1. トレンド(Trend): データの長期的な傾向を示すものである。これは、データが時間とともに増加または減少するパターンを捉えるものである。
2. 季節性(Seasonality): データの周期的な変動を示すものである。例えば、月ごとの売上データにおける年内の季節的な変動などが含まれる。
3. 残差(Residuals): トレンドと季節性を取り除いた後に残るランダムな成分である。これはデータのランダムなノイズや予測不能な変動を示すものである。
参考文献
- https://www.gutenberg.org/files/11/11-h/11-h.htm