Alice in Wonderland における文章の長さの自己相関.
先日からAlice in Wonderland の分析を行なっている.
今回は文章の長さに対して時系列と捉えて自己相関を出す練習をしてみた.
以下に実行したコードと結果を示す.(前回のコードの続きであるという前提)
from statsmodels.graphics.tsaplots import plot_acf, plot_pacf
# 自己相関と偏自己相関のプロット
def plot_acf_pacf(df, lags):
plt.figure(figsize=(12, 6))
plt.subplot(121)
plot_acf(df['Word_Count'], lags=lags, ax=plt.gca())
plt.subplot(122)
plot_pacf(df['Word_Count'], lags=lags, ax=plt.gca())
plt.show()
# 自己相関と偏自己相関のプロット
plot_acf_pacf(sentence_df, lags=20)
参考文献
- https://www.gutenberg.org/files/11/11-h/11-h.html