分析コードをまとめていく.疑問文の割合編
前回に続いて,コードをまとめる.
今回はテキスト内の疑問文の割合にフォーカスをして分析をする.
import matplotlib.pyplot as plt
import nltk
def plot_question_sentence_ratio(text):
"""
テキスト内の疑問文の割合を棒グラフでプロットする関数
"""
sentences = nltk.sent_tokenize(text)
question_sentences = [sentence for sentence in sentences if sentence.endswith('?')]
question_ratio = len(question_sentences) / len(sentences) if len(sentences) > 0 else 0
plt.figure(figsize=(8, 6))
plt.bar(['Question Sentences', 'Other Sentences'], [question_ratio, 1 - question_ratio], color=['#66b3ff', '#ff9999'])
plt.ylabel('Proportion')
plt.title('Proportion of Question Sentences')
plt.ylim(0, 1)
plt.show()
# 疑問文の割合のプロット
plot_question_sentence_ratio(processed_text)