分析コードをまとめていく.疑問文の割合編


前回に続いて,コードをまとめる.

今回はテキスト内の疑問文の割合にフォーカスをして分析をする.

import matplotlib.pyplot as plt
import nltk

def plot_question_sentence_ratio(text):
    """
    テキスト内の疑問文の割合を棒グラフでプロットする関数
    """
    sentences = nltk.sent_tokenize(text)
    question_sentences = [sentence for sentence in sentences if sentence.endswith('?')]
    question_ratio = len(question_sentences) / len(sentences) if len(sentences) > 0 else 0

    plt.figure(figsize=(8, 6))
    plt.bar(['Question Sentences', 'Other Sentences'], [question_ratio, 1 - question_ratio], color=['#66b3ff', '#ff9999'])
    plt.ylabel('Proportion')
    plt.title('Proportion of Question Sentences')
    plt.ylim(0, 1)
    plt.show()

# 疑問文の割合のプロット
plot_question_sentence_ratio(processed_text)

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です