R言語で感情分析と頻度分析!テキストマイニング入門

R言語を用いた感情分析と単語頻度の統計を行うには、通常、追加のパッケージが必要です。例えば、tmとsentimentrが挙げられます。以下は、感情分析と単語頻度の統計を行うための簡単なサンプルコードです。

# 安装和加载必要的包
install.packages("tm")
install.packages("sentimentr")
library(tm)
library(sentimentr)

# 创建一个文本向量
text <- c("这个电影非常好看,情节紵紵有致,演员表现也很出色。",
          "这个餐厅的服务太差了,食物也不好吃。")

# 创建一个语料库
corpus <- VCorpus(VectorSource(text))

# 进行文本预处理
corpus <- tm_map(corpus, content_transformer(tolower))
corpus <- tm_map(corpus, removePunctuation)
corpus <- tm_map(corpus, removeNumbers)
corpus <- tm_map(corpus, removeWords, stopwords("en"))

# 进行情感分析
sentiment <- sentiment(corpus)

# 输出情感分析结果
print(sentiment$all)

# 进行词频统计
tdm <- TermDocumentMatrix(corpus)
freq <- rowSums(as.matrix(tdm))
freq <- subset(freq, freq > 0)
freq <- sort(freq, decreasing = TRUE)

# 输出词频统计结果
print(freq)

このコードは、最初に2つのテキストを含むベクトルを作成し、それをコーパスに変換してテキストの前処理を行います。次に、sentimentrパッケージを使用して感情分析を行い、結果を出力します。最後に、tmパッケージのTermDocumentMatrix機能を使用して単語の出現頻度を統計し、結果を出力します。

このコードを使用することで、感情分析と単語の頻度統計を簡単に行うことができます。実際のニーズに応じて、コードをさらに修正や拡張することができます。

bannerAds