R语言怎么进行情感分析和词频统计

作者

首页»
云计算»
知识库»
R语言怎么进行情感分析和词频统计

发布时间:2024-07-13 15:37

阅读量:0

在R语言中进行情感分析和词频统计通常需要使用一些额外的包，例如tm和sentimentr。以下是一个简单的示例代码，可以进行情感分析和词频统计：

# 安装和加载必要的包 install.packages("tm") install.packages("sentimentr") library(tm) library(sentimentr)  # 创建一个文本向量 text <- c("这个电影非常好看，情节紵紵有致，演员表现也很出色。",           "这个餐厅的服务太差了，食物也不好吃。")  # 创建一个语料库 corpus <- VCorpus(VectorSource(text))  # 进行文本预处理 corpus <- tm_map(corpus, content_transformer(tolower)) corpus <- tm_map(corpus, removePunctuation) corpus <- tm_map(corpus, removeNumbers) corpus <- tm_map(corpus, removeWords, stopwords("en"))  # 进行情感分析 sentiment <- sentiment(corpus)  # 输出情感分析结果 print(sentiment$all)  # 进行词频统计 tdm <- TermDocumentMatrix(corpus) freq <- rowSums(as.matrix(tdm)) freq <- subset(freq, freq > 0) freq <- sort(freq, decreasing = TRUE)  # 输出词频统计结果 print(freq)