​python中jieba库函数怎么使用

avatar
作者
猴君
阅读量:0

jieba库是一个用于中文分词的工具库。下面是一些常见的jieba库函数用法示例:

  1. 分词
import jieba # 全模式分词 text = "我爱自然语言处理" result = jieba.cut(text, cut_all=True) print("/".join(result))  # 输出:我/爱/自然/自然语言/语言/处理 # 精确模式分词 result = jieba.cut(text, cut_all=False) print("/".join(result))  # 输出:我/爱/自然语言处理 # 默认模式分词(精确模式的别名) result = jieba.cut(text) print("/".join(result))  # 输出:我/爱/自然语言处理 # 搜索引擎模式分词 result = jieba.cut_for_search(text) print("/".join(result))  # 输出:我/爱/自然/语言/处理 
  1. 添加自定义词典
import jieba text = "我是自然语言处理工程师" result = jieba.cut(text) print("/".join(result))  # 输出:我/是/自然/语言/处理/工程师 # 添加自定义词典 jieba.add_word("自然语言处理") result = jieba.cut(text) print("/".join(result))  # 输出:我/是/自然语言处理/工程师 # 添加自定义词典(指定词频) jieba.add_word("自然语言处理", freq=100) result = jieba.cut(text) print("/".join(result))  # 输出:我/是/自然语言处理/工程师 
  1. 关键词提取
import jieba.analyse text = "我是一名自然语言处理工程师,对文本处理很感兴趣。" keywords = jieba.analyse.extract_tags(text, topK=3) print(keywords)  # 输出:['自然语言处理', '文本处理', '感兴趣'] 

以上是jieba库的一些常见用法,更多详细的函数用法可以参考jieba官方文档。

广告一刻

为您即时展示最新活动产品广告消息,让您随时掌握产品活动新动态!