欢迎来到尧图网

客户服务 关于我们

您的位置:首页 > 财经 > 创投人物 > Python 从网页中提取文本内容,进行中文分词和词频统计,并生成词云图进行可视化

Python 从网页中提取文本内容,进行中文分词和词频统计,并生成词云图进行可视化

2024/10/26 18:40:47 来源:https://blog.csdn.net/huanghm88/article/details/143146604  浏览:    关键词:Python 从网页中提取文本内容,进行中文分词和词频统计,并生成词云图进行可视化

完整资料: https://download.csdn.net/download/huanghm88/89879439


"""  实训2 网页爬取与内容可视化  步骤4 基于wordcloud的词云图可视化  """
# 引入 collections 包、 request 包 、 jieba 包
import collections 
import requests 
import jieba
# 引入词云图绘制的 WordCloud 模块
from wordcloud import WordCloud# 步骤2 中实现的函数
# 定义函数,以一个字符串, input_string 作为输入,输出一个list,储存了input_string中所有连续的中文字串。
def get_words(input_string) :words = []buff = ''for c in document :if 0x4e00 <= ord(c) <=0x9fff :buff = buff + celif not buff == '' :words.append(buff)buff = ''if not buff == '' :words.append(buff)return words# 步

版权声明:

本网仅为发布的内容提供存储空间,不对发表、转载的内容提供任何形式的保证。凡本网注明“来源:XXX网络”的作品,均转载自其它媒体,著作权归作者所有,商业转载请联系作者获得授权,非商业转载请注明出处。

我们尊重并感谢每一位作者,均已注明文章来源和作者。如因作品内容、版权或其它问题,请及时与我们联系,联系邮箱:809451989@qq.com,投稿邮箱:809451989@qq.com