主页 > 知识库 > Python爬虫分析微博热搜关键词的实现代码

Python爬虫分析微博热搜关键词的实现代码

热门标签:外呼系统前面有录音播放吗 400电话办理费用收费 千呼ai电话机器人免费 柳州正规电销机器人收费 申请办个400电话号码 镇江人工外呼系统供应商 深圳网络外呼系统代理商 腾讯地图标注有什么版本 高德地图标注字母

1,使用到的第三方库
requests
BeautifulSoup 美味汤
worldcloud 词云
jieba 中文分词
matplotlib 绘图
2,代码实现部分

import requests
import wordcloud
import jieba
from bs4 import BeautifulSoup
from matplotlib import pyplot as plt
from pylab import mpl

#设置字体
mpl.rcParams['font.sans-serif'] = ['SimHei']
mpl.rcParams['axes.unicode_minus'] = False

url = 'https://s.weibo.com/top/summary?Refer=top_hottopnav=1wvr=6'

try:
  #获取数据
  r = requests.get(url)
  r.raise_for_status()
  r.encoding = r.apparent_encoding
  soup = BeautifulSoup(r.text,'html.parser')
  data = soup.find_all('a')
  d_list = []
  for item in data:
    d_list.append(item.text)
  words = d_list[4:-11:]
  #中文分词
  result = list(jieba.cut(words[0]))
  for word in words[1::]:
    result.extend(jieba.cut(word))
  redata = []
  for it in result:
    if len(it) = 1:
      continue
    else:
      redata.append(it)
  result_str = ' '.join(redata)
  #输出词云图
  font = r'C:\Windows\Fonts\simhei.ttf'
  w = wordcloud.WordCloud(font_path=font,width=600,height=400)
  w.generate(result_str)
  w.to_file('微博热搜关键词词云.png')
  key = list(set(redata))
  x,y = [],[]
  #筛选数据
  for st in key:
    count = redata.count(st)
    if count = 1:
      continue
    else:
      x.append(st)
      y.append(count)
  x.sort()
  y.sort()
  #绘制结果图
  plt.plot(x,y)
  plt.show()
except Exception as e:
  print(e)

 

3,运行结果


到此这篇关于Python爬虫分析微博热搜关键词的文章就介绍到这了,更多相关Python爬虫微博热搜内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!

您可能感兴趣的文章:
  • python一些性能分析的技巧
  • Python性能分析工具py-spy原理用法解析
  • Python内置类型性能分析过程实例
  • Python性能分析工具Profile使用实例
  • cProfile Python性能分析工具使用详解
  • Python中判断子串存在的性能比较及分析总结
  • 使用pycallgraph分析python代码函数调用流程以及框架解析
  • 使用bandit对目标python代码进行安全函数扫描的案例分析
  • python中delattr删除对象方法的代码分析
  • python3中确保枚举值代码分析
  • python如何做代码性能分析

标签:乌兰察布 哈尔滨 合肥 海南 平顶山 乌兰察布 郴州 大庆

巨人网络通讯声明:本文标题《Python爬虫分析微博热搜关键词的实现代码》,本文关键词  Python,爬虫,分析,微博,热搜,;如发现本文内容存在版权问题,烦请提供相关信息告之我们,我们将及时沟通与处理。本站内容系统采集于网络,涉及言论、版权与本站无关。
  • 相关文章
  • 下面列出与本文章《Python爬虫分析微博热搜关键词的实现代码》相关的同类信息!
  • 本页收集关于Python爬虫分析微博热搜关键词的实现代码的相关信息资讯供网民参考!
  • 推荐文章