主页 > 知识库 > 详解用python实现爬取CSDN热门评论URL并存入redis

详解用python实现爬取CSDN热门评论URL并存入redis

热门标签:原装电话机器人 平顶山外呼系统免费 江苏客服外呼系统厂家 清远360地图标注方法 400电话申请服务商选什么 西藏智能外呼系统五星服务 工厂智能电话机器人 在哪里办理400电话号码 千阳自动外呼系统

一、配置webdriver

下载谷歌浏览器驱动,并配置好

import time
import random
from PIL import Image
from selenium import webdriver
from selenium.webdriver.common.by import By
from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC
if __name__ == '__main__':
  options = webdriver.ChromeOptions()
  options.binary_location = r'C:\Users\hhh\AppData\Local\Google\Chrome\Application\谷歌浏览器.exe'
  # driver=webdriver.Chrome(executable_path=r'D:\360Chrome\chromedriver\chromedriver.exe')
  driver = webdriver.Chrome(options=options)
  #以java模块为例
  driver.get('https://www.csdn.net/nav/java')
  for i in range(1,20):
    driver.execute_script("window.scrollTo(0, document.body.scrollHeight)")
    time.sleep(2)

二、获取URL

from bs4 import BeautifulSoup
from lxml import etree 
html = etree.HTML(driver.page_source)
# soup = BeautifulSoup(html, 'lxml')
# soup_herf=soup.find_all("#feedlist_id > li:nth-child(1) > div > div > h2 > a")
# soup_herf
title = html.xpath('//*[@id="feedlist_id"]/li/div/div/h2/a/@href')

可以看到,一下爬取了很多,速度非常快

三、写入Redis

导入redis包后,配置redis端口和redis数据库,用rpush函数写入
打开redis

import redis
r_link = redis.Redis(port='6379', host='localhost', decode_responses=True, db=1)
for u in title:
    print("准备写入{}".format(u))
    r_link.rpush("csdn_url", u)
    print("{}写入成功!".format(u))
print('=' * 30, '\n', "共计写入url:{}个".format(len(title)), '\n', '=' * 30)

大功告成!

在Redis Desktop Manager中可以看到,爬取和写入都是非常的快。


要使用只需用rpop出栈就OK

one_url = r_link.rpop("csdn_url)")
while one_url:
  print("{}被弹出!".format(one_url))

到此这篇关于详解用python实现爬取CSDN热门评论URL并存入redis的文章就介绍到这了,更多相关python爬取URL内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!

您可能感兴趣的文章:
  • python 爬取京东指定商品评论并进行情感分析
  • python爬取晋江文学城小说评论(情绪分析)
  • 利用Python网络爬虫爬取各大音乐评论的代码
  • python 利用百度API进行淘宝评论关键词提取
  • python 爬取腾讯视频评论的实现步骤
  • python爬取微博评论的实例讲解
  • python实现模拟器爬取抖音评论数据的示例代码
  • 如何基于Python爬取隐秘的角落评论
  • Python实现爬取并分析电商评论
  • python 爬取马蜂窝景点翻页文字评论的实现
  • 用Python爬取QQ音乐评论并制成词云图的实例
  • python 爬取华为应用市场评论

标签:日照 随州 锦州 白城 股票 天水 西安 安庆

巨人网络通讯声明:本文标题《详解用python实现爬取CSDN热门评论URL并存入redis》,本文关键词  详解,用,python,实现,爬取,;如发现本文内容存在版权问题,烦请提供相关信息告之我们,我们将及时沟通与处理。本站内容系统采集于网络,涉及言论、版权与本站无关。
  • 相关文章
  • 下面列出与本文章《详解用python实现爬取CSDN热门评论URL并存入redis》相关的同类信息!
  • 本页收集关于详解用python实现爬取CSDN热门评论URL并存入redis的相关信息资讯供网民参考!
  • 推荐文章