DU'BLOG

月度归档： 2020 年 1 月

selenium +PhantomJS自动发布带图文微博（涉及图片上传 autoit操作）
from selenium import webdriver from bs4 import BeautifulSoup import time import os from selenium.webdriver.common.desired_capabilities import DesiredC […]

iamdu2020-01-10Python
selenium +PhantomJS自动发布微博
from selenium import webdriver from bs4 import BeautifulSoup import time from selenium.webdriver.common.desired_capabilities import DesiredCapabilitie […]

iamdu2020-01-09Python
selenium 实现自动登录微博并发布内容
from selenium import webdriver from bs4 import BeautifulSoup import time # browser = webdriver.PhantomJS() browser = webdriver.Chrome() browser.get(‘h […]

iamdu2020-01-09Python
python文本分析与可视化利器—wordcloud库使用
wordcloud是功能强大的词云展示第三方库。它不仅可根据文本中词语出现的频率等参数绘制词云，还可设定词云的字体,颜色,形状等。需要注意的是，wordcloud库在运行时，需要用到一些依赖库：包括matplotlib库以及图像处理库pillow库。因此，使用该库之前，务必先装好依赖库。和其他第三方 […]

iamdu2020-01-08Python
Python 利用you-get 库下载B站视频
import sys from you_get import common as you_get #导入you-get库 directory = r’F:\pydemo’ #设置下载目录 url = ‘https://www.bilibili.com/video/av36631527/?spm_id […]

iamdu2020-01-08Python
一行Python代码过滤标点符号等特殊字符
原文地址：https://www.jb51.net/article/167471.htm 很多时候我们需要过滤掉标点符号等特殊字符，网上虽然有一堆的方法，但是都没有找到一个非常满意的，有些过滤不了中文的标点符号，有些过滤不了英文的标点符号，有些过滤不全。最后通过查看正则表达式文档，发现一个高效的办 […]

iamdu2020-01-08Python
scrapy 利用fiddler抓包批量下载【掌通家园】APP图片
关键点，利用fiddler抓取手机app里的数据接口参数抓取后的数据爬虫处理文件deal.py import scrapy import bs4 import random import csv import requests import json from ..items import ne […]

iamdu2020-01-07Python
scrapy 域名过滤。DEBUG: Filtered offsite request to 解决方案
在做爬虫项目时，出现了一个问题，解析一个网站二次爬取时没有获取到数据，就写了一个测试程序试了下，测试程序如下 import scrapy from scrapy.linkextractors import LinkExtractor from scrapy.spiders import CrawlS […]

iamdu2020-01-07Python
scrapy 抓取app 掌通家园图文页面
接口需要通过fiddler来抓包获取，下载下来的图片是原始高清大图无水印爬虫处理页面deal.py import scrapy import bs4 import csv from ..items import newsfoto2Item # 需要引用mrleItem，它在items里面。因为是i […]

iamdu2020-01-07Python
Selenium+PhantomJS使用时报错原因及解决方案
UserWarning: Selenium support for PhantomJS has been deprecated, please use headless versions of Chrome or Firefox instead warnings.warn(‘Seleni […]

iamdu2020-01-05Python

月度归档： 2020 年 1 月

云服务器大促销

明道云零代码企业应用平台

文章分类

最新文章

赞助商

文章归档

联系站长

友情链接

其他入口

QQ与微信加好友