Python+BeautifulSoup抓取电影天堂影片下载地址

实现这样的功能:用户输入喜欢的电影名字,程序即可在电影天堂https://www.ygdy8.com爬取电影所对应的下载链接,并将下载链接打印出来。 #调用quote()函数 from urllib.parse import quote # 调用requests库 import requests # 调用BeautifulSoup库 from bs4 import BeautifulSoup # 模拟页头信息 fakeHeaders = {‘User-Agent’: “Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1; SV1; AcooBrowser; .NET CLR 1.1.4322; .NET CLR 2.0.50727)”} movie_name = input(‘请输入你需要搜索的电影名:’) # 将汉字,用gbk格式编码,赋值…

Read More

Python +BeautifulSoup 抓取豆瓣电影TOP250页面数据

#调用crv模块 最后把得到的数据写入crv import csv # 调用requests库 import requests # 调用BeautifulSoup库 from bs4 import BeautifulSoup # 模拟页头信息 fakeHeaders = {‘User-Agent’: “Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1; SV1; AcooBrowser; .NET CLR 1.1.4322; .NET CLR 2.0.50727)”} N = 10 #网站分页结构一样 代表扒10个页面 也就是扒到第10页 films2 = [] #空的数组来存储全部页数的数据 for i in range(1,N+1): start = (i-1)*25 #分页的页面变量 第1页是0 第2页25 第3页50…… #…

Read More

Python BeautifulSoup 抓取文章信息

# 调用requests库 import requests # 调用BeautifulSoup库 from bs4 import BeautifulSoup # 返回一个response对象,赋值给res res =requests.get(‘https://localprod.pandateacher.com/python-manuscript/crawler-html/spider-men5.0.html’) # 把res解析为字符串 html=res.text # 把网页解析为BeautifulSoup对象 soup = BeautifulSoup( html,’html.parser’) # 通过匹配属性class=’books’提取出我们想要的元素 items = soup.find_all(class_=’books’) # 遍历列表items for item in item…

Read More

Python中print函数中中逗号和加号的区别

先看看print中逗号和加号分别打印出来的效果.. 这里以Python3为例 1 print(“hello” + “world”) helloworld 1 print(“hello”, “world”) hello world 这里发现加号的作用是连接字符串 而逗号相当于用空格连接字符串。 尝试一下不同数据类型的操作.. 1 print(“hello” + 123) TypeError: must be str, not int 1 print(“hello”, 123) hello 123 这里发现加号在Str类型与Num类型相加的出现了类型错误 逗号连接正常并返回字符串结果。 总结: 加号 +…

Read More

UnicodeEncodeError: ‘gbk’ codec can’t encode character ‘\xa9’ in position 3738: illegal multibyte sequence Python报错解决方案

# 调用requests模块 import requests # 获取网页源代码,得到的res是response对象。 res = requests.get(‘https://localprod.pandateacher.com/python-manuscript/crawler-html/spider-men5.0.html’) # 检测请求是否正确响应 print(res.status_code) # 正确响应,进行读写操作 # 新建一个名为book的html文档,你看到这里的文件没加路径,它会被保存在程序运行的当前目录下。 # 字符串需要以w读写。你在学习open()函数时接触过它。 if res.status_code == 200: file = open(‘book.html’,’w’) # res.text是字符串格式,把它写入文件内。 file.write(res.text…

Read More

Python 远程下载图片

import requests res = requests.get(‘https://res.pandateacher.com/2018-12-18-10-43-07.png’) #发出请求,并把返回的结果放在变量res中 pic=res.content #把Reponse对象的内容以二进制数据的形式返回 photo = open(‘ppt.jpg’,’wb’) #新建了一个文件ppt.jpg,这里的文件没加路径,它会被保存在程序运行的当前目录下。 #图片内容需要以二进制wb读写。你在学习open()函数时接触过它。 photo.write(pic) #获取pic的二进制内容 photo.close() #关闭文件

Python 抽奖器代码

# 查看注释,运行代码。 import random import time # 将抽奖程序封装成函数 def choujiang(*ac): # 定义一个抽奖函数,不定长参数,也就是不限制人数个数 luckylist = [*ac] # 定义一个中奖名单的列表 a = random.choice(luckylist) # 在中奖名单里面随机选择 print(‘开奖倒计时’,3) time.sleep(1) print(‘开奖倒计时’,2) time.sleep(1) print(‘开奖倒计时’,1) time.sleep(1) image = ”’ /\_)o< | \\ | O . O| \_____/ ”’ print(image) print(‘恭喜’+a+’中奖!’) choujiang(‘虚竹’,’萧峰’,’段誉’,’紫嫣’,’段王爷’) # 调用函数

Python之global的使用,关于全局变量在函数中的使用(与局部变量同名问题)

1、用交互模式先展示一下 >>> num = 999 #全局变量 >>> def test(): … num = 188 #同名的局部变量出现 … print (num) #打印的是局部变量num … >>> test() 188 2、再show一个例子,就是上面提到的,直接抛出异常了 number = 9999 def test(): number = number + 1 print( number) test() 输出结果:此时 number = number + 1,    首先number在等于(=)符号的前面出现了,所以后面的number就会被认为是局部变量,此时局部变量number还没有赋值(即创建),怎么就能+1呢? 等同于  number = ? + 1,所以抛出了异常。 Traceback (most r…

Read More

Python PyQt5 Designer 可视化图形界面模块

PYQT5 Designer简介 强大的可视化GUI设计工具, 帮助我们快速开发PyQt.它生成UI界面为.ui文件, 通过命令将.ui转为.py文件. 准备工作 安装PyQt5: pip install pyqt5 安装Qt工具: pip install pyqt5-tools (坑提示:一开始安装的pyqt5版本高了,结果安装QT工具的时候失败,把PYQT5版本降低就解决了) 如果一切顺利,安装成功后,可以在Anaconda3的路径下找到designer.exe这个文件,为了方便下次使用,最好右键-新建快捷方式到桌面 最常用的就是创建 Widget(通用窗口) 和 MainWindow(主窗口), 这里我们创建一个 MainWindow. 下面简单介绍下主要功能: 文件保存为xxx.ui文件(例如我这里保存为win.ui), 存储到你的项目目录下 回到visual studio软件里在…

Read More

本地安装whl文件python

因为很多模块的文件都是外网服务器上的,在CMD里下载速度会很慢,经常出现超时的情况。 这时候用迅雷下载这些文件就会快很多。下载好的文件放到任意盘符里,比如我这里放到的是E盘根目录下。 在CMD里 输入E: 进入E盘根目录,然后拖动文件到命令行里,就不需要一个个去输入文件名了 pip安装whl离线文件 pip install ****.whl ============================================= 这里面有一个比较坑的地方是,一开始下载好的文件我修改了名字,结果安装失败,恢复默认的名字就可以正常安装了 除了安装whl 文件,别的模块也可以用这种方法离线安装 另外补充: 在e盘中进入e盘下的文件夹,方式是cd+文件夹名称。 如 cd demo 则进入E盘下的demo文件夹