for key, value in xxx.items()用法

mapping = {‘&#xe66f’: ‘0’, ‘&#xe50e’: ‘1’, ‘&#xf19c’: ‘2’, ‘&#xe2d1’: ‘3’, ‘&#xe372’: ‘4’, ‘&#xeb5a’: ‘5’, ‘&#xf37c’: ‘6’, ‘&#xf8b6’: ‘7’, ‘&#xf252’: ‘8’, ‘&#xf3a0’: ‘9’} # 映射字典,使用时需自行更新 text = ‘我的工资是55555&#xe66f,你的年纪是6&#xf8b6’ # 定义文本信息处理函数,通过字典mapping中的映射关系解密 for key, value in mapping.items(): text = text.replace(key, value) print(text)  

涉及字体加密的爬虫分析

1.网页分析 爬虫嘛,最主要还是先分析分析网页。 首先,用谷歌浏览器打开“实习僧网站”,输入“数据挖掘”搜索,然后检查以下内容: 网页的加载方式:发现是纯静态加载的,说明数据就在html文件里; 如何翻页:通过观察发现网站是通过URL的参数“k”控制职位关键字,参数“p”控制页码,所以“数据挖掘”职位第一页的请求URL是“https://www.shixiseng.com/interns?k=数据挖掘&p=1”,“数据挖掘”职位第二页的请求URL是“https://www.shixiseng.com/interns?k=数据挖掘&p=2”,以此类推; 请求方法:GET 是否需要验证头信息:不晓得,需要代码测试 2.代码测试 那就来测试一下。 首先在实习僧中搜索“数据挖掘”,并打开IPython,把requests库导入进来。 第一页长这样: 尝试请求一下第一页, 把状态码打…

Read More

Python根据车票猜测身份证号码

一、一张火车票引发的赌局 事情的经过是这样的: 我的同事李大伟最近出差去了。 昨晚睡觉前翻了翻朋友圈, 就跟他愉快地 互怼 交流了起来。 估计是他想起了我朱小五从不打无把握之赌,后面就怂了。 一杯奶茶嘛,也可以接受, 像杰伦一样快乐就好啦。 二、计算概率 开工。 先看看李大伟的朋友圈中发的图片。 (该火车票来自其他平行世界,扫描可能发生奇怪现象) 车票中暴露的个人信息为: 3302211993****4914  李大伟 只缺少月份日期四位。 那么也就是一共365种可能。 科普时间: 根据李大伟的身份证信息的前6位“330221” 轻易可得: 浙江省宁波人,1993年滴 那我先用python生成1993年的所有日期吧 成功得到日期列表。 三、使用验证身份证库 再用刚才的校验码计算规则 反向验证哪个日期符合喽! 自己写计算规则? NONONO,太麻烦! 给大家隆重…

Read More

抓取疯狂美工极限词查询页面接口

import requests # 引用requests模块 url = ‘https://jixianci.fkdmg.com/fkapi/cha_jixianci.php?typ=cha&ajax=1&formhash=75666097’ # 请求歌曲评论的url参数的前面部分 data = { ‘ckgf’: ‘on’, ‘time’: 1578927855, ‘ckmy’: ‘on’, ‘formhash’:’75666097′, ‘q’: ‘专利号是多少啊最佳专利’, ‘sign’: ‘b77264015c3a4d9580168e74c111b3b7’ } headers = { ‘Accept’: ‘*/*’, ‘Accept-Encoding’: ‘gzip, deflate, br’, ‘Accept-Language’: ‘zh-CN,zh;q=0.9’,…

Read More

python库之autopy

参考:https://blog.csdn.net/sandalphon4869/article/details/90272247 参数表示: (x:float) 表示x是float类型 (x:float=0) 表示x是float类型,默认值是0 ->float 返回一个float类型的数 一、安装的使用 1.介绍 主要用来模拟鼠标和键盘的点击操作。((๑•̀ㅂ•́)و✧脚本) 2.安装 pip install autopy 1 同样一条指令,昨天失败,今天成了。 3.使用 import autopy as at 1 3.官方文档 https://www.autopy.org/documentation/api-reference/ https://pypi.org/project/autopy/ https://github.com/autopilot-rs/autopy/#auto…

Read More

selenium +PhantomJS自动发布带图文微博(涉及图片上传 autoit操作)

from selenium import webdriver from bs4 import BeautifulSoup import time import os from selenium.webdriver.common.desired_capabilities import DesiredCapabilities browser = webdriver.Chrome() # browser = webdriver.PhantomJS() # headers = { # ‘Accept’: ‘text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8’, # ‘Accept-Language’: ‘zh-CN,zh;q=0.8,en-US;q=0.5,en;q=0.3’, # ‘User-Agent’: ‘Mozil…

Read More

selenium +PhantomJS自动发布微博

from selenium import webdriver from bs4 import BeautifulSoup import time from selenium.webdriver.common.desired_capabilities import DesiredCapabilities browser = webdriver.PhantomJS() # headers = { # ‘Accept’: ‘text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8’, # ‘Accept-Language’: ‘zh-CN,zh;q=0.8,en-US;q=0.5,en;q=0.3’, # ‘User-Agent’: ‘Mozilla/5.0 (Macintosh; Intel Mac OS X 10_12_5…

Read More

selenium 实现自动登录微博并发布内容

from selenium import webdriver from bs4 import BeautifulSoup import time # browser = webdriver.PhantomJS() browser = webdriver.Chrome() browser.get(‘https://weibo.com’) time.sleep(5) #给页面加载预留足够的时间 browser.find_element_by_css_selector(“#loginname”).send_keys(“这里写账号”) browser.find_element_by_css_selector(“.info_list.password input[node-type=’password’]”).send_keys(“这里写上密码”) browser.find_element_by_c…

Read More

python文本分析与可视化利器—wordcloud库使用

wordcloud是功能强大的词云展示第三方库。它不仅可根据文本中词语出现的频率等参数绘制词云,还可设定词云的字体,颜色,形状等。需要注意的是,wordcloud库在运行时,需要用到一些依赖库:包括matplotlib库以及图像处理库pillow库。因此,使用该库之前,务必先装好依赖库。和其他第三方库一样,wordcloud在使用前需在cmd中输入如下命令安装: pip install wordcloud from wordcloud import WordCloud import numpy as np import PIL.Image as Image fi = open(“book.txt”, “r”, encoding = ‘utf-8′) txt = fi.read() fi.close() font=’font.ttf’ wc = WordCloud(width=800, he…

Read More