2024年2月23日
摘要: 1. 节点选择器 都是Tag类型,直接调用节点名称可选择节点,调用string属性得到节点内容a56爆大奖在线娱乐。 2. 提取信息 获取名称 # print(soup.title.name) 获取属性 # print(soup.p.attrs) # print(soup.p['name']) # print(so 阅读全文
posted @ 2024-02-23 16:33 HelloJacker 阅读(3) 评论(0) 推荐(0) 编辑
  2024年2月22日
摘要: 1. Match 从字符串起始位置开始匹配,两个参数(正则表达式,字符串) .*代表匹配前面的字符无限次 content = 'Hello 1234567 World_This is a Regex Demo' # 通用匹配 result = re.match('^Hello.*Demo$', co 阅读全文
posted @ 2024-02-22 17:01 HelloJacker 阅读(3) 评论(0) 推荐(0) 编辑
  2024年2月21日
摘要: Session在服务端,是一个抽象概念,开发者为了实现中断和继续等操作,将user agent 和 server 之间一对一的交互,抽象为“会话”用来保存用户的Session信息; Cookie在客户端,是一个实际存在的东西,http协议中定义在header中的字段。可以认为是 session 的一 阅读全文
posted @ 2024-02-21 21:57 HelloJacker 阅读(1) 评论(0) 推荐(0) 编辑
摘要: 组成: scheme://【username:password】hostname【:port】【/path】【?query】【#fragment】 默认端口: http: 80 https: 443 HTTP与HTTPS区别 HTTP:超a56爆大奖在线娱乐传输协议 HTTPS:安全版HTTP 都属于应用层协议,基 阅读全文
posted @ 2024-02-21 16:19 HelloJacker 阅读(2) 评论(0) 推荐(0) 编辑
  2024年2月17日
摘要: 一律不在此处暂停 条件断点false 停用断点抓包分析 定时器、构造器置空 替换js(固定文件js) function关键字启动 eval 阅读全文
posted @ 2024-02-17 08:57 HelloJacker 阅读(1) 评论(0) 推荐(0) 编辑
  2024年2月16日
摘要: 1. 加密解密内容操作 (function() { var parse_ = JSON.parse; JSON.parse = function(arg) { console.log("您猜怎么着?断住了! ——> ",arg); debugger; return parse_(arg); // 不 阅读全文
posted @ 2024-02-16 08:53 HelloJacker 阅读(42) 评论(0) 推荐(0) 编辑
  2024年1月23日
摘要: 路径查找 //:子孙节点,不考虑层级 /:找直接子节点 谓词查询 //div【@id="content"】 属性查询 //@class 模糊查询 //div[contains(@id,"he")] //div[starts-with(@id, "he")] 内容查询 //div/h1/text() 阅读全文
posted @ 2024-01-23 15:27 HelloJacker 阅读(1) 评论(0) 推荐(0) 编辑
  2024年1月22日
摘要: 1. Response类型 设置响应的编码格式 # response.encoding = 'utf-8' # print(response.text) 返回url地址 # print(response.url) 返回二进制的数据 # print(response.content) 返回响应的状态码 阅读全文
posted @ 2024-01-22 10:45 HelloJacker 阅读(4) 评论(0) 推荐(0) 编辑
  2024年1月18日
摘要: 1. 基础使用 import urllib.request response = urllib.request.urlopen(url) print(response.read().decode('utf-8')) print(type(response)) print(response.statu 阅读全文
posted @ 2024-01-18 10:23 HelloJacker 阅读(1) 评论(0) 推荐(0) 编辑
  2024年1月12日
摘要: 反爬 1. User-Agent 2. IP代理 快代理 3. 验证码访问 1.输入验证码 Pytesseract 百度OCR接口 深度学习 2.滑块 Opencv解决问题:读取图片 高斯模糊处理 canny边缘检测 轮廓检测 获取位置 Links:https://zhuanlan.zhihu.co 阅读全文
posted @ 2024-01-12 11:26 HelloJacker 阅读(6) 评论(0) 推荐(0) 编辑