requests这个模块,如果直接利用get()或者post等方法可以做到模拟网页的请求,但是每一次请求之间是没有关系的,相当于不同的会话,也就是相当于用浏览器打开了两个不同的页面。 # 设想这样一个场景:第一次请求利用post()方法登陆了某个网站,第二次想获取成功登陆之后的个人信息,又用了一次get()方法去请求个人信息页面。实际上相当于打开了两个浏览器,是完全不关的两个会话,这样并不能成功获
2020年12月9日 19:50 Python 爬虫
selenium是一个网页自动化测试工具,使用它可以操作浏览器来模拟人操作浏览器的行为
2020年10月23日 00:00 定位元素 Python Scrapy 爬虫 导出 selenium
import requests url = "http://steamworkshop.download/online/steamonline.php" data = {"item": "1355236618", "app": "431960"} # 替换item为壁纸id即可 res = requests.post(url, data=data).text print(res)
2020年7月21日 08:38 Scrapy 爬虫 导出 请求头 抓包
是对字符串的内容进行匹配查询的一种操作方式,通过预先定义的一些特特字符组合,形成一种字符串的匹配规则,再根据这些规则来对字符串中的某一些内容进行提取或查找。
2020年6月2日 13:04 爬虫 re
selenium是一个自动化测试工具,利用它我们可以控制浏览器执行特定的动作,比如点击,下拉,刷新,输入等操作。对于一些JavaScript渲染的页面来说,这种抓取方式非常有效,下面来看一下selenium的安装过程
2020年4月29日 04:03 定位元素 Python Scrapy 爬虫 selenium
一般用在正则表达式中,称之为原始字符串,作用是将Python语法中的反斜杠转义字符取消掉,将其设置成一个普通的字符串,可以解决Python中转义字符产生的问题。
2020年4月22日 13:58 定位元素 爬虫 re