# like:主要用于匹配数据库中的多条记录 # a_:匹配以a开头,并且只匹配a最后一个字符的数据。 # %a:匹配以a结尾的数据 # a%:匹配以a开头的数据
2019年3月19日 05:31 sqlit3
有时候我们用requests抓取页面得到的结果,可能和浏览器中看到的不一样,在浏览器中可以看到正常显示的页面数据,而使用requests得到的结果中并没有这些数据。因为requests获取的都是原始的HTML文档,而浏览器中的页面是JavaScript处理数据后生成的结构,这些数据有多种的来源,而可能是通过Ajax加载而成的,可能是包含在HTML文档中的,也可能是经过JavaScript和特定算法
2019年1月11日 05:11 ajax
原因是 Python requests 设置verify=False移除SSL认证
2019年1月1日 09:22 Python Scrapy 爬虫 请求头 抓包 协议
GET:请求指定的页面信息,并返回数据 HEAD:类似于GET请求,只不过返回的响应中没有具体的内容,用户获取报头 POST:向指定的资源提交数据进行处理,数据被包含在请求体中 PUT:从客户端向服务器传输的数据取代指定的文档内容 DELETE:请求服务器删除指定的页面
2018年12月14日 07:57 爬虫 请求头 协议
是对字符串的内容进行匹配查询的一种操作方式,通过预先定义的一些特特字符组合,形成一种字符串的匹配规则,再根据这些规则来对字符串中的某一些内容进行提取或查找。
2018年12月7日 02:55 定位元素 Python 爬虫 re