lxml模块css选择器的用法
1.使用标签选择器
from lxml import etree
html = etree.parse('index.html')
title = html.cssselect('title')[0].text
print(title)
2.使用类选择器
a = html.cssselect('.first_a')[0].get('href')
print(a)
3.使用ID选择器
a1 = html.cssselect('#second')[0].text
print(a1)
4.使用属性选择器
a2 = html.cssselect('a[class="second_a"]')[0].text
print(a2)
5.使用父子选择器
a3 = html.cssselect('.one>div>a')[0].text
print(a3)
6.使用后代选择器
a4 = html.cssselect('.one a')[0].text
print(a4)
7.使用交集选择器
a5 = html.cssselect('a.first_a')[0].text
print(a5)
8.使用伪类选择器
a6 = html.cssselect('li:nth-child(2)>a')[0].text
print(a6)