Python爬虫 BeautifulSoup 常用操作
一切从获取一个 soup 对象开始
1 | try: |
获取类型为 div
的 DOM
1 | dom = soup.find('div') |
获取包含某个属性的 DOM
1 | dom = soup.find('div', {'class':'info-panel'}) |
获取所有符合条件的 DOM
1 | dom_list = soup.findAll('div',{'class':'info-panel'}) |
获取显示的文字
1 | dom.text.strip() |
获取 DOM 的一个属性指
1 | dom.attrs['title'] |