如何按类查找元素

我在使用Beautifulsoup解析带有“class”属性的HTML元素时遇到了麻烦。代码看起来像这样

soup = BeautifulSoup(sdata)
mydivs = soup.findAll('div')
for div in mydivs: 
    if (div["class"] == "stylelistrow"):
        print div

我在脚本完成后的同一行上得到一个错误。

File "./beautifulcoding.py", line 130, in getlanguage
  if (div["class"] == "stylelistrow"):
File "/usr/local/lib/python2.6/dist-packages/BeautifulSoup.py", line 599, in __getitem__
   return self._getAttrMap()[key]
KeyError: 'class'

如何消除这个错误呢?

当前回答

你可以使用BS3优化你的搜索，只找到那些给定类的div:

mydivs = soup.find_all("div", {"class": "stylelistrow"})

2011-02-18 12:04:10

其他回答

直接的方法是:

soup = BeautifulSoup(sdata)
for each_div in soup.findAll('div',{'class':'stylelist'}):
    print each_div

确保你使用了findAll的外壳，它不是findAll

2013-04-10 07:48:46

具体到BeautifulSoup 3:

soup.findAll('div',
             {'class': lambda x: x 
                       and 'stylelistrow' in x.split()
             }
            )

会找到所有这些:

<div class="stylelistrow">
<div class="stylelistrow button">
<div class="button stylelistrow">

2014-12-09 21:48:51

下面的方法对我很有效

a_tag = soup.find_all("div",class_='full tabpublist')

2019-07-13 11:36:24

关于@Wernight对上面关于部分匹配的答案的评论…

你可以部分匹配:

西班牙凉菜汤:

from gazpacho import Soup

my_divs = soup.find("div", {"class": "stylelistrow"}, partial=True)

两者都将被捕获并作为Soup对象列表返回。

2020-10-09 19:40:32

这可以让我访问class属性(在beautifulsoup 4上，与文档所说的相反)。KeyError返回的是一个列表，而不是字典。

for hit in soup.findAll(name='span'):
    print hit.contents[1]['class']

2014-07-29 07:03:36

如何按类查找元素

推荐文章

最新文章

标签