现在你已经知道如何在剖析树中寻找东西了。但也许你想对它做些修改并输出出来。
你可以仅仅将一个元素从其父母的contents
中分离,但是文档的其他部分仍然
拥有对这个元素的引用。Beautiful Soup 提供了几种方法帮助你修改剖析树并保持其内部的一致性。
你可以使用字典赋值来修改Tag
对象的属性值。
from BeautifulSoup import BeautifulSoup soup = BeautifulSoup("<b id="2">Argh!</b>") print soup # <b id="2">Argh!</b> b = soup.b b['id'] = 10 print soup # <b id="10">Argh!</b> b['id'] = "ten" print soup # <b id="ten">Argh!</b> b['id'] = 'one "million"' print soup # <b id='one "million"'>Argh!</b>
你也可以删除一个属性值,然后添加一个新的属性:
del(b['id']) print soup # <b>Argh!</b> b['class'] = "extra bold and brassy!" print soup # <b class="extra bold and brassy!">Argh!</b>