Scrapy的remove_tags_with_content方法无法删除img标签?

1.7k 记录 , , 发表评论
Scrapy爬取的数据有时候会做清理,把不需要用的标签都清除掉。 其中remove_tags和remove_tags_with_content是比较有用的内置方法。 一个是去除标签本身,一个是去除标签及标签中的内容。 使用方式: from scrapy.utils.markup import remove_tags, remove_tags_with_content content = remove_tags(content, ('a',)) content = remove_…

10分钟从PHP到Python

4.4k 记录 , , 3评论
PHP和Python都是解释性语言,用过PHP一般再学Python就比较容易,毕竟很多概念都一样。 当然,反过来也一样,会Python再入手PHP,也很简答。 不过如果要使用框架,那就得稍微多用些力气。 这里我们以语言本身为主,就暂不讨论框架。 1 用途 我是先用PHP,再学Python,所以对他们的用途也算清楚。 PHP以WEB服务起家,而且多年来都是以这个…