小白求见一个scrapy爬虫框架的一个小问题，谢谢

谢谢，初学scrapy，困难重重，遇到疑问。
scrapy 框架中需要手写的spider爬虫中，给出一个“start_urls”会得出“response”，我看到的例子中，这个"response"一般都使用response.xpath（）或者response.css（）的方法。
请问：可以对response使用正则表达式吗？譬如：re.findall('xxxxxx',response,re.S) ？
可以吗？
谢谢大家！

response是一个类

慕课网

慕课网，IT技能学习平台。课程包含了JAVA，前端，安卓，Python，大数据等60类主流技术语言，覆盖了面试就业，职业成长，自我提升等需求场景。

2024-11-06 11:54广告

立即查看

response有re方法

可以，但不是这种格式

response是一个HTTP 响应对象， response.xpath 提取的是 HTML/XML 文档中的节点集， re模块是string进行匹配的。所以如果你需要使用re模块匹配的话，需要将 response 对象转为HTML字符串: response.content.decode()

谢谢大家

扫二维码下载贴吧客户端

下载贴吧APP
看高清直播、视频！

5回复贴，共1页

<<返回python吧

分享到:

日	一	二	三	四	五	六