0基础Python：四周实现爬虫网站帖子详情 - 网易云课堂

课程分类

AI·数字技能编程语言前端开发产品运营后端开发

职场·办公办公软件个人提升

设计·摄影摄影影视设计软件

|

职场英语 | 生活英语

|

备考25年12月 | 备考25年6月 | 听力/词汇 | 阅读/写作/翻译 | 真题资料 | 真题精讲

|

专四备考 | 专八备考

|

|

亲子教育 | 素质教育

|

理财入门 | 投资理财

|

营养健康 | 心理健康

|

书法/绘画 | 音乐 | 生活百科

课程

课程

网校

搜索课程

搜索

特色应用

下载APP

下载APP

扫码下载官方App

讨论区老师答疑区主题详情

南风ykt1533277797442

老师，我尝试抓取36KER的所有含融资的快讯，但是用了各种方法，包括改headers等，都只能返回【】，这是为什么？？？？？

课时26

关注已关注取消关注回复

帖子管理 |

赞（0） | 举报

所有回复（3）

是不是反爬取啊

小桥流水四合院

你好！我刚刚学习这个，也遇到你这个问题。想了解下，现在你解决这个问题了没？

南风ykt1533277797442

抓取链接：http://36kr.com/search/newsflashes/%E8%9E%8D%E8%B5%84?page=1&ts=1534140047532

代码：

from bs4 import BeautifulSoup
import requests

url = 'http://36kr.com/search/newsflashes/%E8%9E%8D%E8%B5%84?page=1&ts=1534140047532'
wb_data = requests.get(url)
soup = BeautifulSoup(wb_data.text,'lxml')

titles = soup.select('span.title')

print(titles)

只能返回【】，改User-Agent也没有用。

回复

最近活动：

创建时间：

浏览次数：551

关注人数：0