返回介绍

3.5 本章小结及要求

发布于 2025-04-21 19:15:26 字数 313 浏览 0 评论 0 收藏

本章介绍了 HTML 源码,详细讲解了 XPath 语法,并用爬取百度首页这个简单例子,讲解了 Requests 配合 XPath 提取数据的方法。本章还简单介绍了 Beautiful Soup 和正则表达式,特别是正则表达式,只是介绍了语法规则,读者通过学习,应该大体了解了正则表达式的使用规则,以后遇到具体问题时,可以再查阅相关的材料和示例。

本章演示了抓取百度首页“新闻”栏目的名称和链接的方法,作业就是要求读者抓取百度首页其他几个栏目的名称和链接。本章要求读者通过动手抓取,熟悉使用 Chrome 浏览器检查工具的方法,掌握在实战中编写 XPath 路径的技巧。

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。
列表为空,暂无数据
    我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。