Python 爬取知乎高赞回答并绘制词共现网络

今天我们来看下如何用 Python 爬取知乎指定话题的内容,包括标题、点赞、查看等数据,并存储到 excel 和 Mongo 数据库;

还记得我们的爬虫三部曲吗?对了,就是请求 👉 解析 👉 存储,代码的大部分内容都有详细注释,我们直接上代码吧!

Stata 网页表格爬取示例

本文以爬取东方财富网 CPI 数据为例,讲解如何使用 Stata 进行网页表格数据爬取。

CRAN上的包都是干什么的?

在之前的推文 R 和 RStudio 的安装 的结尾,我写了段爬取 CRAN 上的所有 R 包的名称、发布日期和标题的代码,但是我只使用了前两个变量,进行绘图,没有提标题的事情,那么标题可以用来干什么呢?标题当然是描述该包的主要功能了,通过简单的词频统计,我们就能绘制一幅词云图观察 CRAN 上的 R 包的关键词是哪些了,首先还是爬取清华镜像源的那个表格:

Your browser is out-of-date!

Update your browser to view this website correctly. Update my browser now

×