数据抓取 - 火爪web数据抓取

所谓网络爬虫，指的是使用程序模拟用户浏览网页的行为，然后把浏览过程中看到的数据采集整理下来。我们通常会把爬虫程序分为三个部分：采集，处理，存储。爬虫会从一个或几个页面的链接开始，采集初始网页数据，通过对采集到的数据进行分析，筛选出需求数据进行整理并存储。

技术文章 2021年05月20日 0 点赞 0 评论 538 浏览

作为当前最为活跃的社交平台，微博拥有着极大的用户量，每天会产生数以万计的内容信息。而将这些数据采集下来，对我们对微博的活动、事件进行分析有着极大的帮助。为了帮助大家更好地收集微博数据，下面分享一些爬取微博数据时防止被墙的小技巧，希望可以帮助到大家。

技术文章 2021年06月02日 0 点赞 0 评论 528 浏览

在抓取拉勾网上全国范围内的“数据分析”的职位数据后，通过 Tableau 进行简单的可视化分析，享大家展示了一下如何对数据进行分析，也让大家可以感受到当前市场上的数据分析这个岗位是什么样的。

技术文章 2021年06月11日 1 点赞 0 评论 497 浏览

数据抓取

首页

数据抓取