关于使用quicker爬取安居客的一些问题

随便聊聊 · 2206 次浏览
KuXin 创建于 2020-05-18 11:45

近日quicker加了【多线程】对于爬取资料挺有帮助的,最近在爬取安居客的时候发现他们的文字是没有问题的但是数字却是加密的根据一些查到的博客发现一般是先找到字体文件,下载到本地,获取字体的映射关系解析真正的数字,这一系列操作对爬虫小白挺有挑战性,不知道论坛有没有爬虫大佬可以尝试下爬取安居客,能不能解析出这些加密数字。

 

据说这个加密文件,随着网页变化里面内容也会变化,所以难度应该不小。

可借鉴博客:https://blog.csdn.net/zql200008/article/details/104017653?utm_medium=distribute.pc_relevant.none-task-blog-baidujs-5


回复内容
KuXin 2020-05-18 11:47
#1


XH 2020-05-18 13:33
#2

没必要,查看页面源代码就可以获取房价了。 直接从请求数据中正则提取就行。


 

KuXin 2020-05-18 15:09 :

不可能的

KuXin 2020-05-18 15:10 :

不行。

hf.zu.anjuke.com

hf.zu.anjuke.com

你可以试试


i_orange 2020-05-18 15:31
#3

如果只是为了找房,可以用我的动作: 地图搜租房

如果没有所在城市,可以到这里看爬虫源代码

 

KuXin 2020-05-18 17:59 :

哈哈是为了爬虫而不是找房

linex 2020-05-19 10:32
#4

总结了一下发在了简书上,有兴趣可以看看

https://www.jianshu.com/p/077c5bee1931  

KuXin 2020-05-19 17:27 :

哈哈哈厉害

回复主贴