近日quicker加了【多线程】对于爬取资料挺有帮助的,最近在爬取安居客的时候发现他们的文字是没有问题的但是数字却是加密的根据一些查到的博客发现一般是先找到字体文件,下载到本地,获取字体的映射关系解析真正的数字,这一系列操作对爬虫小白挺有挑战性,不知道论坛有没有爬虫大佬可以尝试下爬取安居客,能不能解析出这些加密数字。
据说这个加密文件,随着网页变化里面内容也会变化,所以难度应该不小。
可借鉴博客:https://blog.csdn.net/zql200008/article/details/104017653?utm_medium=distribute.pc_relevant.none-task-blog-baidujs-5