博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
抓取网站加密的电话号码
阅读量:6342 次
发布时间:2019-06-22

本文共 305 字,大约阅读时间需要 1 分钟。

之前公司有个小需求,需要将爱帮网的一些商户电话抓取下来,因为之前做过新闻抓取,以为也是手到擒来的小case,firebug查看页面源码,傻眼了,其商户电话是做过加密的,如下:

其源码对应至少20位以上的数字,如下,解决也小费了一番功夫:

仔细发现,那些灰色的都是用来混淆用的,实际的电话号码就是那些黑色的span,上有政策下有对策,发现这个问题,顺藤摸瓜,查看其css文件,找到几组如下的样式:

很明显一组样式是控制数字的显示,一组用于混淆数字的样式,规律找出来,抓取就是浮云了。

转载于:https://www.cnblogs.com/wumian/articles/2012-12-20-1214.html

你可能感兴趣的文章
《网页美工设计Photoshop+Flash+Dreamweaver从入门到精通》——2.6 图层与图层样式...
查看>>
今天的学习
查看>>
面试必问之JVM原理
查看>>
mysql主主同步+Keepalived
查看>>
研究音频编解码要看什么书
查看>>
tomcat远程调试配置
查看>>
QuartZ Cron表达式
查看>>
性能测试工具VTune的功能和用法介绍
查看>>
音频视频组件Audio DJ Studio for .NET更新至v10.0.0.0丨附下载
查看>>
RMAN Complete Recovery
查看>>
[ CodeForces 1064 B ] Equations of Mathematical Magic
查看>>
NYOJ-15:括号匹配(二)
查看>>
首次记录在案的
查看>>
C#进阶系列——WebApi 跨域问题解决方案:CORS
查看>>
错误:“产品订单的调度参数没有被定义”
查看>>
机器视觉在带钢针孔检测中的应用
查看>>
ASP.NET WEB API 调试
查看>>
使用wget命令进行整站下载
查看>>
解读volatile
查看>>
zookeeper安装部署
查看>>