代码先容

1.前台纯HTML+JS+JSON(链接统计除外),后台python天生尺度JSON
2.自带30多少个罕用平台采集规矩
3.多线程抓取,30+平台5秒内采集完毕
4.雷同平台放在一个框架内,可部分革新跟滚动
5.更新光阴显像(按采集页的自带更新光阴或定时间排序的第一条光阴采集,不的为采集实现光阴)
6.内容链接防盗链,链接经由过程base64+字符逆序+巨细写反转+base64完成加密(调换巨细写切换程序或添加数字替代可完成没有同明码加密)
7.内容链接点击统计
8.局部内容鼠标悬停提醒(如appstore排行有更新内容、光阴、版本号)

安排教程

python3 caiji.py采集(坚持后端运转请用screen或nohup)
翻开主页拜访
caiji.py为后台采集顺序,其他为前台需在统一目次
相应配置改动请查看代码中的正文
admin.php为第三方数据库治理顺序,用于内容链接统计查看(默许明码admin,请在文件中改动)
点击统计数据库log.db会在初次拜访内容链接时天生,如未树立请保障主目次可写
为了保险,后台顺序caiji.py跟数据库查看顺序admin.php请改为繁杂文件名,或挪动到非web目次(需同时改动文件内的天生JavaScripton保留目次为平台根目次,默许为以后目次)

默许使用多线程抓取,若有问题请改用复线程

本日头条的采集请调换为本人的cookie,头条短光阴采集内容雷同的太多(今朝1分钟采一次归并10次数据),雷同cookie分段采集后多少乎没有会有反复的,但采集一段光阴后推举的都是杂七杂八有关的渣滓内容(请按期调换cookie或自行参加随机的头条cookie天生规矩)

采集站的logo大局部已改动为通明图层png,在非红色配景下可能会很好看

声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。