【原创】蝈蝈采集系统 Version: 3.0
| 1、简单介绍 |
蝈蝈采集系统介绍:蝈蝈采集系统是一款web数据采集系统。
设计目标:通用型采集系统,可采集任意web数据,任意类型文件下载。
入库目标:直接操作mysql数据库,适用于任意类型的mysql资源管理系统
程序架构:PHP+MYSQL
版权所有:askie
联系方式:askie@sohu.com
官方网站:http://www.pkphp.com/ |
|
| 2、系统特点 |
1.可以采集深达4级的网页数据
2.采用非正则表达式方式,只要回查看网页源代码就可以定义简单的采集规则
3.直接数据库操作,采集前需要对你要输入数据的系统的数据库结构有了解
4.可是适用几乎所有的网站采集数据入库
5.可以自定义简单的过滤函数对采集数据进行过滤
6.可以采集任何类型的数据到本地
7.文章数据中的图片可以选择自动本地化
8.超强自定函数,可以满足个性化采集需求
9.支持gbk和utf-8编码采集
10.简单易用的接口,可以方便设置程序入库
11.单个采集和全局自动采集实现无人值守,节省人力 |
|
|
|
| WINDOWS/LINUX/UNIX + PHP 4.*/5.* + Mysql 4.*/5.* + ZendOptimizer 2.6+ |
| 第 1 步:上传程序包 |
| 将安装包的里全部文件和目录上传到服务器。(注:使用FTP软件上传文件时,选择二进制(BINARY)方式进行,否则将无法正常使用。) |
|
| 第 2 步:设置目录属性 |
| 您在正式使用以前,需要设置相关的目录属性,以便数据文件可以被 EmpireBak 正确的读写。使用 FTP 软件登录您的服务器,将服务器上以下的文件/目录属性设置为 777。 |
| autospy |
自动采集文件目录 |
| cache |
采集临时文件目录 |
| config |
采集配置文件目录 |
| install |
安装目录 |
| userfun |
用户自定义函数目录 |
| conf_global.php |
系统配置文件(如果该文件不存在请手工创建一个名字为conf_global.php的空文件) |
|
|
| 第 3 步:安装 |
请在浏览器中运行 index.php,即访问 http://您的域名/安装目录/install/index.php, 按照要求进行安装。
|
|
以下是视频教程:
基本设置:http://www.iaska.cn/tools/basicSetup.avi
全局自动采集:http://www.iaska.cn/tools/autospy.avi
翻译采集:http://www.iaska.cn/tools/googletrans2english.avi
接口设置:http://www.iaska.cn/tools/jiekou.avi
单个自动采集:http://www.iaska.cn/tools/SingleAutoSpy.avi
http://www.pkphp.com/(2)
蝈蝈采集系统(23)
蝈蝈自动采集系统(3)
蝈蝈采集(33)
WordPress (1)
php采集系统(3)
蝈蝈 数据采集(1)
PHP MYSQL蝈蝈(2)
蝈蝈采集系统Version: 3.0(4)
采集系统(2)
蝈蝈采集系统使用(1)
php采集系统(蝈蝈采集系统2.0)(4)
蝈蝈采集系统V3.0(3)
蝈蝈采集系统2.0(5)
php采集系统(蝈蝈采集系统2(2)
Share in Google Reader
分享到 FriendFeed
推荐到豆瓣
分享到 Twitter
8 Comments
大哥,dz入库怎么把数据写到两个表里面啊?盼回复,谢谢.
能不能,给个wordpress的教程阿
那么多函数,实在不好懂啊!!!!!!!!!!!
怎么用,能简单点儿不?phpcms入库。
不能下载了。。。。
看了你的3.0采集器出来了,不过今天测试的时候发现ZEND过期~! 蝈蝈大大麻烦重新加密发布出来
貌似下载地址失效了。
http://www.iaska.cn 不能访问,打不开阿~
Post a Comment