Skip to content

【原创】蝈蝈采集系统 Version: 3.0

一、蝈蝈采集系统主要特性
1、简单介绍
蝈蝈采集系统介绍:蝈蝈采集系统是一款web数据采集系统。
设计目标:通用型采集系统,可采集任意web数据,任意类型文件下载。
入库目标:直接操作mysql数据库,适用于任意类型的mysql资源管理系统
程序架构:PHP+MYSQL
版权所有:askie
联系方式:askie@sohu.com
官方网站:http://www.pkphp.com/
2、系统特点
1.可以采集深达4级的网页数据
2.采用非正则表达式方式,只要回查看网页源代码就可以定义简单的采集规则
3.直接数据库操作,采集前需要对你要输入数据的系统的数据库结构有了解
4.可是适用几乎所有的网站采集数据入库
5.可以自定义简单的过滤函数对采集数据进行过滤
6.可以采集任何类型的数据到本地
7.文章数据中的图片可以选择自动本地化
8.超强自定函数,可以满足个性化采集需求
9.支持gbk和utf-8编码采集
10.简单易用的接口,可以方便设置程序入库
11.单个采集和全局自动采集实现无人值守,节省人力
二、程序运行环境
WINDOWS/LINUX/UNIX + PHP 4.*/5.* + Mysql 4.*/5.* + ZendOptimizer 2.6+
三、程序安装说明
第 1 步:上传程序包
将安装包的里全部文件和目录上传到服务器。(注:使用FTP软件上传文件时,选择二进制(BINARY)方式进行,否则将无法正常使用。)
第 2 步:设置目录属性
您在正式使用以前,需要设置相关的目录属性,以便数据文件可以被 EmpireBak 正确的读写。使用 FTP 软件登录您的服务器,将服务器上以下的文件/目录属性设置为 777。

目录文件名称

说明

autospy 自动采集文件目录
cache 采集临时文件目录
config 采集配置文件目录
install 安装目录
userfun 用户自定义函数目录
conf_global.php 系统配置文件(如果该文件不存在请手工创建一个名字为conf_global.php的空文件)
第 3 步:安装
请在浏览器中运行 index.php,即访问 http://您的域名/安装目录/install/index.php, 按照要求进行安装。
四、技术支持
请登录:http://www.pkphp.com

下载:蝈蝈采集系统V3.0

以下是视频教程:
基本设置:http://www.iaska.cn/tools/basicSetup.avi
全局自动采集:http://www.iaska.cn/tools/autospy.avi
翻译采集:http://www.iaska.cn/tools/googletrans2english.avi
接口设置:http://www.iaska.cn/tools/jiekou.avi
单个自动采集:http://www.iaska.cn/tools/SingleAutoSpy.avi

http://www.pkphp.com/(2)蝈蝈采集系统(23)蝈蝈自动采集系统(3)蝈蝈采集(33)WordPress (1)php采集系统(3)蝈蝈 数据采集(1)PHP MYSQL蝈蝈(2)蝈蝈采集系统Version: 3.0(4)采集系统(2)蝈蝈采集系统使用(1)php采集系统(蝈蝈采集系统2.0)(4)蝈蝈采集系统V3.0(3)蝈蝈采集系统2.0(5)php采集系统(蝈蝈采集系统2(2)

Share in Google Reader Share in Google Reader 分享到 FriendFeed 分享到 FriendFeed 推荐到豆瓣 推荐到豆瓣 分享到 Twitter 分享到 Twitter

8 Comments

  1. kkk

    大哥,dz入库怎么把数据写到两个表里面啊?盼回复,谢谢.

    Posted on 09-Aug-08 at 4:53 pm | Permalink
  2. 能不能,给个wordpress的教程阿

    Posted on 28-Sep-08 at 9:06 pm | Permalink
  3. 那么多函数,实在不好懂啊!!!!!!!!!!!

    Posted on 28-Sep-08 at 9:08 pm | Permalink
  4. fire2

    怎么用,能简单点儿不?phpcms入库。

    Posted on 11-Apr-09 at 11:05 am | Permalink
  5. 不能下载了。。。。

    Posted on 10-May-09 at 3:58 pm | Permalink
  6. 看了你的3.0采集器出来了,不过今天测试的时候发现ZEND过期~! 蝈蝈大大麻烦重新加密发布出来

    Posted on 23-May-09 at 12:50 pm | Permalink
  7. 貌似下载地址失效了。

    Posted on 22-Nov-09 at 1:29 am | Permalink
  8. Sevi

    http://www.iaska.cn 不能访问,打不开阿~

    Posted on 04-Jan-10 at 9:46 pm | Permalink

Post a Comment

Your email is never published nor shared. Required fields are marked *
*
*