一、蝈蝈采集系统主要特性 1、简单介绍 蝈蝈采集系统介绍:蝈蝈采集系统是一款web数据采集系统。 设计目标:通用型采集系统,可采集任意web数据,任意类型文件下载。 入库目标:直接操作mysql数据库,适用于任意类型的mysql资源管理系统 程序架构:PHP+MYSQL 版权所有:askie 联系方式:askie@sohu.com 官方网站:http://www.pkphp.com/ 2、系统特点 1.可以采集深达4级的网页数据 2.采用非正则表达式方式,只要回查看网页源代码就可以定义简单的采集规则 3.直接数据库操作,采集前需要对你要输入数据的系统的数据库结构有了解 4.可是适用几乎所有的网站采集数据入库 5.可以自定义简单的过滤函数对采集数据进行过滤 6.可以采集任何类型的数据到本地 7.文章数据中的图片可以选择自动本地化 8.超强自定函数,可以满足个性化采集需求 9.支持gbk和utf-8编码采集 10.简单易用的接口,可以方便设置程序入库 11.单个采集和全局自动采集实现无人值守,节省人力 二、程序运行环境 WINDOWS/LINUX/UNIX + PHP 4.*/5.* + Mysql 4.*/5.* + ZendOptimizer 2.6+ 三、程序安装说明 第 1 步:上传程序包 将安装包的里全部文件和目录上传到服务器。(注:使用FTP软件上传文件时,选择二进制(BINARY)方式进行,否则将无法正常使用。) 第 2 步:设置目录属性 您在正式使用以前,需要设置相关的目录属性,以便数据文件可以被 EmpireBak 正确的读写。使用 FTP 软件登录您的服务器,将服务器上以下的文件/目录属性设置为 777。 目录文件名称 说明 autospy 自动采集文件目录 cache 采集临时文件目录 config 采集配置文件目录 install [...]
Archives
- May 2011
- April 2011
- February 2011
- December 2010
- November 2010
- October 2010
- August 2010
- February 2010
- January 2010
- December 2009
- November 2009
- October 2009
- September 2009
- August 2009
- July 2009
- June 2009
- May 2009
- April 2009
- March 2009
- February 2009
- January 2009
- December 2008
- October 2008
- September 2008
- August 2008
- July 2008
- June 2008
- May 2008
- April 2008
- March 2008
Links
Recent Comments
