<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>记录与PHP的PK经历 &#187; php</title>
	<atom:link href="http://www.pkphp.com/category/php/feed/" rel="self" type="application/rss+xml" />
	<link>http://www.pkphp.com</link>
	<description>PK with php!</description>
	<lastBuildDate>Tue, 23 Feb 2010 15:01:28 +0000</lastBuildDate>
	<generator>http://wordpress.org/?v=2.9.2</generator>
	<language>en</language>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
			<item>
		<title>[转]开源PHP中文分词扩展:PHPCWS 1.0.0发布啦</title>
		<link>http://www.pkphp.com/2009/02/17/%e8%bd%ac%e5%bc%80%e6%ba%90php%e4%b8%ad%e6%96%87%e5%88%86%e8%af%8d%e6%89%a9%e5%b1%95phpcws-100%e5%8f%91%e5%b8%83%e5%95%a6/</link>
		<comments>http://www.pkphp.com/2009/02/17/%e8%bd%ac%e5%bc%80%e6%ba%90php%e4%b8%ad%e6%96%87%e5%88%86%e8%af%8d%e6%89%a9%e5%b1%95phpcws-100%e5%8f%91%e5%b8%83%e5%95%a6/#comments</comments>
		<pubDate>Tue, 17 Feb 2009 13:57:39 +0000</pubDate>
		<dc:creator>askie</dc:creator>
				<category><![CDATA[LAMP]]></category>
		<category><![CDATA[php]]></category>
		<category><![CDATA[分词]]></category>

		<guid isPermaLink="false">http://www.pkphp.com/?p=897</guid>
		<description><![CDATA[非常佩服这位兄弟开发的开源php分词系统，现在终于发布1.0.0版本了。本版本的功能有了很大的加强，同时也简化了使用，仅一个php函数。现在转帖全部内容，对张宴表示强烈的支持!！
[文章/程序 作者：张宴 本文版本：v1.0 最后修改：2009.02.16 原文链接：http://blog.s135.com/post/398.htm]
名称：PHPCWS（PHP中文分词扩展）
协议：New BSD License
作者：张宴
网址：http://code.google.com/p/phpcws/
SVN：http://code.google.com/p/phpcws/source/browse/#svn/trunk/phpcws
一、PHPCWS 简介
1、什么是 PHPCWS ？
PHPCWS 是一款开源的PHP中文分词扩展，目前仅支持Linux/Unix系统。
PHPCWS 先使用“ICTCLAS 3.0 共享版中文分词算法”的API进行初次分词处理，再使用自行编写的“逆向最大匹配算法”对分词和进行词语合并处理，并增加标点符号过滤功能，得出分词结果。
ICTCLAS（Institute of Computing Technology, Chinese Lexical Analysis System）是中国科学院计算技术研究所在多年研究工作积累的基础上，基于多层隐马模型研制出的汉语词法分析系统，主要功能包括中文分词；词性标注；命 名实体识别；新词识别；同时支持用户词典。ICTCLAS经过五年精心打造，内核升级6次，目前已经升级到了ICTCLAS3.0，分词精度 98.45%，各种词典数据压缩后不到3M。ICTCLAS在国内973专家组组织的评测中活动获得了第一名，在第一届国际中文处理研究机构SigHan 组织的评测中都获得了多项第一名，是当前世界上最好的汉语词法分析器。
ICTCLAS 3.0 商业版是收费的，而免费提供的 ICTCLAS 3.0 共享版不开源，词库是根据人民日报一个月的语料得出的，很多词语不存在。所以本人对ICTCLAS分词后的结果，再采用逆向最大匹配算法，根据自己补充的 一个9万条词语的自定义词库（与ICTCLAS词库中的词语不重复），对ICTCLAS分词结果进行合并处理，输出最终分词结果。
由于 ICTCLAS 3.0 共享版只支持GBK编码，因此，如果是UTF-8编码的字符串，可以先用PHP的iconv函数转换成GBK编码，再用phpcws_split函数进行分词处理，最后转换回UTF-8编码。
2、PHPCWS 中文分词在线演示
演示网址：http://blog.s135.com/demo/phpcws/
3、PHPCWS 分词速度及用途
初次使用时，Apache 或 php-cgi(FastCGI) 进程，需要加载一次词库到内存中，需要0.0X秒。58字节的一句话——“2009年2月13日，我编写了一款PHP中文分词扩展：PHPCWS 1.0.0。”，分词速度只需0.0003秒。
PHPCWS 属于《亿级数据的高并发通用搜索引擎架构设计》 的一部分，用作“搜索查询接口”的关键字分词处理。在此架构中，Sphinx索引引擎对于CJK（中日韩）语言支持一元切分，假设【反恐行动是国产主视角 射击网络游戏】这段文字，Sphinx会将其切成【反 恐 行 动 是 国 产 主 视 角 射 击 网 络 [...]]]></description>
		<wfw:commentRss>http://www.pkphp.com/2009/02/17/%e8%bd%ac%e5%bc%80%e6%ba%90php%e4%b8%ad%e6%96%87%e5%88%86%e8%af%8d%e6%89%a9%e5%b1%95phpcws-100%e5%8f%91%e5%b8%83%e5%95%a6/feed/</wfw:commentRss>
		<slash:comments>2</slash:comments>
		</item>
		<item>
		<title>PHP如何判断ajax请求</title>
		<link>http://www.pkphp.com/2009/01/24/how-to-determin-a-ajax-request-using-php/</link>
		<comments>http://www.pkphp.com/2009/01/24/how-to-determin-a-ajax-request-using-php/#comments</comments>
		<pubDate>Sat, 24 Jan 2009 05:29:27 +0000</pubDate>
		<dc:creator>askie</dc:creator>
				<category><![CDATA[php]]></category>

		<guid isPermaLink="false">http://www.pkphp.com/?p=846</guid>
		<description><![CDATA[如何在php中判断一个网页请求是ajax请求还是普通请求？你可以通过传递参数的方法来实现，例如使用如下网址请求：
/path/to/pkphp.com/script.php?ajax
在php脚本中使用如下方法判断：
if(isset($_GET['ajax'])) {
...这是一个ajax请求，然后...
}
else {
...这不是一个ajax请求，然后...
}
通过传递_GET参数的方法简单实现了网页请求的判断。但是如果需要这样的功能，这个方法可能就有弊端，功能需求如下：
1.通过ajax请求的网页与普通请求的网页内容是不相同的
2.通过ajax请求的网页是为了方便用户操作，两种方法请求打开的网页必须的内容是相同的，只是ajax请求到的网页内容比较简化和使用，去除了网页的大框架模板。
3.这么做的目的是：用户在网页操作时通过ajax实现，而搜索引擎访问网页时（相当于普通打开网页），得到的内容是一个完整的网页（包含了网页的大框架模板）。
要完成上面的这个功能，就不能使用前面介绍的通过GET参数传递来判断了，如果使用GET传递来判断的话，用户ajax请求和普通网页请求都会是一样的内容，因为你不可能为一个链接设置一个带ajax判断参数和不带的URL。那么如何才能实现这个功能呢？必须通过服务器端PHP判断解决这个问题。也就是今天要说的PHP如何判断ajax请求。这个问题要解决有一个先决条件，那就是你使用的ajax框架必须是jquery。在jquery框架中，对于通过它的$.ajax, $.get, or $.post方法请求网页内容时，它会向服务器传递一个HTTP_X_REQUESTED_WITH的参数，你可以利用如下方法判断某个请求是ajax请求还是普通请求：
if(isset($_SERVER['HTTP_X_REQUESTED_WITH']) &#38;&#38; strtolower($_SERVER['HTTP_X_REQUESTED_WITH']) == 'xmlhttprequest')
{
...这是一个ajax请求，然后...
}
else {
...这不是一个ajax请求，然后...
}
利用这个来进行判断操作，可以使网页端的URL保持一致，但是能够对两种不同的请求却能够得到不同内容的网页。即实现了用户操作优化，又不影响搜索引擎收录，我觉得是一个很棒的解决方案！
这里有一个另外需要注意的问题，就是如果你的jquery请求是通过iframe打开网页的，那么HTTP_X_REQUESTED_WITH参数不会被传递，也就是说你没有办法判断请求的类型。
Related items

[转]开源PHP中文分词扩展:PHPCWS 1.0.0发布啦
php如何解析网页DOM？phpQurey给你搞定一切！
php通用xml解析类
蝈蝈采集程序核心代码：任意字符串截取函数
php查询alexa排名的代码

http://www.pkphp.com/(2)php 判断是否Ajax请求(1)WordPress (1)php 判断 请求结束(1)ajax请求(1)php如何实现ajax(1)ajax 请求(4)PHP ajax(10)php 中如何判断请求方式(1)php 中如何判断请求方式是post还是get(1)如何判断 AJAX(2)php 判断 ajax(4)ajax 普通请求(1)HTTP_X_REQUESTED_WITH(5)php判断在线用户(1)]]></description>
		<wfw:commentRss>http://www.pkphp.com/2009/01/24/how-to-determin-a-ajax-request-using-php/feed/</wfw:commentRss>
		<slash:comments>1</slash:comments>
		</item>
		<item>
		<title>php如何解析网页DOM？phpQurey给你搞定一切！</title>
		<link>http://www.pkphp.com/2009/01/21/php-dom-phpqurey/</link>
		<comments>http://www.pkphp.com/2009/01/21/php-dom-phpqurey/#comments</comments>
		<pubDate>Wed, 21 Jan 2009 13:50:06 +0000</pubDate>
		<dc:creator>askie</dc:creator>
				<category><![CDATA[php]]></category>
		<category><![CDATA[dom]]></category>
		<category><![CDATA[phpQurey]]></category>

		<guid isPermaLink="false">http://www.pkphp.com/?p=841</guid>
		<description><![CDATA[大名鼎鼎的jquery已经3岁了，他的出现让浏览器端的UI应用到达了新的水平，让javascript更加简单、方便得到应用。
jQuery由美国人John Resig创建，至今已吸引了来自世界各地的众多javascript高手加入其team。包括来自德国的J&#38;ouml;rn Zaefferer，罗马尼亚的Stefan Petre等等。
jQuery是继prototype之后又一个优秀的Javascrīpt框架。其宗旨是——WRITE LESS,DO MORE,写更少的代码,做更多的事情。
它是轻量级的js库(压缩后只有21k) ，这是其它的js库所不及的，它兼容CSS3，还兼容各种浏览器 （IE 6.0+, FF 1.5+, Safari 2.0+, Opera 9.0+）。
jQuery是一个快速的，简洁的javaScript库，使用户能更方便地处理HTML documents、events、实现动画效果，并且方便地为网站提供AJAX交互。
jQuery还有一个比较大的优势是，它的文档说明很全，而且各种应用也说得很详细，同时还有许多成熟的插件可供选择。
jQuery能够使用户的html页保持代码和html内容分离，也就是说，不用再在html里面插入一堆js来调用命令了，只需定义id即可。
要使用它首先要一个jQuery的库，也就是类包“jquery.js”，有了它我们就可以轻松的实现各种js功能了，它还有许多插件，可实现很多功能，所以说很强大嘛。
官方下载地址为：http://jquery.com/
其实以我的理解，jquery是一个很简单的DOM解析器，它能够在浏览器端很方便的解析网页DOM结构。如何在php中解析网页DOM呢？phpQuery诞生了，它是一个利用php语言在服务器端实现了网页DOM解析的API。利用phpQuery可以像jquery一样方便的解析网页DOM，而且phpQuery与jquery语法和函数基本一致，也就是说如果你会了jquery的语法，那么你也就会了phpQuery的用法，太强大了！有了phpQuery，如果你要制作php采集程序，那就很简单了。
下面是phpQurey的基本用法：
phpQuery::newDocumentFileXHTML('my-xhtml.html')->find('p');
$ul = pq('ul');
创建phpQuery对象有以下方法可供选择：
    * phpQuery::newDocument($html, $contentType = null) 从html创建文档，如果$contentType不设置，那么根据$html自动解析编码，如果失败的话则使用utf-8编码.
    * phpQuery::newDocumentFile($file, $contentType = null)从文件创建文档. 与newDocument()类似
    * phpQuery::newDocumentHTML($html, $charset = 'utf-8')
    * phpQuery::newDocumentXHTML($html, $charset = 'utf-8')
    [...]]]></description>
		<wfw:commentRss>http://www.pkphp.com/2009/01/21/php-dom-phpqurey/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>php通用xml解析类</title>
		<link>http://www.pkphp.com/2008/09/17/php-generic-xml-parser/</link>
		<comments>http://www.pkphp.com/2008/09/17/php-generic-xml-parser/#comments</comments>
		<pubDate>Wed, 17 Sep 2008 12:15:25 +0000</pubDate>
		<dc:creator>askie</dc:creator>
				<category><![CDATA[php]]></category>
		<category><![CDATA[parser]]></category>
		<category><![CDATA[xml]]></category>

		<guid isPermaLink="false">http://www.pkphp.com/?p=647</guid>
		<description><![CDATA[使用代码，文件名：test_xml_parser.php

&#60;?php
/*
* test_xml_parser.php
*
* @(#) $Header: /ho...]]></description>
		<wfw:commentRss>http://www.pkphp.com/2008/09/17/php-generic-xml-parser/feed/</wfw:commentRss>
		<slash:comments>3</slash:comments>
		</item>
		<item>
		<title>蝈蝈采集程序核心代码：任意字符串截取函数</title>
		<link>http://www.pkphp.com/2008/09/03/spy-getstring-function/</link>
		<comments>http://www.pkphp.com/2008/09/03/spy-getstring-function/#comments</comments>
		<pubDate>Wed, 03 Sep 2008 13:38:30 +0000</pubDate>
		<dc:creator>askie</dc:creator>
				<category><![CDATA[php]]></category>
		<category><![CDATA[百宝箱]]></category>
		<category><![CDATA[代码]]></category>
		<category><![CDATA[字符串]]></category>
		<category><![CDATA[采集]]></category>

		<guid isPermaLink="false">http://www.pkphp.com/?p=595</guid>
		<description><![CDATA[今天无聊，公布自己的写的一个函数，这个函数是我的蝈蝈采集系统的核心函数。通过这个函数，你可以把获取到的html代码按照你想要的部分提取出来。这个函数的特点是简单易用，不需要正则。有了这个函数你也可以写采集程序了！哈哈！

代码如下：


&#60;?
/*
*  作者：askie
*  主页：http://www.pkphp.com
*  email...]]></description>
		<wfw:commentRss>http://www.pkphp.com/2008/09/03/spy-getstring-function/feed/</wfw:commentRss>
		<slash:comments>2</slash:comments>
		</item>
		<item>
		<title>php查询alexa排名的代码</title>
		<link>http://www.pkphp.com/2008/07/25/php%e6%9f%a5%e8%af%a2alexa%e6%8e%92%e5%90%8d%e7%9a%84%e4%bb%a3%e7%a0%81/</link>
		<comments>http://www.pkphp.com/2008/07/25/php%e6%9f%a5%e8%af%a2alexa%e6%8e%92%e5%90%8d%e7%9a%84%e4%bb%a3%e7%a0%81/#comments</comments>
		<pubDate>Fri, 25 Jul 2008 15:37:22 +0000</pubDate>
		<dc:creator>askie</dc:creator>
				<category><![CDATA[php]]></category>
		<category><![CDATA[alexa]]></category>
		<category><![CDATA[代码]]></category>
		<category><![CDATA[查询]]></category>

		<guid isPermaLink="false">http://www.pkphp.com/?p=341</guid>
		<description><![CDATA[                  1: &#60;?PHP

         2: /*

         3: update: askie 

         4: Homepage: http://www.pkphp.com

         5: email: askie@sohu.com

         6: */

         7: class Alexa 

         8: {

         9: private $badclasses;

        10: private $site;

        11: private $cache;...]]></description>
		<wfw:commentRss>http://www.pkphp.com/2008/07/25/php%e6%9f%a5%e8%af%a2alexa%e6%8e%92%e5%90%8d%e7%9a%84%e4%bb%a3%e7%a0%81/feed/</wfw:commentRss>
		<slash:comments>2</slash:comments>
		</item>
		<item>
		<title>linux和windows下均可查询pr的php代码</title>
		<link>http://www.pkphp.com/2008/07/25/linux%e5%92%8cwindows%e4%b8%8b%e5%9d%87%e5%8f%af%e6%9f%a5%e8%af%a2pr%e7%9a%84php%e4%bb%a3%e7%a0%81/</link>
		<comments>http://www.pkphp.com/2008/07/25/linux%e5%92%8cwindows%e4%b8%8b%e5%9d%87%e5%8f%af%e6%9f%a5%e8%af%a2pr%e7%9a%84php%e4%bb%a3%e7%a0%81/#comments</comments>
		<pubDate>Thu, 24 Jul 2008 17:13:57 +0000</pubDate>
		<dc:creator>askie</dc:creator>
				<category><![CDATA[php]]></category>
		<category><![CDATA[linux]]></category>
		<category><![CDATA[pr]]></category>
		<category><![CDATA[windows]]></category>
		<category><![CDATA[代码]]></category>
		<category><![CDATA[查询]]></category>

		<guid isPermaLink="false">http://www.pkphp.com/?p=324</guid>
		<description><![CDATA[                  1: &#60;?php

         2: // 7/25/2008 - Updated by Askie (http://www.pkphp.com/)

         3: // 3/20/2008 - Updated by Roger Collins (http://www.rogercollins.com/)

         4: // to remove graphing step

         5:&#160; 

         6: //PageRank Lookup v1.1 by HM2K (update: 31/0...]]></description>
		<wfw:commentRss>http://www.pkphp.com/2008/07/25/linux%e5%92%8cwindows%e4%b8%8b%e5%9d%87%e5%8f%af%e6%9f%a5%e8%af%a2pr%e7%9a%84php%e4%bb%a3%e7%a0%81/feed/</wfw:commentRss>
		<slash:comments>2</slash:comments>
		</item>
		<item>
		<title>PHP中htmlentities跟htmlspecialchars的区别</title>
		<link>http://www.pkphp.com/2008/06/30/php%e4%b8%adhtmlentities%e8%b7%9fhtmlspecialchars%e7%9a%84%e5%8c%ba%e5%88%ab/</link>
		<comments>http://www.pkphp.com/2008/06/30/php%e4%b8%adhtmlentities%e8%b7%9fhtmlspecialchars%e7%9a%84%e5%8c%ba%e5%88%ab/#comments</comments>
		<pubDate>Mon, 30 Jun 2008 13:25:57 +0000</pubDate>
		<dc:creator>askie</dc:creator>
				<category><![CDATA[php]]></category>
		<category><![CDATA[htmlentities]]></category>
		<category><![CDATA[htmlspecialchars]]></category>
		<category><![CDATA[区别]]></category>

		<guid isPermaLink="false">http://www.pkphp.com/?p=117</guid>
		<description><![CDATA[很多人都以为htmlentities跟htmlspecialchars的功能是一样的，都是格式化html代码的，我以前也曾这么认为，但是今天我发现并不是这样的。

这两个函数在格式化带有英文字符的html代码的时候基本没啥问题，但是htmlentities对中文字符也不放过，这样得出来的结果是中文字符 部分变为一堆乱码。当时做英文站的时候根本就没觉...]]></description>
		<wfw:commentRss>http://www.pkphp.com/2008/06/30/php%e4%b8%adhtmlentities%e8%b7%9fhtmlspecialchars%e7%9a%84%e5%8c%ba%e5%88%ab/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>SCWS简易中文分词系统</title>
		<link>http://www.pkphp.com/2008/06/12/scws%e7%ae%80%e6%98%93%e4%b8%ad%e6%96%87%e5%88%86%e8%af%8d%e7%b3%bb%e7%bb%9f/</link>
		<comments>http://www.pkphp.com/2008/06/12/scws%e7%ae%80%e6%98%93%e4%b8%ad%e6%96%87%e5%88%86%e8%af%8d%e7%b3%bb%e7%bb%9f/#comments</comments>
		<pubDate>Thu, 12 Jun 2008 15:04:26 +0000</pubDate>
		<dc:creator>askie</dc:creator>
				<category><![CDATA[LAMP]]></category>
		<category><![CDATA[php]]></category>
		<category><![CDATA[SCWS]]></category>
		<category><![CDATA[中文]]></category>
		<category><![CDATA[分词]]></category>
		<category><![CDATA[简易]]></category>
		<category><![CDATA[系统]]></category>
		<category><![CDATA[词性]]></category>

		<guid isPermaLink="false">http://www.pkphp.com/?p=76</guid>
		<description><![CDATA[SCWS-1.x.x 自述文件 (Written by hightman)
HomePage: http://www.hightman.cn

$Id: README,v 1.1.1.1 2008/03/04 14:00:36 hightman Exp $

&#62; ----------------------------------------------------------- &#60;
1. 简介

2. 安装说明

3. API 使用说明

4. 配套工具

5. PHP 扩展安装说明

6. 代码...]]></description>
		<wfw:commentRss>http://www.pkphp.com/2008/06/12/scws%e7%ae%80%e6%98%93%e4%b8%ad%e6%96%87%e5%88%86%e8%af%8d%e7%b3%bb%e7%bb%9f/feed/</wfw:commentRss>
		<slash:comments>2</slash:comments>
		</item>
		<item>
		<title>memcache测试脚本</title>
		<link>http://www.pkphp.com/2008/03/29/memcache%e6%b5%8b%e8%af%95%e8%84%9a%e6%9c%ac/</link>
		<comments>http://www.pkphp.com/2008/03/29/memcache%e6%b5%8b%e8%af%95%e8%84%9a%e6%9c%ac/#comments</comments>
		<pubDate>Fri, 28 Mar 2008 16:12:57 +0000</pubDate>
		<dc:creator>askie</dc:creator>
				<category><![CDATA[LAMP]]></category>
		<category><![CDATA[php]]></category>

		<guid isPermaLink="false">http://www.pkphp.com/?p=19</guid>
		<description><![CDATA[&#60;?php
//连接
$mem = new Memcache;
$mem-&#62;connect(&#8220;127.0.0.1&#8220;, 11211);
//保存数据
$mem-&#62;set(&#8216;key1&#8216;, &#8216;This is first value&#8216;, 0, 60);
$val = $mem-&#62;get(&#8216;key1&#8216;);
echo &#8220;Get key1 value: &#8220; . $val .&#8220;&#60;br&#62;&#8220;;
//替换数据
$mem-&#62;replace(&#8216;key1&#8216;, &#8216;This is replace value&#8216;, 0, 60);
$val = $mem-&#62;get(&#8216;key1&#8216;);
echo &#8220;Get key1 value: &#8220; . $val . &#8220;&#60;br&#62;&#8220;;
//保存数组
$arr = array(&#8216;aaa&#8216;, &#8216;bbb&#8216;, &#8216;ccc&#8216;, &#8216;ddd&#8216;);
$mem-&#62;set(&#8216;key2&#8216;, $arr, 0, 60);
$val2 = $mem-&#62;get(&#8216;key2&#8216;);
echo &#8220;Get key2 value: &#8220;;
print_r($val2);
echo &#8220;&#60;br&#62;&#8220;;
//删除数据
$mem-&#62;delete(&#8216;key1&#8216;);
$val = $mem-&#62;get(&#8216;key1&#8216;);
echo &#8220;Get key1 [...]]]></description>
		<wfw:commentRss>http://www.pkphp.com/2008/03/29/memcache%e6%b5%8b%e8%af%95%e8%84%9a%e6%9c%ac/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
	</channel>
</rss>
