php中文分词系统

| | 2012/07/12 09:04 , mdy
PHP , 评论(0) , 阅读(2649) , Via 本站原创
Tags: ,
最近需要用到关键字,需要分词,查找了百度,发现2个不错的PHP分词程序,一个是织梦的DEDE分词程序。另一个是基于http协议的开源张宴的中文分词系统(基于linux)
区别:
从查找速度测试 基于http协议的底层分词程序要速度快,但是限制也颇多,首先必须拥有一个vps以上的能独立安装程序的服务器(linux)
织梦的分词速度就稍微慢点,不过也能接受

准确性:
织梦的分词准确性一般,我测试还可以,网上有说不准确的。 张宴的http协议分词系统要更准确,最关键的一点是可以自己添加想要的分词关键字,织梦的分词词典没有说明不好添加。

总结:偏向于httpd协议的开源中文分词程序。如果是虚拟主机用dede分词程序即可,毕竟是纯php的不需要服务器支持即可。

下载文件 (已下载 348 次)