日韩精品欧美激情国产一区_中文无码精品一区二区三区在线_岛国毛片AV在线无码不卡_亞洲歐美日韓精品在線_使劲操好爽好粗视频在线播放_日韩一区欧美二区_八戒八戒网影院在线观看神马_亚洲怡红院在线色网_av无码不卡亚洲电影_国产麻豆媒体MDX

PHP基于pscws4中文分詞

時間:2019-04-03 00:54:19 類型:PHP
字號:    

查詢分詞是我們經(jīng)常使用的技術(shù), 實際效果如下:

搜索: 中國人自己的芯片企業(yè)在哪里, 分出: 芯片,中國人,哪里,自己,企業(yè)

然后我們就可以通過這幾個關(guān)鍵詞來搜索文章

這里給一個scws方法的使用實例

pscws4類下載地址:http://www.xunsearch.com/scws/down/pscws4-20081221.tar.bz2

辭典文件下載路徑:http://www.xunsearch.com/scws/down/scws-dict-chs-utf8.tar.bz2

一. PHP原生應(yīng)用

require './pscws4/pscws4.class.php';
$pscws = new PSCWS4('utf8');
$pscws->set_dict('./pscws4/dict.utf8.xdb');
$pscws->set_rule('./pscws4/etc/rules.utf8.ini');
$pscws->set_ignore(true);
$text = "南昌雅騰歡迎大家";
$pscws->send_text($text);
$words = $pscws->get_tops(3); //最多取幾個
$pscws->close();

$tags = array();
foreach ($words as $val) {
	$tags[] = $val['word'];
}
	
echo  implode(',', $tags);

大家下載的代碼, 使用的過程中需要調(diào)整的兩個bug 

1. 有個異?!癛edefining already defined constructor for class PSCWS4”,這是因為__construct要放在同名構(gòu)造函數(shù)之前

 2. 顯示的中文為亂碼 需要將pscws4.class.php的構(gòu)造函數(shù)修改如下 //function __construct() { $this->PSCWS4(); } function __construct($charset = 'gbk') { $this->PSCWS4($charset); }


二. tp5.0下應(yīng)用

    1. 將pscws4類及字典放到extend目錄下

    2. 控制器函數(shù)里面加載