查詢分詞是我們經(jīng)常使用的技術(shù), 實際效果如下:
搜索: 中國人自己的芯片企業(yè)在哪里, 分出: 芯片,中國人,哪里,自己,企業(yè)
然后我們就可以通過這幾個關(guān)鍵詞來搜索文章
這里給一個scws方法的使用實例
pscws4類下載地址:http://www.xunsearch.com/scws/down/pscws4-20081221.tar.bz2
辭典文件下載路徑:http://www.xunsearch.com/scws/down/scws-dict-chs-utf8.tar.bz2
一. PHP原生應(yīng)用
require './pscws4/pscws4.class.php'; $pscws = new PSCWS4('utf8'); $pscws->set_dict('./pscws4/dict.utf8.xdb'); $pscws->set_rule('./pscws4/etc/rules.utf8.ini'); $pscws->set_ignore(true); $text = "南昌雅騰歡迎大家"; $pscws->send_text($text); $words = $pscws->get_tops(3); //最多取幾個 $pscws->close(); $tags = array(); foreach ($words as $val) { $tags[] = $val['word']; } echo implode(',', $tags);
大家下載的代碼, 使用的過程中需要調(diào)整的兩個bug
1. 有個異?!癛edefining already defined constructor for class PSCWS4”,這是因為__construct要放在同名構(gòu)造函數(shù)之前
2. 顯示的中文為亂碼 需要將pscws4.class.php的構(gòu)造函數(shù)修改如下 //function __construct() { $this->PSCWS4(); } function __construct($charset = 'gbk') { $this->PSCWS4($charset); }
二. tp5.0下應(yīng)用
1. 將pscws4類及字典放到extend目錄下
2. 控制器函數(shù)里面加載