2012年12月11日 星期二

基於Search Engine之中文分詞

http://my.opera.com/jinglepot/blog/index.dml/tag/solr
http://kb.trisugar.com/node/9751
http://code.google.com/p/mmseg4j/ mmseg4j MMSEG for java lucene chinese analyzer, or for solr
http://chenlb.iteye.com/blog/353334 中文分词 mmseg4j
http://chenlb.iteye.com/blog/439843 讨论 mmseg4j 的现状,与改进
http://railsfun.tw/viewthread.php?tid=672 CoreSeek :Sphinx + 中文字典檔:中文分詞搜尋引擎
http://www.mobile01.com/topicdetail.php?f=62&t=339949&last=34826211 求繁體中文版的ZDic[台灣教育部國語辭典]
http://blog.fulin.org/2009/08/lucene_chinese_analyzer_compare.html 当前几个主要的Lucene中文分词器的比较
http://technology.chtsai.org/mmseg/ MMSEG: A Word Identification System for Mandarin Chinese Text Based on Two Variants of the Maximum Matching Algorithm
http://manan.org/2011/08/using_ictclas_in_java_and_lucene/ 在Java程序和Lucene中使用中科院分词系统ICTCLAS
http://ictclas.org/content_java_002.html 给Lucene加入性能更好的中文分词
http://hi.baidu.com/drkevinzhan ICTCLAS张华平博士的空间
http://kb.trisugar.com/node/9751 利用Lucene制作中文搜尋應用


沒有留言:

張貼留言