飘易博客(作者:Flymorn)
订阅《飘易博客》RSS,第一时间查看最新文章!
飘易首页 | 留言本 | 关于我 | 订阅Feed

C#中文分词算法:IKAnalyzerNet

Author:飘易 Source:飘易
Categories:C#编程 PostTime:2011-1-13 18:10:12
正 文:
    C#中文分词算法:IKAnalyzerNet的使用。

需要先引用dll库文件 IKAnalyzerNet.dll + Lucene.Net.dll + PowerCollections.dll 这三个,打包在本文下方,使用VS2008调试通过:


using IKAnalyzerNet;
using IKAnalyzerNet.dict;
using Lucene.Net.Analysis;
using Wintellect.PowerCollections;


使用方法举例:

        private void button1_Click(object sender, EventArgs e)
        {
            String testString = richTextBox2.Text ;
            String slen = testString.Length.ToString();

            IKAnalyzer ika = new IKAnalyzer();

            System.IO.TextReader r = new System.IO.StringReader(testString);
            TokenStream ts = ika.TokenStream("TestField", r);
            int m = 0;
            long begin = System.DateTime.Now.Ticks;
            for (Token t = ts.Next(); t != null; t = ts.Next())
            {
                m++;
                richTextBox1.Text += m + ")" + (t.StartOffset() + "," + t.EndOffset() + " = " + t.TermText()) + "\r\n";
            }

            int end = (int)((System.DateTime.Now.Ticks - begin) / 10000);

            richTextBox1.Text += ("长度:" + slen + " 耗时: " + (end) + "ms" + " 分词个数:" + m + " 效率(词/秒):" + ((int)(m * 1.0f / (end) * 1000))) + "\r\n";
            }

截图如下:
C#中文分词算法:IKAnalyzerNet

下载地址:
中文分词算法:IKAnalyzerNet.rar
作者:飘易
来源:飘易
版权所有。转载时必须以链接形式注明作者和原始出处及本声明。
上一篇:C#中文分词算法:ChineseAnalyzer
下一篇:百度算法BUG和DNSPOD的漏洞
1条评论 “C#中文分词算法:IKAnalyzerNet”
2011-2-24 16:20:43
学习  拜读!!!~~~~~
发表评论
名称(*必填)
邮件(选填)
网站(选填)

记住我,下次回复时不用重新输入个人信息
© 2007-2010 飘易博客 Www.Piaoyi.Org 原创文章版权由飘易所有 渝ICP备07006361号