























昨天有幸拜读了洞庭散人的<基于朴素贝叶斯分类器的文本分类算法>,我正在学习这个,我从内心感谢洞庭散人的分享!随即我把它移植到了c#平台上。
该程序用到了Lucene.Net,用到了基于词典的ICTCLAS中文分词1.0.
ICTCLAS中文分词for Lucene.Net接口代码(实现Analyzer):
Code
ICTCLAS中文分词for Lucene.Net接口代码(实现Tokenizer):
Code
中文分词器代码:
Code
训练管理器代码:
Code
先验概率计算代码:
Code
条件概率计算代码:
Code
用于保存分类结果的类:
Code
贝叶斯分类器代码:
Code
代码太多,编辑的时候卡的很,于是再整个(二)
此内容由惯性聚合(RSS阅读器)自动聚合整理,仅供阅读参考。 原文来自 — 版权归原作者所有。