=波 波 日 志=
[转]Lucene.Net 2.3.1开发介绍 —— 二、分词(二)
1.2.1、分词器工作的过程内置的分词器效果都不好,那怎么办?只能自己写了!在写之前当然是要先看看内置的分词器是怎么实现的了。从1.1分析分词效果,可以看出KeywordAnalyzer这个分词器最懒惰,基本什么事情也没做。并不是它不会做,而是
【类型:lucene.net/分词技术 发表时间:2009-09-01】
[转]Lucene.Net 2.3.1开发介绍 —— 二、分词(一)
Lucene.Net中,分词是核心库之一,当然,也可以将它独立出来。目前Lucene.Net的分词库很不完善,实际应用价值不高。唯一能用在实际场合的StandardAnalyzer类,效果也不是很好。内置在Lucene.Net里的分词都被放在项目的Analysis目录下,也
【类型:lucene.net/分词技术 发表时间:2009-09-01】
[原]Lucene.Net 2.3.1开发介绍 —— 一、接触Lucene.Net
1、引用Lucene.Net类库 找到Lucene.Net的源代码,在“C#\src\Lucene.Net”目录。打开Visual Studio,我的版本是2008,而Lucene.Net默认的是2005。先创建一个项目,简单起见,创建一个C#控制台程序。图 1.1然后添加Lucene.Net进项目,如图
【类型:lucene.net/分词技术 发表时间:2009-09-01】
[转]中文分词算法
引:这一篇关于搜索引擎中中文分词算法经典的文章,不敢独享。仅就对小几处的别字做了修改。中文分词算法 1.1.1 最大匹配法分词的缺陷尽管最大匹配法分词是常用的解决的方案,但是无疑它存在很多明显的缺陷,这些缺陷也限制了最大匹配法在
【类型:lucene.net/分词技术 发表时间:2009-06-13】
[转]robots协议和禁止搜索引擎收录
补充禁止搜索引擎,一.什么是robots.txt文件?搜索引擎通过一种程序robot(又称spider),自动访问互联网上的网页并获取网页信息。您可以在您的网站中创建一个纯文本文件robots.txt,在这个文件中声明该网站中不想被robot访问的部分,这样
【类型:lucene.net/分词技术 发表时间:2009-06-13】
[转]Spider: 以遵守robots.txt协议为荣 以匿名盗抓为耻
作者:车东 发表于:2006-11-24 11:11 最后更新于:2007-04-15 19:04版权声明:可以任意转载,转载时请务必以超链接形式标明文章原始出处和作者信息及本版权声明。按照是否匿名和是否遵循robots.txt协议有4种蜘蛛:1 真名真姓,遵循robot
【类型:lucene.net/分词技术 发表时间:2009-06-13】
[原]《Robots.txt 协议标准》介绍
近期有很多站长咨询,怎样正确设置"robots.txt"文件。为了解决广大站长朋友们的疑问,我们对《Robots.txt 协议标准》进行了翻译,希望此篇译文能够帮助大家对"robots.txt"文件有更深的了解。Robots.txt 是存放在站点根目录下的一个纯文本
【类型:lucene.net/分词技术 发表时间:2009-06-12】
[转]lucene中文分词器--版本更新
最新V1.1版分词器,已更新。最新V1.1版分词器,已更新。1.修订了对数量次切分的BUG2.修订了对大文本切分时的重复输出BUG下载地址 Lucene中文分词器 V1.1 CSDN下载Lucene中文分词器 V1.1 Google 下载时间: 2006年12月21日 13:17最新V1.2版
【类型:lucene.net/分词技术 发表时间:2009-06-01】
百度赞助
热门博文
- ·lucene中文分词器--..
- ·Lucene.Net 2.3.1开..
- ·Lucene.Net 2.3.1开..
- ·Lucene.Net 2.3.1开..
- ·中文分词算法
- ·Lucene.Net 2.3.1开..
- ·Lucene.Net 2.3.1开..
- ·lucene.net 2.0 中文..
- ·Lucene.Net 2.3.1开..
- ·Lucene.Net 2.3.1开..
随机博文
- ·国际四级能力考所出..
- ·3.24.手动布局容器
- ·12.2 母版页
- ·SEO怎么优化-怎么做..
- ·CLIP: rect 是什么?
- ·卡巴斯基2009激活码..
- ·ASP.NET 缓存 SqlCa..
- ·15.6.获得声音文件的..
博格Tag
- flash/flex/fcs/AIR(752)
- Asp.Net/C#/WCF(598)
- 操作系统及应用软件(376)
- JavaScript/Ajax(330)
- SQL及数据库(134)
- 黑客技术(115)
- Asp/VBScript(111)
- HTML/WML/CSS兼容/XML(102)
- PHP/apache/Perl(96)
- 网站排名及优化(96)
- 其他(75)
- showbo日志(66)
- lucene.net/分词技术(33)
- 计算机网络(26)
- 机械重工(26)
- C#设计模式(25)
- Google Maps开发(17)
- 日语学习(15)
- Canvas/VML/SVG(13)
- linux(11)
- 游戏开发(8)
- 正则表达式(5)
- Jsp/Java(4)
归档(3034)
- 原创文章
- 热门文章
- 2012年02月(10)
- 2012年01月(28)
- 2011年12月(47)
- 2011年11月(32)
- 2011年10月(27)
- 2011年09月(26)
- 2011年08月(45)
- 2011年07月(21)
- 2011年06月(32)
- 2011年05月(22)
- 2011年04月(34)
- 2011年03月(27)
- 2011年02月(24)
- 2011年01月(37)
- 2010年12月(56)
- 2010年11月(44)
- 2010年10月(17)
- 2010年09月(59)
- 2010年08月(47)
- 2010年07月(66)
- 2010年06月(77)
- 2010年05月(211)
- 2010年04月(254)
- 2010年03月(381)
- 2010年02月(298)
- 2010年01月(83)
- 2009年12月(75)
- 2009年11月(90)
- 2009年10月(2)
- 2009年09月(134)
- 2009年08月(179)
- 2009年07月(229)
- 2009年06月(245)
- 2009年05月(75)
