站长中国
设为首页 | 站长论坛

站长论坛 站长下载
您所在的位置: 站长中国 > 站长学院 > 网络编程 > NET专区 >  正文

 WEBUS2.0 In Action - 创建索引
  2008年02月20日14:37:21  评论(0条) 字体:[ ]
相关热点:
     WEBUS2.0只能够将一种Document数据类型(Webus.Index.Document类)添加到索引中,所有其他类型的数据(如txt、html、word、pdf等等)都需要预先转换成Document才能够对其编制索引:
  
  如此一来,对于新的数据类型,我们只要开发新的Parser就能够将其添加到索引中,因此WEBUS依靠这种方式获得了很高的通用性。
  
  一个Document是多个Field(字段)的集合,每个Field主要包含Name和Value两个属性:
  
  如果我们要将下表的数据添加到索引中,
  
  代码如下:
  1. 准备数据
  
  string[] Titles = new string[] {
   "A Modern Art of Education - Rudolf Steiner",
   "Imperial Secrets of Health and Longevity - Bob Flaws",
   "Tao Te Ching 道德经 - Stephen Mitchell",
   "Godel, Escher, Bach: an Eternal Golden Braid - Douglas Hofstadter"
  };
  string[] Categories = new string[] {
   "/education/pedagogy",
   "/health/alternative/Chinese",
   "/philsosphy/eastern",
   "/technology/computers/ai"
  };
  string[] Subjects = new string[] {
   "education philosophy psychology practice Waldorf",
   "diet chinese medicine qi gong health herbs",
   "taoism",
   "artificial intelligence number theory mathematics music"
  };
  2. 添加索引
  IIndexWriter writer = new IndexManager(new SimpleWordAnalyzer()); //用SimpleWordAnalyzer构造一个Index Writer
  writer.New(@"F:\Index"); //在F:\Index目录新建索引
  for (int i = 0; i < Titles.Length; i++)
  {
   Document doc = new Document();
   doc.Fields.Add(new Field("Title", Titles[i], FieldAttributes.Index | FieldAttributes.Analyse));
   doc.Fields.Add(new Field("Category", Categories[i], FieldAttributes.Index | FieldAttributes.Sort));
   doc.Fields.Add(new Field("Subject", Subjects[i], FieldAttributes.Analyse | FieldAttributes.Index));
   writer.Add(doc); //将Document添加到索引
  }
  writer.Close(); //保存并关闭索引
  
  补充:关于FieldAttributes
  在Field中还有另外一个属性即Attribute(FieldAttributes类型),它与数据无关,但是会直接影响编制索引的行为:
  FieldAttributes.Index:需要编制索引
  FieldAttributes.Analyse:需要经过分析
  FieldAttributes.UnStore:字段值(Field.Value)将不会保存到索引中
  FieldAttributes.Sort:需要排序,选择此项的字段在编制索引时将会排序
  FieldAttributes.Compress:需要压缩,选择此项将用GZip压缩算法对字段值进行压缩
  这5个属性可以组合使用,如FieldAttributes.Default就是一个组合属性,它等于FieldAttributes.Index | FieldAttributes.Sort 。
  
  相关信息及WEBUS2.0 SDK下载:http://www.cnblogs.com/iamzyf/archive/2008/01/02/1023327.html
  
    做人要厚道,请注明转自酷网动力(www.ASPCOOL.COM)。


责任编辑:

收藏本文 打印 打印本文  推荐本文 告诉好友 投稿 投稿邮箱

站长排行

学院

新闻

专栏

盈利

[揭密网络黄链]中国留学生买凶专破日本
JSP语法(6)
超强弹出窗口代码,什么都挡不住
FLASH视觉特效实例之地震效果
贴吧发帖机使用教程(绝对原创)
关于数据分页(转自www.codeproject.co
ASP实现文件直接下载
Photoshop制作光感超酷效果水晶球
 遍历ASP.NET页面控件
永远的后门[经典]+查不出的后门
淘宝网卖家公然叫卖“艳照门”照片集
驳《百度Hi面世对腾讯有利》
Google绿色专家质疑黑色背景网页节省资
国内各IT企业办公环境揭秘(多图)
阿里妈妈广告卖主全攻略
站长创业源动力 主流站长站赏析
推荐阅读:80年小子的创业道理
Discuz!6.0猛将出击 最强论坛程序酷炫
我的网络,我的团队:专访李文明
百度新闻频道改版十天 流量止跌反弹翻
ECSHOP模板制作参考文档
悬挂阿里妈妈会否被百度惩罚
阿里妈妈是否是中小站长的救世主?
最强网店ECShop发新版 众多酷炫功能给
ECSHOP模板下载
土豆网,优酷网,爆米花等视频网站采集
DedeCms模板安装/制作概述
网上商店系统巅峰对决 ECShop vs ShopE
艰难的走在创业的路上 第一天
编程中国全站采集规则
性福联盟 一个不尊重站长的联盟
大脚:日赚100元—揭露最新firefox欺骗
大脚:垃圾站超级赚钱法之二—突破“站
大脚:垃圾站超级赚钱法之——前言
迅雷联盟、快车联盟收入对比
经理人必看的十个管理网站
Google Adsense的秘密 第二版
西联汇款兑付城市查询
不用SEO取得成功的10个步骤
关于做GOOGLE的五条经验
站长学院  网页设计 建站教程 图形图象 网络编程

Photoshop CS3
Photoshop CS3
不用Photoshop
不用Photoshop

DIV+CSS的开发方式 听听另外的
虚拟主机建站动易里快速生成的
VBScript特效代码 满屏幕乱跑
牛气!一个菜鸟站长的超强网站
创建、维护一个个人博客的“投
让网站流量稳步飙升的秘籍
网站推广的基本思想

新闻线索

如果你有站长界人事变动、重组并购、变革技术出现,以及产品投诉等重要新闻线索,请告诉我们,我们会给予特别关注。
0631-3653338
站长中国编辑部
站长中国24小时新闻热线: 13256307008