Lucene从基础到实战高级(实现华电内部搜索项目)
课程目录
1. Lucene概述
1.1 课程概述
1.2 认识Lucene
1.3 Lucene的经典应用
1.4 Lucene基本开发环境配置
2. Lucene系统架构
2.1 Lucene的特点
2.2 核心包及其功能介绍
2.3 Lucene核心索引类介绍
2.4 Lucene核心搜索类介绍 5 E! s& s0 P8 a" L1 G$ u8 C
2.5 Lucene与关系数据库
2.6 Lucene内部实现原理 % L: R- H2 ^& _% U4 f$ z- V
3. 索引
3.1 为什么要用索引
3.2 Lucene索引的优越性 * o- T( X# D' ]
3.3 Lucene索引建立 * {% e+ i6 h C H- l
3.4 利用Lucene组件建立索引
3.5 删除Document 5 p8 \3 b V: [# @7 S
3.6 恢复删除 6 ]' c+ a, {, ~) O+ P8 G
3.7 Document更新操作
3.8 使用RamDirectory & ?1 d4 J6 e. o7 ^$ }
3.9 Document的Boost设置 + ]# }2 h0 \1 N& i( J' u" u
3.10 索引优化
4. 搜索 ( S7 v7 f- X0 @8 A6 P3 @
4.1 简单搜索的实现
4.1.1 指定字段的搜索
4.1.2 ScoreDoc的运用
4.2 Query类的使用 $ P. E+ s( C0 q+ B
4.2.1 搜索中使用TermQuery
4.2.2 搜索中使用RangeQuery 8 S2 M# b1 B d
4.2.3 搜索中使用PreFixQuery
4.2.4 搜索中使用FuzzyQuery
4.2.5 搜索中使用WilcardQuery
4.2.6 搜索中使用BooleanQuery " a( X+ G4 S0 t) R6 @7 Z* [+ {
4.4分页搜索的实现 ; p/ s' i: {. {* a$ u8 `( e/ c
4.3 QueryParser类的使用
4.3.1 默认的字段中检索 , O6 Z4 p* k; w; z. L4 d
4.3.2 搜索中运用逻辑运算 j# I8 E: F# F# o9 P; C
4.3.3 前缀搜索和模糊搜索 / m! Z( A9 \1 @4 J5 Z
4.3搜索的总结 , b. f8 m2 p: t; m7 r
5 分词
5.1 分词的基本原理
5.2 Lucene分词器的使用 * a: {/ n: W5 r5 o; s
5.3 中文分词
5.3.1 中文分词的基本原理 0 b. }7 F8 }7 L% t/ `
5.3.2 优秀中文分词器介绍 \5 O" k+ W& u- ]4 U4 g. v
5.3.3在搜索中使用中文分词器
6. 解析文档
6.1 XML文件的索引 # s: p/ ?) h. ]; A
6.1.1 了解XPath $ [! {3 `; M, a% K% L6 Z, o
6.1.2 XML解析
6.2 PDF文档的索引
6.1 使用PDFBox处理PDF文档
6.2 使用xpdf来处理中文PDF文档 4 `7 C6 V- z4 z% j) |- v& C
6.3 HTML文档索引 ( e* b, D; L+ k5 x" K9 j( ~+ [3 N
6.3.1 获取HTML源文档 k) i# N0 Q2 B3 }; a
6.3.2 使用JTidy
6.3.2 使用NekoHTML * x2 \3 k( T, k' v- J$ n- H
6.3.3 使用HttpClient - b' Y( T6 o7 T/ r- N
6.3.4 使用HTMLParser
6.4 Word文档的索引
6.4.1 POI对Word的处理类
6.4.2 使用Jacob来处理Word文档 2 k4 c/ }1 @" [7 s$ L6 a: ~1 t
7. 高亮 4 ]. ]0 f9 I& [0 {1 r* O
7.1 高亮的基本原理 & V+ u& K* [) Q: {+ C
7.2 在搜索中使用高亮 9 I I2 G/ p; _% }
8. 网络爬虫Heritrix " V, D, I+ _1 u( I: E
8.1 Heritrix使用入门
8.2 Heritrix的架构 4 z2 O# ]8 `8 X( H [' o- Q
8.3 Heritrix的应用 s8 R) P7 F0 i1 \
9. 项目实战-华电企业内部文档搜索系统(项目截图稍后公布)
9.1 需求说明 + d$ P' x- t" U1 H
9.2 系统架构介绍 ; `5 p0 l, a+ }
9.2.1 技术方案的选择 3 u: e% w5 H6 K( w. ~0 G+ e7 _
9.2.2 使用Ibatis . s+ T e$ y' o( a
9.3 系统模块分析
9.4 系统开发
下载地址:
|