做了一个图书比价的网站,大家来看看

kellersoon 2009-05-28
不错  如何得到其他网站的价格的? 靠爬虫?
aisensiy 2009-09-17
zhzhxh 写道
hi,all

我跟一个朋友近期在业余时间做了一个图书比价的网站

http://www.anybi.com

网站里的图书搜索是基于 lucene的。

各位都是search方面的高手,多多指点吧。
到我们的blog上发表评论 http://blog.anybi.com ,或者在这里回帖都行。


lucene能够那么准确的搜索到你需要的某个网站提供的价格么?还是其中有你大量的过滤优化工作才有了这个结果呢...我是要做类似的工作的,现在毫无头绪呀。
wxwswjws 2009-11-08
感觉相当不错呢,我刚接触搜索,楼主分享下开发经验吧..
kkppccdd 2009-12-09
aisensiy 写道
zhzhxh 写道
hi,all

我跟一个朋友近期在业余时间做了一个图书比价的网站

http://www.anybi.com

网站里的图书搜索是基于 lucene的。

各位都是search方面的高手,多多指点吧。
到我们的blog上发表评论 http://blog.anybi.com ,或者在这里回帖都行。


lucene能够那么准确的搜索到你需要的某个网站提供的价格么?还是其中有你大量的过滤优化工作才有了这个结果呢...我是要做类似的工作的,现在毫无头绪呀。

nutch有扩展点可以在解析页面的时候加入自定的解析逻辑,解析出特定的內容。参考http://trac.lzlaohu.com/wiki/NutchCustomPluginToParseAndAddAField原文是在blogspot.com上的,在天朝被和谐了,我截了一部份保存了。
大体上就是实现两个接口:org.apache.nutch.parse.HtmlParseFilter和org.apache.nutch.indexer.IndexingFilter。
自己最近用nutch给自个儿小站(http://www.lzlaohu.com)做站內搜索。感觉在网站的主题上做错了,正在反思中.....
对于垂直搜索,现在正在研究Yahoo! BOSS,还没看仔细,粗看像是Yahoo!开放它的网页索引库,用户可以使用xsl从它保存的网页中解析出感兴趣的数据。解析出来的数据能用哪些方式调用还不清楚,不知是不是可以像Google AJAX Search方式一样调用。
ximinjie 2010-01-26
楼主能告诉我一下你的搜索结果细分是如何实现的吗?
ximinjie@gmail.com
qzj5851 2010-02-23
你好 我毕业设计也做搜索引擎
也准备用nutch做 。方便的话留个邮箱给我  有什么问题可以请教下。
qzj5851@163.com
blue3377 2010-04-23
qzj5851 写道
你好 我毕业设计也做搜索引擎
也准备用nutch做 。方便的话留个邮箱给我  有什么问题可以请教下。
qzj5851@163.com

,有一样的想法我。我也想做这个,但是发现自己一个人的力量太小了哦。完成不了,有机会我们多交流下哦。我qq是 :317447566 ++ 我哦,注明,来自 javaeye 哈。
pp_vv_pp 2010-07-02
网站做的不错哦。
少主丶无翼 2011-12-19
楼主能开源吗   哈哈
大海lb 2011-12-20
楼主最初的想法被淘宝用了做了一淘!!!看来楼主眼光不错
Global site tag (gtag.js) - Google Analytics