`
out345
  • 浏览: 7917 次
  • 性别: Icon_minigender_1
  • 来自: 北京
最近访客 更多访客>>
社区版块
存档分类
最新评论
文章列表
http://www.iteye.com/news/4931 Carrot2 3.0发布:开源的搜索结果聚合引擎

学习nutch

Pattern.compile("<meta\\s+([^>]*http-equiv=\"?content-type\"?[^>]*)>",                     Pattern.CASE_INSENSITIVE); 中 Pattern.CASE_INSENSITIVE 的含义是不区分大小写
环境要求:           *  Java 1.6          * Eclipse Europa 3.3.2 1 安装cygwin 选包的时候选上openssh 2 设置环境变量path c:\cygwin\bin;c:\cygwin\usr\bin 3 配置ssh 输入 ssh-host-config 然后按照提示输入no yes ntsec 4 启动windows的 服务中的 CYGWIN sshd 5 使用ssh-keygen 设置访问无密码操作       cat id_rsa.pub >> authorized_keys 6 下载hadoop hadoop-si ...
国外开发的相关程序 1、Nutch 官方网站 http://www.nutch.org/ 中文站点 http://www.nutchchina.com/ 最新版本:Nutch 0.7.2 Released Nutch 是一个开源Java 实现的搜索引擎。它提供了我们运行自己的搜索引擎所需的全部工具,可以建立自己内部网 ...
xunlei 是资源的垂直搜索引擎,flickr 是photo/images,youtube 应该是视频,digg 是社会化新闻,ctrip/qunar应该是酒店、旅行相关,大众点评是餐馆,豆瓣是 book/movie/music,myspace 应该是社区,qihoo 不怎么垂直,应该是传统搜索引擎,这也包括其他专业的 blog 搜索引擎,这类网站迟早被 google/baidu 干掉,因为他们不怎么垂直,也不“社会化”。 纵观成功的2.0网站,其实都是一个十分庞大的“搜索引擎”,它要么是利用自己的技术,建立一个“垂直”的数据库,要么利用“网民”的力量来建立,或者两者结合。仔细分享上面举的例 ...
web 服务器传送页面实浏览器可以浏览,应用服务器的提供客户端应用程序可以调用的方法,确切的说 web服务器处理的实http请求,而应用服务器则实通过很多协议为应用程序提供商业逻辑!
http://www.hellocto.com/(java c# php ajax等等) http://www.open-open.com/(java开源大全)
http://wiki.apache.org/nutch/NutchHadoopTutorial
Global site tag (gtag.js) - Google Analytics