webdn
 
  首页     免费截图     VIP会员区     广告Banner     技术文档     网站模板  
网站截图,网站每日新 !
虚拟主机
网页模板

首页 >> WebDN 技术文档 >> Html教程 >> Page 7 >> 灵活运用HTML页面中meta元素
 

灵活运用HTML页面中meta元素

[摘 要]


本篇讲述如何灵活运用HTML页面中meta元素的文章为你的站点增添技术性。

1:假如说你的站点页面中有这么一句:

<META NAME="robots" CONTENT="index,follow">

你利用Nutch抓取并分析时,如何得到这个meta数值并处理呢?

2:你可以从HtmlParseFilter扩展出一个RobotsParserFilter,用下面的代码得到meta值:

Properties generalMetaTags = metaTags.getGeneralTags();
String robots = generalMetaTags.getProperty("robots");

3:增加这个值到metadata中:

parse.getData().getMetadata().put("robots", robots);

4: robots属性还可以再次从 metadata获取:

String robots2 = parse.getData().get("robots");



电话咨询:010-60520722 QQ咨询:3792656   |   583696287   |   66733350 关于WebDN  |  站点地图  |  联系我们  |  支付方式  |  友情链接
© 2004-2008 WebDN.com 版权所有. 沪ICP备05040479号