Your Ad Here
首页 | 编程语言 | 网站建设 | 游戏天堂 | 冲浪宝典 | 网络安全 | 操作系统 | 软件时空 | 硬件指南 | 病毒相关 | IT 认证
软讯网络 > 编程语言 > Java > 使用ant驱动nutch crawl
【标  题】:使用ant驱动nutch crawl
【关键字】:ant,nutch,crawl
【来  源】:http://blog.csdn.net/pwlazy/archive/2006/08/01/1008514.aspx

使用ant驱动nutch crawl

Your Ad Here 在windows下 跑nutch  crawl必须使用cygwin,没办法的事情,目前nutch只有shell脚本驱动,这多多少少给windows开发者带来一些麻烦,虽然通常情况下,java应用总会部署在unix机器上,即使如此,对于众多在windows上开发 java 应用的开发者来说,不需要装什么其他东西,直接在window环境中就能跑 nutch  crawl显得更省力,下面将nutch-0.7.1 bin目录下的nutch shell 脚本直接转换成ant脚本,nutch玩家直接将ant脚本放在nutch-0.7.1下直接运行即可,当然你应该根据你的需求设置一些脚本元素

<project name="nutch-crawl" default="crawl" basedir=".">
    
    
<property name="lib.dir"  location="lib"/>
    
<property name="conf.dir"  location="conf"/>
    

    
<path id="project.classpath">
        
<fileset dir="." includes="nutch-*.jar"/>
        
<fileset dir="lib" />
       
<pathelement path="."/>
        
<pathelement path="${conf.dir}"/>
    
</path>
    
    
    
<target name="crawl" >
        
<echo>crwaling starting...</echo>
        
<property name="JVM.extra.args" value="-Xmx1000m" />
        
<java classname="org.apache.nutch.tools.CrawlTool" classpathref="project.classpath" fork="true">
            
<jvmarg line="${JVM.extra.args}"/>
            
<arg value="e:/nutch-0.7.1/urls"/>
            
<arg value="-dir"/>
            
<arg value="e:/xxcrawled"/>
            
<arg value="-depth"/>
            
<arg value="2"/>
            
<arg value="-threads"/>
            
<arg value="10"/>
        
</java>
        
<echo>crwaling finished...</echo>
    
</target>
    
</project>

注意上面代码中的<arg>,你可以根据要求设置.
Serializable 使用心得:【上一篇】
Webwork2+Spring+Hibernate体验:【下一篇】
【相关文章】
  • Ant在Java平台下的使用开发
  • Infragistics 发布 NetAdvantage for JSF 2006
  • 使用ant
  • 用Ant和Eclipse有效地提高部署效率
  • 惠普Proliant DL380服务器一站式集群方案
  • openWEBant网站采集器功能设计
  • Linux下用xsupplicant或mdc拨号上网
  • xsupplicant安装使用说明
  • is DTO an antipattern in EJB 3.0 ?
  • 用ant进行快速开发
  • 【随机文章】
  • 游戏工程方法理念
  • 讨论Web IM技术的实现过程
  • Eclipse插件设置
  • cut,awk的用法
  • SharpPad文本编辑器: 已完成添加代码自动完成、代码折叠等功能
  • 成功软件开发者的9种编程习惯
  • Windows NT/2000 服务器安全设置与效率优化(2)
  • CNET JSP BASIC: 简介
  • 第六章 输出函数
  • Flash 3d效果精彩实例(6)
  • 【相关评论】
    没有相关评论
    【发表评论】
    姓名:
    邮件:
    随机码*
    评论*
          
    |  首 页  |  版权声明  |  联系我们   |  网站地图  |
    CopyRight © 2004-2007 bbb软讯网络 All Rigths Reserved.