Hämta källa från http://mirror.nyi.net /apache//nutch/apache-nutch-1.2-src.zip
Öppna org.apache.nutch.crawl.Crawl
klass i din editor.
Uppslagsvariabel Path crawlDb = new Path(dir + "/crawldb");
Variabeln kommer att ge en ledtråd om var du ska ersätta koden för att få din egen CustomMySQLCrawl
klass.
Beständigheten händer under det här samtalet:crawlDbTool.update(crawlDb, segs, true, true); // update crawldb
Så det är där du bör spara den i databasen. Du kanske vill överväga att integrera viloläge vid det här laget.