close
Warning:
Can't synchronize with repository "(default)" (Unsupported version control system "svn": /usr/lib/python2.7/dist-packages/libsvn/_fs.so: failed to map segment from shared object: Cannot allocate memory). Look in the Trac log for more information.
Crawlzilla 2.0
- 近期發現的 Bug / 缺點
- install 程式不支援無線網卡
- 升級/反安裝 -> 舊的資料如何保存或移植延續?!(Stateless)
- Recrawl 進行時必須保留原本的 CrawlDB,等完成後才覆蓋掉。
- 想法:
- 套件化(分離 Nutch, Lucene, Hadoop 的部份) - 預設用單機版
- 與 Solr 結合 -> 與 ElasticSearch 結合?!
- 與 Carrot2 結合? 搜尋結果分群分類(Search Clustering)
- 過去有人提報過的 Nutch Debian 套件 WNPP
Download in other formats: