wiki:crawlzilla/v1.0_relasedNote

Version 3 (modified by shunfa, 13 years ago) (diff)

--

Crawlzilla v1.0 Release Note

What's new?

  • 更新Nutch核心版本1.2
  • 多人共享:只需要申請一個帳號即可擁有自己的搜尋引擎
  • 系統排程:系統任務設定完成後,可設定是否要即時執行,或預約Job的爬取時間
  • 索引庫自動更新:設定更新頻率,讓搜尋引擎隨時擁有最新的資訊
  • 軟體自動更新:自動偵測更新Crawlzilla管理版本
  • 即時體驗網址:http://demo.crawlzilla.info/

安裝Crawlzilla

多人版本網頁操作簡易說明

身份:網頁管理者

管理者為網頁操作管理權限最大的使用者,並不局限於系統的建立者,目前的開放權限如下:

  • 審核新的使用者
  • 管理已註冊之使用者清單
  • 瀏覽各使用者所建立的搜尋引擎數目,但無法瀏覽其他使用者的搜尋引擎內容

首次登入注意事項

  • 預設帳號為admin,預設密碼為crawler,基於安全考量,請於安裝完成後立即修改密碼
  • 登入後請於"系統設定"選項設定管理者的e-mail位址

審核使用者帳號

  • 請於"系統選項"中,"會員帳號管理"進行使用者審核,如下圖依指示操作即可:

身份:一般使用者

使用者註冊

  • 進入註冊頁面,如下圖依指示輸入項目即可:

搜尋引擎建立及其他系統功能

網頁爬取

  • 進入"crawl"選項,如下圖依指示操作即可:
註:若無設定排成,當使用者送出時,則會立即執行此一任務,排程方法請參考以下。
設定排程
  • 進入"crawl"選項,並開啟第二選項"排程設定(Option)",如下圖依指示操作即可:
  • 送出後畫面如下:

索引庫管理

索引庫管理選項延續v3.0版本提供之功能,如下:

  • 刪除索引庫
  • 重新爬取
  • 瀏覽索引庫

排程已存在的搜尋引擎

  • 開啟"系統排程"選項,,如下圖依指示操作即可:

  • 送出後即可看到排程資訊,如下圖:

Attachments (9)

Download all attachments as: .zip