2016年4月10日 星期日

[研究] HTTrack WebSite Copier 使用於 .BAT 之命令列參數研究

[研究] HTTrack WebSite Copier 使用於 .BAT 之命令列參數研究

2016-04-09

HTTrack WebSite Copier Version 3.48-21 (03/14/2015)
https://www.httrack.com/
下載 httrack_x64-3.48.21.exe

軟體預設安裝在這個目錄
C:\Program Files\WinHTTrack

(下圖) 先用 GUI 版本的 WinHTTrack 去設定和掃描


(下圖) 預設抓取內容為
+*.png +*.gif +*.jpg +*.jpeg +*.css +*.js -ad.doubleclick.net/* -mime:application/foobar


(下圖) 改成只抓取某網站下的
(不然抓取該網站時,會連其他網站都抓取)







C:\WebSite\MyWeb\hts-log.txt
第二行


(winhttrack -qwC2%Ps2u1%s%uN0%I0p3DaK0H0%kf2A25000%f#f -F "Mozilla/4.5 (compatible; HTTrack 3.0x; Windows 98)" -%F "<!-- Mirrored from %s%s by HTTrack Website Copier/3.x [XR&CO'2014], %s -->" -%l "en, *" http://www.myweb.tw/ -O1 "C:\WebSite\MyWeb" +www.myweb.tw/*.* )


把一開始的 winhttrack 換成  "C:\Program Files\WinHTTrack\httrack",前後的括弧拿掉,變成下面,就可以放入 .BAT 批次檔案中使用。


"C:\Program Files\WinHTTrack\httrack"   -qwC2%Ps2u1%s%uN0%I0p3DaK0H0%kf2A25000%f#f -F "Mozilla/4.5 (compatible; HTTrack 3.0x; Windows 98)" -%F "<!-- Mirrored from %s%s by HTTrack Website Copier/3.x [XR&CO'2014], %s -->" -%l "en, *" http://www.myweb.tw/ -O1 "C:\WebSite\MyWeb" +www.myweb.tw/*.*


前面再加上幾個命令,利用工作排程每天去執行,變成下面


@rem  WebSite : MyWeb Mirror EveryDay

del /s /q C:\MyWebOld

move C:\MyWebNew  C:\MyWebOld

"C:\Program Files\WinHTTrack\httrack"   -qwC2%Ps2u1%s%uN0%I0p3DaK0H0%kf2A25000%f#f -F "Mozilla/4.5 (compatible; HTTrack 3.0x; Windows 98)" -%F "<!-- Mirrored from %s%s by HTTrack Website Copier/3.x [XR&CO'2014], %s -->" -%l "en, *" http://www.myweb.tw/ -O1 "C:\WebSite\MyWeb" +www.myweb.tw/*.*

@rem 這是自己另外要寫的 (程式還在開發中,不在此篇中討論)
C:\WebSiteCompae\WebSiteCompae.exe


每天排程執行後,
C:\MyWebOld 是昨天的內容
C:\MyWeb 是今天的內容
另外再自己開發一隻程式,每天比較2個目錄,就可知道網站是否被變動。

但是後來好像發現有問題,第2 ? 3 次使用就不行了

最後參考這裡
https://www.httrack.com/html/fcguide.html

簡化成


"C:\Program Files\WinHTTrack\httrack"   http://www.myweb.tw/   -O   "C:\WebSite\MyWeb" +www.myweb.tw/*.*
    
  (完)

沒有留言:

張貼留言