2016-04-09
HTTrack WebSite Copier Version 3.48-21 (03/14/2015)
https://www.httrack.com/
下載 httrack_x64-3.48.21.exe
軟體預設安裝在這個目錄
C:\Program Files\WinHTTrack
(下圖) 先用 GUI 版本的 WinHTTrack 去設定和掃描
(下圖) 預設抓取內容為
+*.png +*.gif +*.jpg +*.jpeg +*.css +*.js -ad.doubleclick.net/* -mime:application/foobar
(下圖) 改成只抓取某網站下的
(不然抓取該網站時,會連其他網站都抓取)
C:\WebSite\MyWeb\hts-log.txt
第二行
(winhttrack -qwC2%Ps2u1%s%uN0%I0p3DaK0H0%kf2A25000%f#f -F "Mozilla/4.5 (compatible; HTTrack 3.0x; Windows 98)" -%F "<!-- Mirrored from %s%s by HTTrack Website Copier/3.x [XR&CO'2014], %s -->" -%l "en, *" http://www.myweb.tw/ -O1 "C:\WebSite\MyWeb" +www.myweb.tw/*.* ) |
把一開始的 winhttrack 換成 "C:\Program Files\WinHTTrack\httrack",前後的括弧拿掉,變成下面,就可以放入 .BAT 批次檔案中使用。
"C:\Program Files\WinHTTrack\httrack" -qwC2%Ps2u1%s%uN0%I0p3DaK0H0%kf2A25000%f#f -F "Mozilla/4.5 (compatible; HTTrack 3.0x; Windows 98)" -%F "<!-- Mirrored from %s%s by HTTrack Website Copier/3.x [XR&CO'2014], %s -->" -%l "en, *" http://www.myweb.tw/ -O1 "C:\WebSite\MyWeb" +www.myweb.tw/*.* |
前面再加上幾個命令,利用工作排程每天去執行,變成下面
@rem WebSite : MyWeb Mirror EveryDay
del /s /q C:\MyWebOld
move C:\MyWebNew C:\MyWebOld "C:\Program Files\WinHTTrack\httrack" -qwC2%Ps2u1%s%uN0%I0p3DaK0H0%kf2A25000%f#f -F "Mozilla/4.5 (compatible; HTTrack 3.0x; Windows 98)" -%F "<!-- Mirrored from %s%s by HTTrack Website Copier/3.x [XR&CO'2014], %s -->" -%l "en, *" http://www.myweb.tw/ -O1 "C:\WebSite\MyWeb" +www.myweb.tw/*.* @rem 這是自己另外要寫的 (程式還在開發中,不在此篇中討論) C:\WebSiteCompae\WebSiteCompae.exe |
每天排程執行後,
C:\MyWebOld 是昨天的內容
C:\MyWeb 是今天的內容
另外再自己開發一隻程式,每天比較2個目錄,就可知道網站是否被變動。
但是後來好像發現有問題,第2 ? 3 次使用就不行了
最後參考這裡
https://www.httrack.com/html/fcguide.html
簡化成
"C:\Program Files\WinHTTrack\httrack" http://www.myweb.tw/ -O "C:\WebSite\MyWeb" +www.myweb.tw/*.* |
沒有留言:
張貼留言