2023年3月17日 星期五

[研究]Cyotek WebCopy網站下載軟體(四)無法下載哪種網站?

[研究]Cyotek WebCopy網站下載軟體(四)無法下載哪種網站?

2023-03-17

在下載某網站時出現警告,下載成功,瀏覽器瀏覽 index.htm 畫面空白,檢視 HTML Source 是有內容,表示無法正常支援這種網站下載;直接用瀏覽器檢視該網站,是正常的。


點 More Information 得到:

在支持 JavaScript 的網站上運作 Working with JavaScript enabled websites
https://docs.cyotek.com/cyowcopy/current/javascript.html
Currently the only supported browser engine is Internet Explorer. Support for Chromium and Gecko will be added in a future update.
目前唯一受支持的瀏覽器引擎是 Internet Explorer。 在未來的更新中將添加對 Chromium 和 Gecko 的支持。

但實際上拿 IE11 去瀏覽該網站,是正常的。

換另一套 HTTrack Website Copier 3.49-2 (2017-05-20)(最新版,它已經多年沒有更新),對相同網站測試,也是如此,瀏覽器瀏覽 index.htm 畫面空白,檢視 HTML Source 是有內容。

********************************************************************************

查了一下,有些網站可能由於以下原因而無法正常下載:

  • 動態網站:某些網站使用動態內容,如 JavaScript 或 Ajax,這些內容可能無法正確地被 WebCopy 解析和下載。
  • 認證或登入限制:某些網站可能需要認證或登入才能訪問其內容。如果您沒有正確的權限,WebCopy 可能無法下載這些受限制的內容。
  • 漏洞或網站設置問題:某些網站可能存在漏洞或配置問題,這可能會導致 WebCopy 無法正常下載網站。
  • 防止爬蟲機制:某些網站可能會設置防止爬蟲機制,例如使用 CAPTCHA 或封鎖 IP,以防止自動化工具像 WebCopy 下載其內容。

總的來說,WebCopy 可以下載大多數正常的網站,但對於某些特殊情況,它可能無法正常工作。如果您遇到問題,建議嘗試設置 WebCopy 的選項,例如更改連接逾時時間、修改 User-Agent 字串等,以更好地適應目標網站。

 Cyotek WebCopy 的資訊來源網址:

(完)

相關

[研究]Cyotek WebCopy 1.9.0.822 網站下載軟體(一)下載、安裝、試用(Windows)
https://shaurong.blogspot.com/2023/03/cyotek-webcopy-190822-windows.html

[研究]Cyotek WebCopy 1.9.0.822 網站下載軟體(二)排除設定(Windows)
https://shaurong.blogspot.com/2023/03/cyotek-webcopy-190822-windows_16.html

[研究]Cyotek WebCopy 1.9.0.822 網站下載軟體(三)勾選 Tools會多甚麼?
https://shaurong.blogspot.com/2023/03/cyotek-webcopy-190822-tools.html

[研究]Cyotek WebCopy網站下載軟體(四)無法下載哪種網站?
https://shaurong.blogspot.com/2023/03/cyotek-webcopy.html



沒有留言:

張貼留言