[研究]Cyotek WebCopy網站下載軟體(四)無法下載哪種網站?
2023-03-17
在下載某網站時出現警告,下載成功,瀏覽器瀏覽 index.htm 畫面空白,檢視 HTML Source 是有內容,表示無法正常支援這種網站下載;直接用瀏覽器檢視該網站,是正常的。
點 More Information 得到:
在支持 JavaScript 的網站上運作 Working with JavaScript enabled websites
https://docs.cyotek.com/cyowcopy/current/javascript.html
Currently the only supported browser engine is Internet Explorer. Support for Chromium and Gecko will be added in a future update.
目前唯一受支持的瀏覽器引擎是 Internet Explorer。 在未來的更新中將添加對 Chromium 和 Gecko 的支持。
但實際上拿 IE11 去瀏覽該網站,是正常的。
換另一套 HTTrack Website Copier 3.49-2 (2017-05-20)(最新版,它已經多年沒有更新),對相同網站測試,也是如此,瀏覽器瀏覽 index.htm 畫面空白,檢視 HTML Source 是有內容。
********************************************************************************
查了一下,有些網站可能由於以下原因而無法正常下載:
- 動態網站:某些網站使用動態內容,如 JavaScript 或 Ajax,這些內容可能無法正確地被 WebCopy 解析和下載。
- 認證或登入限制:某些網站可能需要認證或登入才能訪問其內容。如果您沒有正確的權限,WebCopy 可能無法下載這些受限制的內容。
- 漏洞或網站設置問題:某些網站可能存在漏洞或配置問題,這可能會導致 WebCopy 無法正常下載網站。
- 防止爬蟲機制:某些網站可能會設置防止爬蟲機制,例如使用 CAPTCHA 或封鎖 IP,以防止自動化工具像 WebCopy 下載其內容。
總的來說,WebCopy 可以下載大多數正常的網站,但對於某些特殊情況,它可能無法正常工作。如果您遇到問題,建議嘗試設置 WebCopy 的選項,例如更改連接逾時時間、修改 User-Agent 字串等,以更好地適應目標網站。
Cyotek WebCopy 的資訊來源網址:
- Cyotek WebCopy 官方網站:https://www.cyotek.com/cyotek-webcopy
- Cyotek WebCopy 文件:https://docs.cyotek.com/
- Cyotek WebCopy 下載頁面:https://www.cyotek.com/downloads
- Cyotek WebCopy GitHub 存儲庫:https://github.com/cyotek/
- Cyotek WebCopy 使用教程:https://www.youtube.com/results?search_query=Cyotek
- Cyotek WebCopy 錯誤和解決方案:https://docs.cyotek.com/
(完)
相關
[研究]Cyotek WebCopy 1.9.0.822 網站下載軟體(一)下載、安裝、試用(Windows)
https://shaurong.blogspot.com/2023/03/cyotek-webcopy-190822-windows.html
[研究]Cyotek WebCopy 1.9.0.822 網站下載軟體(二)排除設定(Windows)
https://shaurong.blogspot.com/2023/03/cyotek-webcopy-190822-windows_16.html
[研究]Cyotek WebCopy 1.9.0.822 網站下載軟體(三)勾選 Tools會多甚麼?
https://shaurong.blogspot.com/2023/03/cyotek-webcopy-190822-tools.html
[研究]Cyotek WebCopy網站下載軟體(四)無法下載哪種網站?
https://shaurong.blogspot.com/2023/03/cyotek-webcopy.html
沒有留言:
張貼留言