2024年11月Cyotek WebCopy下载-Cyotek WebCopy v1.6.0.559

发布时间:

  ⑴WebCopy是一款强大的网页复制工具,它可以帮助您浏览整个网站,即使在没有Inter连接的情况下也可以检测;该程序的工作原理是浏览网站内的链接并创建内容列表,包括页面和其他类型的文件;通过这种方式,软件将获取能够使站点完全脱机的可用元素;该工具有一个优点,就是它可以重建所有链接,所以,当您单击其中一个链接时,它将不再指向原始的联机资源,而是指向硬盘上的链接;Cyotek

  ⑵WebCopy非常易于使用,因为只需输入网站的URL地址即可开始扫描相应的网站;此外,您还可以自定义设置一组规则来确定要下载的资源类型。

  ⑶规则控制扫描行为,例如排除网站的一部分。还可以使用其他选项,例如下载要包含在副本中的URL,但不对其进行爬网

  ⑷在分析网站之前,可以选择发布一个或多个表单,例如登录到管理区域。还支持HTTP

  ⑸质询身份验证,因此,如果您的网站包含受保护的区域,则可以预定义用户名和密码,或者在扫描时自动提示您输入凭据。

  ⑹在分析了网站之后,“链接地图查看器”允许您查看在网站中找到的所有链接(内部和外部。通过过滤,您可以轻松查看找到的不同链接。

  ⑺除了上面提到的规则和表格,您可以进行许多设置来配置网站的爬网方式,还可以配置域别名,用户代理字符串,默认文档等。

  ⑻扫描网站后,您可以查看页面列表,错误,缺少页面,媒体资源等。

  ⑼几个配置选项使用正则表达式。内置的编辑器使您可以轻松测试表达式。

  ⑽查看和自定义网站的直观图,也可以将其导出为图像。

  ⑾简单好用,可以帮助用户快速的将网站内容下载并保存到本地上。

  ⑿自动化进行内容下载,大部分参数都不需要重新设置。

  ⒀可以扫描网站并且允许用户制定软件下载的内容。

  ⒁具备灵活的配置选项,轻松就可以完成网站的下载。

  ⒂可以为静态网站的完整副本进行脱机浏览,或下载所有图像或其他资源。

  ⒃将网站中的图片,视频,文件等一键下载保存到本地。

  ⒄高效的爬取网站中的内容,提升用户的工作效率。

  ⒅用户可以根据个人的需求自行配置软件爬取网站的规则。

  ⒆可以使用正则表达式创建规则,以轻松的控制软件下载内容。

  ⒇在计算机上下载软件,然后解压后运行软件安装,完成安装之后打开软件。

  ⒈从“文件”菜单中,打开“新建”子菜单,然后选择“新建空白项目”。

  ⒉此时将创建一个空项目,并将所有内容都设置为默认值。

  ⒊在输入框中输入您需要复制的网页地址。

  ⒋保存文件夹默认保存目录为c:Downloaded Web Sites,您可以将“保存文件夹”字段保留为默认值或者自行修改。

  ⒌设置完成以上的地址之后,就可以从项目菜单中选择复制网站,可以直接按F完成网站复制,也可以点击WebCopy下载该网站。

  ⒍单击保存文件夹右侧的绿色箭头图标,以使用文件资源管理器进行查看。

  ⒎完成之后,您可以从文件菜单中选择保存,或者按Control + S进行保存。

  ⒏输入项目的文件名后,就可以单击“保存”按钮将网站保存下载来了。

  ⒐使用“捕获表单”工具自动捕获表单

  ⒑向WebCopy添加表单定义的最简单方法是使用内置的捕获工具。

  ⒒确保输入了您要复制的站点的地址,例如

  ⒓从工具菜单中选择捕获表单使用嵌入式浏览器窗口,浏览网站,直到到达登录页面

  ⒔WebCopy将在右上方窗口的列表中列出所有表单。选择最合适的表单(如果存在多个表单

  ⒕您也可以在嵌入式Web浏览器中填写表格-但不要提交!填写适当的值后,单击“扫描表单按钮以检测您输入的值

  ⒖所有非隐藏的参数将被自动选择以包含在表单定义中。隐藏的参数通常仍然是必需的,但是WebCopy会自动从网站读取它们,并在每次发布时使用它们。这意味着使用动态值(例如防伪令牌的表单可以轻松提交

  ⒗单击创建表单按钮。这将自动创建一个指向用于发布表单的正确URL的定义以及定义的参数,然后关闭该工具。

  ⒘密码和表单数据以纯文本格式存储在WebCopy项目文件中。

  ⒙复制网站时,WebCopy将在复制开始之前提交任何表单定义,此后复制将正常进行。如果您使用WebCopy演示网站遵循了本教程,则会显示许多其他页面,例如authenticationprofile.php。

  ⒚要制作网站的纯图像副本,我们需要配置一些规则。

  ⒛.*排除,抓取内容

  ①.png包含,停止处理

  ②.gif包含,停止处理

  ③.jpg包含,停止处理

  ④第一条规则指示WebCopy完全不要将任何文件下载到保存文件夹,而仍要爬网HTML文件。这是通过使用表达式.*匹配所有URL以及规则选项Exclude

  ⑤and Crawl Content来完成的。

  ⑥每个后续规则都会添加一个正则表达式来匹配特定的图像扩展名,例如.png。然后使用“包含”选项来覆盖以前的规则并导致文件被下载。匹配后,无需继续检查规则,因此也设置了“停止处理”选项。另外,例如,您可能只有一条匹配多个扩展名的规则.(?:png|gif|jpg)。

  ⑦遵循这些规则,当您复制网站时,它将扫描所有HTML文件,但仅将与指定扩展名匹配的文件下载到保存文件夹。

  ⑧打开一个远程URL

  ⑨适用于:结果,错误,站点地图,跳过,文件和差异。

  ⑩右键单击列表中的一项,然后选择“在浏览器

  Ⅰ中打开”以在默认浏览器中打开远程URL。

  Ⅱ适用于:结果,站点地图,文件和差异。

  Ⅲ右键单击列表中的项目,然后选择“打开本地文件”

  Ⅳ以在默认注册的应用程序中打开本地文件。

  Ⅴ适用于:结果,站点地图,文件和差异。

  Ⅵ右键单击列表中的项目,然后选择“打开本地文件夹”

  Ⅶ以在本地文件的位置打开资源管理器窗口

  Ⅷ编辑/预览本地文件

  Ⅸ适用于:结果,站点地图,文件和差异。

  Ⅹ右键单击列表中的项目,然后选择“编辑本地文件”

  ㈠图像将在默认注册的应用程序中打开。所有其他文件将在嵌入式文本编辑器中打开。

  ㈡适用于:结果,错误,站点地图,跳过,文件和差异。

  ㈢右键单击列表中的一项,然后选择“添加规则”

  ㈣以打开默认使用所选URL的规则编辑器。

  ㈤查看入站和出站链接

  ㈥适用于:结果,错误,站点地图,跳过,文件和差异。

  ㈦右键单击列表中的项目,然后选择“传入/传出链接”

  ㈧以查看指向和来自选定URL的URL列表。

  ㈨查看URL的属性

  ㈩适用于:结果,错误,站点地图,跳过,文件和差异。

  右键单击列表中的项目,然后选择*属性

  以显示URL的属性。

  适用于:结果,错误,站点地图,跳过,文件,差异和Cookie。

  右键单击列表中的一个或多个项目,然后选择“复制”

  将所选内容复制到Windows剪贴板。

  适用于:结果,错误,跳过,文件,差异和Cookies。

  右键单击列表,然后选择“导出”

  以将列表的内容导出到逗号分隔值(CSV文档。

  此面板显示上次扫描或复印操作的结果。绿色图标表示操作成功,黄色图标表示由于项目设置而中止操作,红色图标表示错误。

  该列表显示已处理的URL,URL的最终状态,如何找到URL以及URL内容的大小。

  错误面板显示上一次扫描或复制期间遇到的错误列表。跳过的URL(出于任何原因不算作错误,因此未在此处列出。

  此面板显示复制的网站的结构,包括文件。

  此面板显示所有被跳过的URL的列表。可以跳过URL的原因有几个,其中包括:

  外部的URL,即不属于当前正在扫描的域

  已通过规则排除的URL

  URL在副本的起始URL之上

  此面板显示在爬网期间发现的文件的列表。与“站点地图”面板类似,它以平面列表形式显示。

  此面板显示当前扫描和上一次扫描之间的差异(例如新的或已删除的URL。

  Cookies面板

  这将显示在爬网期间存储的所有cookie。