网站关闭后如何恢复数据?

网站关闭后如何恢复数据?

背景:Twitch 有一项名为 Twitch Sings 的卡拉 OK 服务,该服务于去年 12 月关闭。它是由 Harmonix 开发的,该工作室还创建了《吉他英雄》和《摇滚乐队》,因此有关它的信息值得保留。我正在尝试找到最终的歌曲列表,但唯一包含完整信息的页面是此页面,该页面已被停用:https://songlist.sings.twitch.tv/
归档版本:https://web.archive.org/web/20201202061659/https://songlist.sings.twitch.tv/

问题:通过 archive.org 查看页面时,似乎应该从数据库中提取数据来填充页面。但是,存档版本显示不正确。它将访问数据库并显示以数字或 A 开头的艺术家的歌曲,但接下来不是显示 B,而是循环返回并一次又一次显示 A。我尝试在 Chrome、Firefox 和 Edge 中打开它,结果相同。

有没有办法通过直接访问数据库来完全绕过存档页面?或者可以通过打开页面源代码来编辑代码,以便它在浏览器中正确显示?还有其他方法可以让我检索信息吗?我真的没有太多的编码经验。

答案1

您几乎可以肯定,后端运行着一个数据库。由于网站已关闭,毫无疑问,运行它的数据库和服务器端代码已完全消失。您看到的页面很可能是服务器端代码和数据库的默认 HTML 输出。Archive.org 只能复制网站的 HTML 输出。它无法查看创建该输出的内容。实际上,它有首页的“照片”,仅此而已。实际上,除了您看到的内容之外,您无法恢复任何其他内容。

答案2

怎么能关机后从网站恢复数据?

可能不能。

正如您所发现的,Wayback Machine 对于从网络缓存的内容存在限制。

如果您在网站运营期间没有自己缓存,那么您必须找到另一个已存档您所寻找内容的人。

有没有办法通过直接访问数据库来完全绕过存档页面?

如果数据库仍然存在,那么您必须联系所有者才能访问。它不太可能通过互联网免费提供访问。

通常,公司会存档已停产产品的数据,只有在法律要求或新项目可以以某种方式从旧数据中受益时才会恢复数据。我怀疑 Twitch 是否关心你的个人利益,但你可以尝试联系他们。

如果有人拥有该数据库的副本那么他们很可能是通过非法方式获取的。

答案3

如果您很幸运的话,Google 可能仍在缓存中保留着您的网站。

  1. 进入site:example.comGoogle 搜索。您将获得 Google 索引的每个 HTML 文档的列表。
  2. 点击 URL 旁边的小向下三角形
  3. 点击“在缓存中”

您将获得 Google 仍然拥有的 HTML 文档并可以下载它。

答案4

如果全部下列条件之一适用,那么你也许能够使用合法的方法获取数据,正如MonkeyZeus 的回答

  1. 您居住在适用 GDPR 的司法管辖区(例如英国或欧盟成员国)。
  2. 该公司位于 GDPR 适用的司法管辖区内或者他们不属于管辖范围,但与您签订了合同,以提供对其网站的访问权限(例如,您创建了一个帐户并同意条款和条件)。
  3. 该公司仍保留着该数据的副本。
  4. 该数据是您的个人数据。

如果是,您可以根据文章提出主题访问请求1512GDPR。然后,公司通常会被要求免费向您提供数据,不得无故拖延(最长 1 个月,如果是复杂请求,则最长 3 个月,前提是他们在 1 个月内通知您延长的时间)。如果他们未能这样做,您有权向您所在国家的数据保护机构投诉和/或向法院寻求禁令。

相关内容