防止 Excel 在打开 HTML 文件时将值转换为日期

防止 Excel 在打开 HTML 文件时将值转换为日期

我有一些包含表格的 HTML 文件,我需要对它们进行一些分析。

我可以在 Excel 中打开它们,并且它会保留所有表格格式和布局(这正是我想要的)。

问题是,默认情况下,它会将所有单元格的格式设置为“常规”。这意味着 Excel 的“智能”数据转换开始生效,正如我之前在 stackexchange 上提到的那样,当代码和名称显示为日期并转换为数字时,会导致各种问题。

从纯文本导入时,有办法解决这个问题,强制 Excel 调出向导,允许您将导入格式从“常规”更改为“文本”。如何让 Excel 将 HTML 文件中的所有内容都视为文本?

是否有某种方法可以更改全局 Excel 设置,以阻止常规格式转换日期?或者是否有某种专门用于打开 html 文件的方法可以阻止应用“常规”格式?

答案1

我会为此使用 Power Query 插件。Power Query 可以读取 HTML 文件(本地或 Web)。它会查找表格,因此 HTML 结构需要具有一定的一致性。读取 HTML 表格后,它会尝试自动检测日期 - 您可以覆盖此操作并手动转换列。

答案2

一年后,您可以使用网络查询并更改选项以禁用日期识别,如指定这里https://support.microsoft.com/en-gb/kb/287027

不要打开 HTML 文件,而是将网络查询指向本地地址 (file:///C:/Users/.../file.html)

若要防止 Excel 自动将数字转换为日期,请在创建新的 Web 查询时按照以下步骤操作:在 Microsoft Office Excel 2003 或 Microsoft Excel 2002 中,指向“数据”菜单上的“导入外部数据”,然后单击“新建 Web 查询”。

在 Microsoft Office Excel 2007 中,单击“数据”选项卡上“获取外部数据”组中的“来自 Web”。

在“地址”框中,键入包含要导入的表的网页的地址,然后单击“转到”。

单击适当的表标记以选择要导入的表。

单击“选项”。

在其他导入设置下,单击以选中禁用日期识别复选框。

相关内容