我正在尝试使用以下可用数据:https://www.ncdc.noaa.gov/cdo-web/datasets和https://www1.ncdc.noaa.gov/pub/data/ghcn/daily/hcn/
它以 .dly 文件的形式出现。有没有办法用 Python 或 Excel 打开它?
我的最终目标是将它们保存为可以用 Python 和 Pandas 打开的文件格式。
答案1
这些是固定宽度格式的文件 - 每列有特定数量的字符宽度。您可以使用 读取它pandas.read_fwf()
。
有readme.txt
https://www1.ncdc.noaa.gov/pub/data/ghcn/daily/对于您链接的 GHCN 数据,其中包括每列的标题、宽度和数据类型。read_fwf()
如果自动宽度检测不起作用,您可以提供这些。不过我认为您必须手动添加列标题。
编辑:我添加了一个示例代码片段,你可以使用https://gitlab.com/snippets/1838910