我有一个从服务器更新中导出的竖线分隔文件。大约有 1.34 亿条记录。我使用 Excel 导入少量记录(1,000 - 10,000 条)来探索数据并查找问题,然后再将数据读入其他程序(如 SAS)。
文件中大约第 6200 条记录处存在问题,但我无法读取该文件,因为 excel 只会读取前 3,200 条记录。我发现文件中有多个文件结束标记(该文件来自 Linux,Windows 找到标记文件结束的 1A 十六进制代码)。有人知道如何解决这个问题吗?我当前的代码如下:
Sub Test()
file = "c:\user\myfile"
Open file For Input As #1
For i = 1 To 10000
Line Input #1, dat
Cells(i, 1) = dat
Next i
Close #1
End Sub
答案1
尝试查找并替换文件中的值:
Dim CellContent as String
Dim NewCellContent as String
CellContent = 'the line you're bringing in
NewCellContent = (Worksheetfunction.Substitute([your line], chr(26),vbnullstring))
Do Until CellContent = NewCellContent
CellContent = NewCellContent
NewCellContent = Worksheetfunction.Substitute(NewCellContent,chr(26),vbnullstring)
Loop
或者您可以使用正则表达式。