读取带有多个文件结束标志的文件

读取带有多个文件结束标志的文件

我有一个从服务器更新中导出的竖线分隔文件。大约有 1.34 亿条记录。我使用 Excel 导入少量记录(1,000 - 10,000 条)来探索数据并查找问题,然后再将数据读入其他程序(如 SAS)。

文件中大约第 6200 条记录处存在问题,但我无法读取该文件,因为 excel 只会读取前 3,200 条记录。我发现文件中有多个文件结束标记(该文件来自 Linux,Windows 找到标记文件结束的 1A 十六进制代码)。有人知道如何解决这个问题吗?我当前的代码如下:

Sub Test()
file = "c:\user\myfile"
Open file For Input As #1
For i = 1 To 10000
    Line Input #1, dat
    Cells(i, 1) = dat
Next i

Close #1
End Sub

答案1

尝试查找并替换文件中的值:

Dim CellContent as String
Dim NewCellContent as String
CellContent = 'the line you're bringing in
NewCellContent = (Worksheetfunction.Substitute([your line], chr(26),vbnullstring))

Do Until CellContent = NewCellContent

    CellContent = NewCellContent
    NewCellContent = Worksheetfunction.Substitute(NewCellContent,chr(26),vbnullstring)

Loop

或者您可以使用正则表达式。

相关内容