使用 PowerShell 替换文档中的单个字节

使用 PowerShell 替换文档中的单个字节

我们正在将 HTML 帮助系统转换为 SharePoint 文档库。我们有大约 3000 个单独的 HTML 文档正在转换为 Word。大约 20% 的文档包含指向相关文档的超链接,它们都是相对链接。

我们正在尝试自动化解析每个文档的过程,并且在任何有超链接的情况下,用“doc”替换字符串的最后三个字节“htm”。

我见过一些 PowerShell 示例,其中人们正在解析文档(通常是服务器日志)以寻找特定的信息,但在关闭/保存文件之前无法找到有关替换文件中特定字符的任何信息。

有人有使用 PowerShell 实现此目的的技巧吗?或者有关于更合适工具的想法?

答案1

只需打开文件,将“htm”替换为“doc”,然后保存并关闭此文件:

Get-ChildItem -Path . -Recurse | 
Where-Object {-not $_.PSIsContainer} | 
Foreach-Object { 
    (Get-Content $_) -replace "htm", "doc" | Set-Content $_
}

相关内容