如何使用Ftfy

如何使用Ftfy

我有一个 xx.sql,它存在一些编码问题。例如:

represent†in Xhosa)Â

我被建议使用[ftfy 来修复](https://pypi.org/project/ftfy/)我已经安装了pip install ftfy,但我无法理解如何使用它,例如:

在终端中我运行以下命令:

python 
import ftfy
ftfy --output=xx.clean.sql xx.orig.sql (not sure how to point to the location of xx.orig.sql)

我觉得这是一件简单的事情,我错过了任何帮助,将不胜感激。

谢谢

答案1

这些是我用于解决方案的 Ubuntu 18.04 的说明。

apt install python3
apt install python-pip3
pip3 install ftfy

cd /usr/local/lib/python3.6/dist-packages/ftfy
vim +100 cli.py

文件粗体部分的改动

if args.preserve_entities:
    unescape_html = False
else:
    unescape_html = 'auto'

config = TextFixerConfig(
    unescape_html=unescape_html,
    normalization=normalization**,**
    **uncurl_quotes=False**
)

try:
    for line in fix_file(
        file,
        encoding=encoding,
        config=config
/usr/local/lib/python3.6/dist-packages#  ftfy --output=client.clean.sql xxx.sql
#copied the file to same directory

相关内容