使用 ^H 和 ^M 字符评估大文件

Question 1

为了清楚起见，将其发布为答案。

作为划艇指出，在这种情况下，该命令awk -F '\r' '{print $NF}' file按预期工作，删除最后一个回车符后的所有内容。虽然这并不稳健泽夫泽克指出。

我在下面用 C++ 编写了一个更强大的解决方案。

#include <fstream>
#include <string>
#include <iostream>

using namespace std;

string filter_string(string line, const char *bspace, const char *creturn){

    string new_str;

    for(string::size_type i = 0; i < line.size(); ++i) {
        // Step back if current string not empty
        if (line[i] == *bspace){
            if (new_str.size() != 0){
                new_str.pop_back();
            };
        // Reset on carriage return
        } else if (line[i] == *creturn){
            new_str = "";
        } else {
            new_str += line[i];
        };
    }

    return new_str;
};

int main(int argc, char* argv[]){
    const char backspace = '\x08';
    const char creturn = '\r';

    if (argc != 2){
        cerr << "USAGE: " << argv[0] << " [src]" << endl;
        return 1;
    }

    // Filter lines in file
    string line;
    ifstream infile(argv[1]);
    while (getline(infile, line)){
        cout << filter_string(line, &backspace, &creturn) << endl;
    };

    return 0;
};

这里迭代每行中的每个字符，如果^H存在 a，则字符串被推回一位（如果尚未为空），如果^M存在回车符，则重置字符串。输出被发送到stdout，然后可以通过管道传输到文件。

Answer

为了清楚起见，将其发布为答案。

作为划艇指出，在这种情况下，该命令awk -F '\r' '{print $NF}' file按预期工作，删除最后一个回车符后的所有内容。虽然这并不稳健泽夫泽克指出。

我在下面用 C++ 编写了一个更强大的解决方案。

#include <fstream>
#include <string>
#include <iostream>

using namespace std;

string filter_string(string line, const char *bspace, const char *creturn){

    string new_str;

    for(string::size_type i = 0; i < line.size(); ++i) {
        // Step back if current string not empty
        if (line[i] == *bspace){
            if (new_str.size() != 0){
                new_str.pop_back();
            };
        // Reset on carriage return
        } else if (line[i] == *creturn){
            new_str = "";
        } else {
            new_str += line[i];
        };
    }

    return new_str;
};

int main(int argc, char* argv[]){
    const char backspace = '\x08';
    const char creturn = '\r';

    if (argc != 2){
        cerr << "USAGE: " << argv[0] << " [src]" << endl;
        return 1;
    }

    // Filter lines in file
    string line;
    ifstream infile(argv[1]);
    while (getline(infile, line)){
        cout << filter_string(line, &backspace, &creturn) << endl;
    };

    return 0;
};

这里迭代每行中的每个字符，如果^H存在 a，则字符串被推回一位（如果尚未为空），如果^M存在回车符，则重置字符串。输出被发送到stdout，然后可以通过管道传输到文件。

Question 2

sed 's/.*\x0d//' logfile

似乎按照你的要求做。

请注意，col -b失败是因为它忽略了空格：

$ echo $'--------\r1st try\r2nd   \r3rd\n' | col -b
3rd-try-

Answer

sed 's/.*\x0d//' logfile

似乎按照你的要求做。

请注意，col -b失败是因为它忽略了空格：

$ echo $'--------\r1st try\r2nd   \r3rd\n' | col -b
3rd-try-

使用 ^H 和 ^M 字符评估大文件

答案1

答案2

相关内容