我有这个巨大的文本文件。我试图删除日期之后的所有事件。
例子
1900 Sigmund Freud published 'Interpretation of Dreams' marking the beginning of Psychoanalytic Thought.
结果 :
1900
//该文件的年份从公元前 1550 年到 2015 年
答案1
如果年份在行首始终是 4 位数字,就像您的示例中那样,那么您可以使用以下正则表达式捕获它:
^([0-9]{1,4}( BCE)?)