Thunderbird 垃圾邮件文件夹中的邮件是否有用?例如,作为自适应过滤器的训练数据?或者我可以将它们扔掉吗?
相关但不包含我的答案:Thunderbird 如何“决定”什么是垃圾?
答案1
从贝叶斯过滤器的源代码来看,头文件nsBayesianFilter.h
暗示有一个训练数据文件:
/**
* Implements storage of a collection of message tokens and counts for
* a corpus of classified messages
*/
class CorpusStore : public TokenHash {
public:
CorpusStore();
~CorpusStore();
和
/**
* write the corpus information to file storage
*
* @param aMaximumTokenCount prune tokens if number of tokens exceeds
* this value. == 0 for no pruning
*/
void writeTrainingData(uint32_t aMaximumTokenCount);
在实现中nsBayesianFilter.cpp
提到了一个training.dat
文件:
nsresult CorpusStore::getTrainingFile(nsIFile** aTrainingFile) {
// should we cache the profile manager's directory?
nsCOMPtr<nsIFile> profileDir;
nsresult rv = NS_GetSpecialDirectory(NS_APP_USER_PROFILE_50_DIR,
getter_AddRefs(profileDir));
NS_ENSURE_SUCCESS(rv, rv);
rv = profileDir->Append(u"training.dat"_ns);
NS_ENSURE_SUCCESS(rv, rv);
return profileDir->QueryInterface(NS_GET_IID(nsIFile), (void**)aTrainingFile);
}
我不是 Thunderbird 开发人员,但我的直觉告诉我,删除垃圾邮件本身是安全的,因为从中获得的见解存储在此training.dat
文件中。