然,吾胜于 spam!非“大半”,乃“尽矣终绝”。无“近乎”之辞。虽九十九分胜之,然此百分之一非 spam 溃滤而出,乃误报之属,未复归 Inbox 也。
若欲知详,可阅下文。
此文所述之术法,可适于三邮之任一:
Gmail(用 Google Script)
Hotmail(hotmail)Outlook.com(微软邮箱),Live.com(微软必应)微软邮务(Microsoft Post Service, 亦用 Graph API)
凡邮箱服务,能以基础认证(登录密码)支持IMAP者。
要之,误报实为第一患。 Gmail与Outlook.com于反垃圾邮件之道,颇为得力。二者皆将之归入Spam文件夹。然吾于此文件夹中,日得三十余讯,偶有甚者,竟至七十。
事固无大碍,然每值一周,须检视垃圾箱,察有无误判。然数百垃圾信息中,非易事也。
就Gmail而言,可设筛滤,施诸讯息,俾有患之邮,直入废箱,不须过Spam。然Hotmail则不然:若此服事断为Spam,则所设之筛滤(于网界所创者),不复施焉。
二患:二务皆不许径毁讯,绕过尘箱。惟过筛可移恶讯于尘箱,然不能“钉”之(且说mail.ru)。 使此得以实现。故纵使以筛选之法理想排序,购物车亦积万般讯息。二者名义上皆言讯息存于购物车与垃圾箱三十日,然实则此乃最短之期。于某些境况,若不亲手清除,其或滞留月余(甚或数年)。此乃疏漏抑或设计如此,吾未可知。然购物车存数百乃至数千已删讯息,实有害于多端(隐私、效能、搜索之困)。
第三之难:吾妻之名姓与纽约医者(女)全然相同。由是,吾妻频受医疾之扰,虽非尽为杂讯,亦含医刊之函、合法医药之宣。虽得退其一二,然纷扰未已。
第四问题:妻之账户频收欧洲诸国之函(似为医者所寄)。然吾等不识匈牙利、西班牙、法兰西之文!
妻既言“或吾或诘”,吾不得不为之。
最简之策,莫过于撰一简易之服务,以通IMAP而取邮件,遇不可施以滤网之事,则由程序为之滤之。然则滤之,必俟得信而后行,若每十五分启一cron job,则尤无碍。
间或得之 spam(于吾之aol.com) 账号,其英文发件人名或主题行狡诈编码, spam 过滤器难辨,然人目可识。此法施于邮件主题,或英俄文并陈,然 AOL spam 则独编码英文。此账号本不应收非英文之邮件。
所附之码,可滤“\u00ad”之符,此符唯 spammer 专用于 Subject-e。吾之 aol.com 账户,此符实为 spam 之确证,百不失一。且 spam 中九十九者,皆含此符。
复有之,今吾可(若欲)尽毁其函,题若“安好,asmirnov”者,若尔之email为asmirnov@domain.tld,而尔名亚历山大·斯米尔诺夫。彼辈非但无置诸垃圾箱之用,甚且宜使其永不得“降于箱中”也
BLOCKED_NAME_KEYWORDS = ["mylogin"] # matched against decoded display name (user's login)
BLOCKED_SUBJECT_KEYWORDS = ["mylogin"] # matched against decoded subject
BLOCKED_DOMAINS = ["comms.aol.net", "ankerdc.com"] # e.g. ["spam.com", malicious.net"]
SOFT_HYPHEN = "\u00ad"若欲,可尽泯其函,或移诸废纸篓。
然此法亦有弊:需有服务器,或隐或显,存登录密码,非善策也。
幸而谷歌有云端服务Google Script,善治电子邮。
其码之理一也,然无别立之VPS,亦无需书账号密码于码中,或藏之他处。
涤净吾之Spam文件夹,永绝必至之垃圾。多般情形,永不再现,纵不归入废纸篓。譬如,若发件者域无MX及A记录(From:)ghsdjfadjfdjgfd@iuwadjkrei.com), 则吾立时删此讯。此律已毁其九成至九成五之秽言。
亦有他则。
若Spam中消息非我(非РКН)白名单域所发,则移入废箱。
此乃清单也。
var ALLOWED_TLDS = [
".com",
".net",
".org",
".им"
".il",
".uа",
".ru",
".ca",
".cz",
];吾诚得 uk 或 es 之合法讯,然未尝有 uk 或 es 之合法讯为谷歌所标为 spam(所引链接之码,确清 spam 文件夹,非收件箱)。直入废纸篓可也。
若吾(非РКН)之黑名单有此讯,则当置诸 корзина(然,当必尽灭无踪)
吾深知,譬如 veganinfo.com 发来之邮件,无论何种形式,永无所需。吾不欲见之,亦不欲见己于 mailbox-e。然...就此例而言,吾终决不即删此类信。其数甚少,非为大患。姑令其三日居于废箱之中。
黑名单示例
var BLOCKED_DOMAINS = [
".tk",
"onlinecrm.marketing",
"veganinfo.com",
];脚本触发器设于https://script.google.com,每十五分钟启动,然垃圾箱中仅余虚惊。其数甚寡,月不过五,然今可坦然视之。
其余垃圾立归废箱。废箱亦由是脚本清理:存三日之讯,吾心遂安。
function purgeDeletedFolder() {
console.log("purgeDeletedFolder() started");
var threads = GmailApp.search('in:trash older_than:3d');
threads.forEach(function(thread) {
Gmail.Users.Threads.remove('me', thread.getId());
});
console.log("purgeDeletedFolder() ended");
}
每执行脚本,吾必得报于Telegram(以防万一)。
function sendToTelegram() {
var BOT_TOKEN = "xxxxxxxxx:zzzzzzzzzzz-wwwwwwwwwww";
var CHAT_ID = "-yyyyyyyyyyy";
var deleteRate = stats.processed > 0
? ((stats.deleted / stats.processed) * 100).toFixed(2)
: 0;
var text =
"Spam Cleanup Report\n\n" +
"Processed: " + stats.processed + "\n" +
"Deleted: " + stats.deleted + " (" + deleteRate + "%)\n" +
"Permanently deleted: " + stats.permanently_deleted + "\n\n" +
"SPF misaligned: " + stats.spf_misaligned + "\n" +
"Infra abuse: " + stats.infra_abuse + "\n\n" +
"Cache hits: " + stats.cache_hit;
if (stats.permanently_deleted_list.length > 0) {
text += "\n\n Permanently deleted:\n";
stats.permanently_deleted_list.slice(0, 20).forEach(function(e) {
text += "• " + e + "\n";
});
if (stats.permanently_deleted_list.length > 20) {
text += "...and more (" + stats.permanently_deleted_list.length + ")";
}
}
var url = "https://api.telegram.org/bot" + BOT_TOKEN + "/sendMessage";
UrlFetchApp.fetch(url, {
method: "post",
payload: {
chat_id: CHAT_ID,
text: text
}
});
}今当治医疾之诟谇.
如吾前所言之,妻屡受医疾之诟谇,及欧洲诸国域名之诟谇。以谷歌之标准域名过滤,实为艰险。譬如,若设德语域名.de(德国)之过滤,则亦筛除abc.de。@domain.tld,此乃不祥之兆。若以医学术语为筛,则医者或亲眷之正当往来,亦将被筛除。
故,吾以妻之讯息为食,投于Claude.ai。 乃出其建议,即行其实。其理在,医界之诟,乃由少数之 mass mailing 程式散布,吾欣然阻之。且阻(如吾之例)发信者非实域之诟。缘何故,妻之帐户,时或诟讯穿滤。今每十五刻,尽灭无踪。
妻之收件箱清理码
奇哉!此辈"同志"实负七成之垃圾于妻之箱(盖凡"合法"之医病垃圾皆自此出也)。
var MEDICAL_SPAM_DOMAINS = [
"info.haymarketmedicalnetwork.com",
"haymarketmedicalnetwork.com",
"haymarketmedia.com",
"en25.com", // Oracle Eloqua marketing platform
"mdedge.com",
"healio.com",
"medscape.com",
"givingsight.org", // <-- add: Optometry Giving Sight
"bloomerang-mail.com", // <-- add: their sending platform
"nejm.org", // add/remove based on what she receives
"aao.org"
];亦将非白名单之讯悉入购物车(妻,非РКН)。
此白名单也。
var ALLOWED_TLDS = [
".com",
".net",
".org",
".gov",
".il",
".ua",
".ru",
".ca",
".cz",
".de",
];然此乃
var KNOWN_GOOD_DOMAINS = {
"gmail.com": true,
"googlemail.com": true,
"outlook.com": true,
"hotmail.com": true,
"live.com": true,
"outlook.co.il": true,
"hotmail.co.il": true,
"mail.com": true,
"fastmail.com": true,
"yahoo.com": true,
"icloud.com": true,
"aol.com": true,
"walla.com": true,
"walla.co.il": true,
"ukr.net": true,
"i.ua": true,
"mail.ru": true,
"yandex.com": true,
"yandex.ru": true,
"ceznum.cz": true,
};此乃邮局名录,凡此诸所,毋须询A与MX之DNS。用此以减脚本之网络流。否则或为谷歌所封。此非谓此域之邮皆合法。此仅谓此域自合法耳。
微软邮局之反垃圾,如Hotmail、outlook.com、live.com。
例三:滤清Hotmail之Spam文件夹,以净其内,俾速索虚报。此用Graph API,盖标准登录密码认证于IMAP已不效于微软之服务也。
Hotmail之弊,在于微软若判定某函为垃圾,则用户之过滤无效,致其不能即时移入废箱。兼之误判颇多,须手动或编程移入收件箱。
吾日得恶信数十。与Claude语,乃知九十恶信出六域,三四恶信则自某mailer,其From域用四破折“----”。
若abcde@-----mail.xyz.com之属
此等恶信立删,余者(日不过一二)则委于废箱。实则,斯时恶信箱中唯存虚报。
于实码(非此例)中,必真伪难辨者,立移入收件箱。
别问:微软何故对此垃圾农场无所作为?其“运作”已数载,何不于信件至收件箱前,先滤除此六七不幸域于其服务器?
为博雅趣,吾将寄清信之统计于临时邮箱服务。yopmail.com,彼有RSS之接口,阅统计甚便。
此乃网页之界面。

A此乃吾RSS阅读器之RSS接口。

似已尽善。倘有疑问,可书于注脚或私信。
尤谢Claude.de。 乃析数千之廢訊,以為分析,復進修訂之策,俾程式之濾廢得宜。
作者謝ChatGPT以為封面之圖,謝基里爾與梅托迪以為俄文字母,謝伊特魯斯人以為拉丁字母。
此代码库中所有代码,皆依MIT之许可,于诸链接中公开。尔可随心所欲,然吾不担其责。若以此代码致电子邮件湮灭无踪,或引其他诸般祸患,如机算故障、硬盘损毁、失职失业、落选面试等,皆非吾所负。












