所筑何物
数周之内,时闻客数据泄或SaaS平台遭破。与此同时,众皆欣然将Gmail账户连于诸般AI之器,只为答一问: "吾之包裹安在?"
Parsli乃一本地优先之AI助人,应此问而不使君之邮箱流于他人云中。
其与Gmail本地相连,解析与货运相关之邮件,提取追踪信息,分类货运事件,自纷繁之市集、承运商、提货点、海关通知及仍如2009年般发送邮件之杂货铺中,构建时序。
货品之函,细察之,竟为私密之数据。默然示人购物之所,用药之方,所购之贵物,出行之期,乃至有时君未归家。吾不愿将此流之私行,予另一初创公司,虽其有“吾辈重君之私”之页。
Parsli尚为初稿,然吾实欲继之。吾购自异国,经异市,运单追查,迅速淆乱于诸承运者、诸语言、诸通知格式之间。此始为本地AI流程之试验,渐而成吾欲自用之物。后续之计,将添SMS、截图、语音消息为输入之源——运单更新散于诸渠道,非独电子邮件耳。
吾亦欲系统可察,毋为"黑箱"之AI代理人。除存运货之事件,Parsli犹存规则相合、模型决断、信度层级、所抽实体、处理之时、词元之用及分类之理。一旦离欣然之示演,邮件解析立成边缘之厄境,故有全然之决断轨迹,则排错大易。
示演
代码
https://github.com/olgazju/parsli
吾之用Gemma 4
Parsli以Gemma 4为推理之层,置于确定性抽取之管道之上。
甚多货件之函,实无需求乎大智模型。亚马孙、UPS、以色列邮局及互联网之半,恒复用同模之函,故如HTML清理、运单提取、发票筛选及显见之货件更新,皆循定规,依语言包而办。每函皆以模型调用为费,则迟滞无益矣。
然一旦邮件渐离标准模板——一通多语海关公告,一纸提货点通知将追踪信息隐于冗文,一市集格式各异——则独恃定规已不足矣。此即Gemma之用,既为货件分类之器,复为规则之上之审察之层也。
首以定法析结构之候选,复将歧义之案送至模型,以验其真、估其信、分其运状,并通察其事果有理否,而后存其果。
吾存其全决之迹:所发之规,模型所出,信度之数,符用之数,时序之数,及其终答之由规抑由模也。于吾实笈,四十八相关之函,其五十五分之由规所决,模型仅附和以作廉察,其三十八分者,模型实正规则所谬,其余则分属畸例。独规仅得至其六十分之程。独模可应万变,然则迟滞而费。合之则各补其阙。
为地之推演,吾用google/gemma-4-e4b,于M2 MacBook Pro上以LM Studio无头模式运行。此模型之大小,终足敷此劳作。货物追踪,一旦去其HTML之秽乱与邮件之纷纭,实乃狭而有序之题——汝不过分门别类于有限之态,非作诗也。E4B予吾所需之推理质,而速且足以于本地运行,无需专司GPU之服务器,此诚吾之本意。














