這是一份提交給Gemma 4挑戰:用Gemma 4
所建構的內容 我所建構的
每隔幾週就會有關客戶數據洩露或遭到攻擊的SaaS平台的新聞。同時,人們仍然樂呵呵地將他們的Gmail帳戶連接到隨機的AI產品,僅僅為了回答一個問題:「我的包裹在哪裡?」
Parsli 是一個本機優先的AI助理,它能在不將你的收件箱傳送至別人雲端的情況下回答這個問題.
它能本機連接到Gmail,解析與運送相關的郵件,提取追蹤信息,分類運送事件,並從市場、承運商、取貨點、海關通知和隨機商店(它們仍然像2009年一樣發送郵件)的混亂中建立時間線。
運送郵件一旦仔細查看,會令人驚訝地顯示出你的個人資料。它們悄悄透露你購物的地方、你使用的藥房、你購買的昂貴物品、你出行的時間,甚至有時候你甚至不在家。我不希望將這股個人行為的資料交給另一間標榜「我們嚴肅看待你的隱私」的創業公司。
Parsli 仍然是一個早期原型,但這是一個我真心計劃要持續開發的工具。我透過不同市場平台從不同國家訂購商品,而運輸追蹤很快就在不同承運商、語言和通知格式之間變得混亂不堪。這最初是一個關於本地 AI 工作流程的實驗,但逐漸變成了我自己實際想要使用的東西。下一步包括添加 SMS、螢幕截圖和語音訊息作為輸入來源——運輸更新並非僅僅集中於電子郵件,而是分散在多個渠道。
我還想讓系統可觀察,而不是變成另一個「黑色方盒」AI代理程式。除了儲存運送事件外,Parsli還持續記錄規則匹配、模型決策、信心水平、提取的實體、處理時間、token使用情況和分類推理。一旦離開快樂路徑的示範,郵件解析幾乎會立即變成邊緣案例的地獄,因此擁有完整的決策軌跡使調試顯著變得更容易.
示範
代码
https://github.com/olgazju/parsli
我如何使用Gemma 4
Parsli將Gemma 4用作確定性萃取流程上的推理層。
很多運送郵件根本不需要LLM。亞馬遜、聯合包裹、以色列郵政和網絡上的一半人一直在重複發送相同的模板,因此像HTML清理、追蹤號提取、發票篩選和明顯的運送更新這類事情都是通過確定性規則和語言套件處理的。在每封郵件上浪費模型調用既慢又沒有意義。
但一旦郵件開始偏離標準模板——一份多語言的海關通知、一份帶有隱藏在散文中的追蹤信息的取貨點通知、一個格式化所有內容都不同的市場——單純的確定性規則就不再足夠了。這就是Gemma作為貨物分類器以及規則之上的審計層出現的地方。
此流程首先確定性地提取結構化候選項,然後將模棱兩可的情況發送到模型進行驗證、信心估計、出貨狀態分類以及一般的「這真的有道理嗎」檢查,在結果被持續保存之前。
我儲存整個決策軌跡:哪些規則觸發了、模型輸出、信心分數、token 使用情況、時間以及最終答案來自規則還是模型。在我的實際郵箱中,在48封相關郵件中,55% 由規則解決,模型僅作為廉價審計表示同意,38% 模型實際糾正了規則錯誤的部分,其餘則分佈在邊緣情況中。單獨使用規則可能只能達到60%的效果。單獨使用模型可以處理所有情況,但會很慢且浪費資源。它們一起覆蓋了彼此的盲點。
我使用google/gemma-4-e4b在M2 MacBook Pro上透過LM Studio以無頭模式執行,用於本地推論。這個模型大小對這個工作負載來說已經足夠了。一旦你去除HTML垃圾和郵件混亂,運送追蹤是一個狹窄的結構化問題——你是在有限狀態集中進行分類,而不是寫詩。E4B給了我所需的推理品質,同時速度足夠快,可以在沒有專用GPU伺服器的情况下在本地運行,這正是整個目的。














