あなたのインボックスはあまりにも多くを知っている：プライバシーに気を配る人のためにParsli

私が作ったもの

数週間ごとに、漏洩した顧客データや侵害されたSaaSプラットフォームに関する話題が登場します。同時に、人々はGmailアカウントをランダムなAI製品に繋いで、「私の荷物はどこ？」という一つの質問に答えるために幸せそうに接続し続けています。

Parsliは、あなたのインボックスを誰かのクラウドに送ることなく、その質問に答えるローカル優先型AIアシスタントです

Gmailにローカルに接続し、発送関連のメールを解析し、トラッキング情報を抽出し、発送イベントを分類し、市場、輸送会社、引き取りポイント、税関通知、そして2009年の時のようにメールを送るランダムな店舗の混乱からタイムラインを構築します。

発送メールは、よく見ると驚くほど親密なデータセットです。あなたがどこで買い物をしているか、どの薬局を使っているか、何という高価なものを買っているか、いつ旅行しているか、そして時には家にいないことも、静かに明らかになります。私は「プライバシーを重視します」というページがある別のスタートアップに、そのような個人的な行動の流れを渡したくありませんでした。

Parsliはまだ初期のプロトタイプですが、本当に継続して開発を進める予定です。私は異なる国から異なるマーケットプレイスを通じて注文しており、輸送追跡はすぐに輸送会社、言語、通知形式の混乱に陥ります。これは地元のAIワークフローに関する実験から始まりましたが、徐々に自分自身で使いたいものへと発展しました。次のステップには、SMS、スクリーンショット、音声メッセージを入力ソースとして追加することを含みます - 輸送の更新はメールだけでなく、さまざまなチャネルに散らばっています。

私はシステムが観測可能であることを望んでいました。それがまた別の「黒い箱」AIエージェントになるのではなく。Parsliは輸送イベントを保存するだけでなく、ルールのマッチング、モデルの決定、信頼度、抽出されたエンティティ、処理時間、トークン使用量、分類の推論を維持します。メールのパースリングは、ハッピー・パスのデモンストレーションを離れるとすぐにエッジケースの地獄になります。そのため、完全な決定の軌跡があることで、デバッグが大幅に容易になりました.

デモ

コード

https://github.com/olgazju/parsli

Gemma 4の使い方

Parsliは、確定的な抽出パイプラインの上にGemma 4を推論層として使用しています。

多くの荷物連絡メールにはLLM（大規模言語モデル）が必要ない。Amazon、UPS、イスラエル郵便、そしてインターネットの半分が同じテンプレートを何度も送り続けているため、HTMLのクリーンアップ、追跡番号の抽出、請求書のフィルタリング、明らかな荷物更新などの作業は決定的なルールと言語パックを通じて処理される。すべてのメールにモデル呼び出しを無駄に費やすのは遅くて無意味だ。

しかし、標準テンプレートからメールが逸脱し始めると——多言語の通関通知、追跡情報が文章に埋め込まれた引き取り場所の通知、すべてを異なる形式で整形するマーケットプレイス——確定的なルールだけでは十分ではなくなる。それがGemmaが両方の輸送分類器として、ルールの上に監査レイヤーとして現れる場所である。

パイプラインはまず構造化された候補を決定的に抽出し、その後不確かなケースをモデルに検証、信頼度評価、出荷状態分類、および結果が永続化される前に「これは実際に意味があるか」という一般的なチェックを送信します。

私は完全な決定のトレースを保存しています：どのルールがトリガーされたか、モデルの出力、信頼度スコア、トークン使用量、時間と最終的な答えがルールから来たかモデルから来たか。私の実際のメールボックスでは、48件の関連メールのうち55％はルールによって解決され、モデルは安価な監査として同意しただけでした。38％はモデルが実際にルールが間違っていたことを修正し、残りはエッジケースで分かれていました。ルールだけでは、おそらく60％のところまで行けるでしょう。モデルだけではすべてを処理できますが、遅くて無駄です。一緒にあれば、お互いの盲点をカバーします。

ローカル推論のために、Googleのgemma-4-e4bをM2 MacBook ProでLM Studioのヘッドレスモードで実行しました。このモデルサイズはこのワークロードには十分でした。荷物の追跡は、HTMLのゴミやメールの混乱を取り除くと狭い構造化された問題です - あなたは有限の状態に分類しているのではなく、詩を書いているわけではありません。E4Bは私が必要としていた推論品質を提供し、専用のGPUサーバーなしでローカルで実行できるほど速かったので、まさにその目的でした。

おすすめ購読元

DEV Community

私が作ったもの

デモ

コード

Gemma 4の使い方