인셔셔RSS 관심 있는 블로그, 뉴스, 기술 정보를 효율적으로 추적하고 읽으세요
원문 읽기 InertiaRSS에서 열기

추천 피드

博客园 - 司徒正美
V
V2EX
T
Tailwind CSS Blog
有赞技术团队
有赞技术团队
aimingoo的专栏
aimingoo的专栏
Apple Machine Learning Research
Apple Machine Learning Research
IT之家
IT之家
Blog — PlanetScale
Blog — PlanetScale
A
About on SuperTechFans
月光博客
月光博客
T
The Blog of Author Tim Ferriss
宝玉的分享
宝玉的分享
Martin Fowler
Martin Fowler
博客园 - 聂微东
The GitHub Blog
The GitHub Blog
V
Visual Studio Blog
WordPress大学
WordPress大学
酷 壳 – CoolShell
酷 壳 – CoolShell
Engineering at Meta
Engineering at Meta
GbyAI
GbyAI

DEV Community

Authentication Security Deep Dive: From Brute Force to Salted Hashing (With Java Examples) Why AI Systems Don’t Fail — They Drift Spilling beans for how i learn for exam😁"Reinforcement Learning Cheat Sheet" I Replaced Chrome with Safari for AI Browser Automation. Here's What Broke (and What Finally Worked) How Python Borrows Other People's Work The $40 Architecture: Processing 1 Billion API Requests with 99.99% Uptime Vibe Coding: A Workflow Guide (From Zero to SaaS) Most webhook security guides protect the wrong side. The scary part is delivery. Headless CMS for TanStack Start: Build a Blog with Cosmic EU Age Verification App "Hacked in 2 Minutes" — What Actually Happened Comfy Cloud’s delete function does not actually remove files Running AI Models on GPU Cloud Servers: A Beginner Guide Event-driven media intelligence with AWS Step Functions and Bedrock I scored 500 AI prompts across 8 quality dimensions — here's what broke How to Call Google Gemini API from Next.js (Free Tier, No Backend Needed) The Portal Protocol: Reclaiming Human Connection in the Age of AI How to Fix Your Team's Scattered Knowledge Problem With a Self-Hosted Forum Intro to tc Cloud Functors: A Graph-First Mental Model for the Modern Cloud Designing Multi-Tenant Backends With Both Ownership and Team Access I Built a Neumorphic CSS Library with 77+ Components — Here's What I Learned PostgreSQL Performance Optimization: Why Connection Pooling Is Critical at Scale Cómo construí un SaaS multi-rubro para gestionar expensas en Argentina con FastAPI + Vue 3 🚀 I Built an Ethical Hacking Scanner Tool – Open Source Project I Replaced /usage and /context in Claude Code With a Single Statusline A Pythonic Way to Handle Emails (IMAP/SMTP) with Auto-Discovery and AI-Ready Design I Collected 8.9 Million Polymarket Price Points — Here's What I Found About How Markets Really Move EcoTrack AI — Carbon Footprint Tracker & Dashboard Everyone's Using AI. No One Agrees How. 5 self-hosted ebook managers worth trying in 2026 Building Your First AI Agent with LangChain: From Chatbot to Autonomous Assistant Common SOC 2 Failures (Real World) Stop Vibe-Checking Your AI App: A Practical Guide to Evals How to Use SonarQube and SonarScanner Locally to Level Up Your Code Quality Your Next To-Do App Is Dead — I Replaced Mine with an OpenClaw AI Sign a Nostr event in 60 lines of Python using coincurve — no nostr-sdk, no nbxplorer, no rust toolchain ITGC Audit Explained Like You’re in Big 4 Patch Tuesday abril 2026: Microsoft parcha 163 vulnerabilidades y un zero-day en SharePoint Stop scraping everything: a better way to track competitor price changes Listing on MCPize + the Official MCP Registry while routing payments OUTSIDE the marketplace — how I kept 100% of my x402 revenue Building an AI-Powered Risk Intelligence System Using Serverless Architecture Why We Ripped Function Overloading Out of Our AI Toolchain Testing AI-Generated Code: How to Actually Know If It Works SaaS Churn Is Killing Your Business. Here Is What to Do About It (Without a Support Team) The Speed of AI Is No Longer Linear - And Self-Improving Models Are Why How to Implement RBAC for MCP Tools: A Practical Guide for Engineering Teams From Standard Quote to Persuasive Proposal: AI Automation for Arborists I built a CLI that scaffolds complete multi-tenant SaaS apps Axios CVE-2025–62718: The Silent SSRF Bug That Could Be Hiding in Your Node.js App Right Now The dashboard that ended our friendship Data Pipelines Explained Simply (and How to Build Them with Python)
Your Inbox Knows Too Much: Parsli for the Privacy Paranoid
Olga Bragins · 2026-05-24 · via DEV Community

이것은 Gemma 4 Challenge: Gemma 4로 구축하기

의 제출물입니다. 제가 만든 것

매주 몇 번씩은 고객 데이터 유출이나 SaaS 플랫폼이 해킹되는 이야기가 나옵니다. 동시에 사람들은 여전히 Gmail 계정을 무작위 AI 제품에 연결하여 질문에 답하기 위해 "제 배송품은 어디에 있는가?"라고 물어봅니다.

Parsli는 로컬 우선 AI 보조 프로그램으로, 이메일함을 다른 사람의 클라우드로 보내지 않고 질문에 답해줍니다.

이 프로그램은 Gmail을 로컬로 연결하여 배송 관련 이메일을 분석하고, 추적 정보를 추출하며, 배송 사건을 분류하고, 마켓플레이스, 운송사, 픽업 지점, 세관 통지 및 여전히 2009년처럼 이메일을 보내는 무작위 상점의 엉망진창에서 타임라인을 구축합니다.

Screenshot of the main page

배송 이메일은 자세히 살펴보면 놀랍도록 친밀한 데이터셋입니다. 이메일은 조용히 당신이 어디서 쇼핑하는지, 어떤 약국을 이용하는지, 얼마나 비싼 물건을 구매하는지, 언제 여행을 가는지, 심지어 집에 없을 때까지도 알아낼 수 있습니다. "우리는 당신의 프라이버시를 중요하게 생각합니다"라고 적힌 페이지를 가진 또 다른 스타트업에게 개인적인 행동 패턴의 흐름을 맡기고 싶지 않았습니다.

Parsli는 여전히 초기 프로토타입이지만, 진심으로 계속 개발할 계획인 것입니다. 다양한 국가에서 다른 마켓플레이스를 통해 주문하며, 운송 추적은 운송사, 언어, 알림 형식을 넘어 혼란으로 빠지곤 합니다. 이는 지역 AI 워크플로우를 실험으로 시작했지만, 점차 나 자신이 실제로 사용하고 싶게 된 것입니다. 다음 단계에는 SMS, 스크린샷 및 음성 메시지를 입력 소스로 추가하는 것을 포함합니다 - 운송 업데이트는 이메일뿐만 아니라 여러 채널에 흩어져 있습니다.

나는 시스템이 관찰 가능한 것을 원했고, 다른 "검은 상자" AI 에이전트가 되는 것보다. 배송 이벤트를 저장하는 외에도, Parsli는 규칙 일치, 모델 결정, 신뢰 수준, 추출된 엔티티, 처리 시간, 토큰 사용 및 분류 이유를 지속 저장합니다. 홉피스 데모를 벗어나면 이메일 분석은 거의 즉시 에지 케이스 헬이 되므로, 전체 결정 경로를 가지고 있으면 디버깅이 훨씬 쉬웠습니다.

Demo

코드

https://github.com/olgazju/parsli

Gemma 4를 어떻게 사용했는지

Parsli는 확정론적 추출 파이프라인 위에 Gemma 4를 추론 레이어로 사용합니다.

많은 운송 이메일은 전혀 LLM이 필요 없습니다. Amazon, UPS, 이스라엘 포스트와 인터넷의 반은 계속 같은 템플릿을 보내고 있기 때문에, HTML 정리, 운송 번호 추출, 인보이스 필터링 및 명백한 운송 업데이트와 같은 일은 결정론적 규칙과 언어 팩을 통해 처리됩니다. 각 이메일마다 모델 호출을 낭비하는 것은 느리고 무의미합니다.

하지만 이메일이 표준 템플릿에서 벗어나기 시작하면 - 다국어 관세 통지서, 추적 정보가 문장 속에 숨겨진 수거 지점 알림, 모든 것을 다르게 형식화하는 마켓플레이스처럼 - 결정론적 규칙만으로는 충분하지 않습니다. 그것이 바로 Gemma가 규칙 위에 배송 분류기와 감사 레이어로서 등장하는 곳입니다.

파이프라인은 먼저 결정론적으로 구조화된 후보자를 추출한 다음, 모델에 검증, 신뢰도 추정, 배송 상태 분류 및 결과가 영구 저장되기 전에 모호한 경우를 전송하여 일반적으로 "이게 정말 의미가 있나요"를 확인합니다.

전체 결정 추적을 저장합니다: 어떤 규칙이 작동했는지, 모델 출력, 신뢰 점수, 토큰 사용량, 시간 지연 및 최종 답변이 규칙에서 비롯되었는지 모델에서 비롯되었는지 여부. 제 실제 메일함에서 48개의 관련 이메일 중 55%는 규칙으로 해결되었고, 모델은 저렴한 검토를 위해 동의했습니다. 38%는 모델이 실제로 규칙이 잘못했던 부분을 수정했고, 나머지는 경계 사례를 나누었습니다. 규칙만으로는 아마도 60% 정도까지 도달할 수 있습니다. 모델만으로는 모든 것을 처리할 수 있지만 느리고 낭비가 될 것입니다. 함께하면 서로의 눈을 가리는 부분을 커버합니다.

지역 추론을 위해 Google/gemma-4-e4b를 LM Studio의 헤드리스 모드에서 M2 MacBook Pro에서 실행했습니다. 이 모델 크기는 이 작업에 충분히 많았습니다. 배송 추적은 HTML 쓰레기와 이메일 혼란을 제거하면 좁은 구조화된 문제입니다 - 유한한 상태 집합으로 분류하는 것이 아니라 시를 쓰는 것이 아닙니다. E4B는 전체적으로 빠르게 실행할 수 있도록 전용 GPU 서버 없이 로컬에서 실행할 수 있는 추론 질을 제공해야 했기 때문에 충분히 빠르게 질을 유지했습니다.