慣性聚合 関心のあるブログ、ニュース、テクノロジーを効率的に追跡
原文を読む 慣性聚合で開く

おすすめ購読元

小众软件
小众软件
博客园 - 叶小钗
有赞技术团队
有赞技术团队
大猫的无限游戏
大猫的无限游戏
博客园_首页
钛媒体:引领未来商业与生活新知
钛媒体:引领未来商业与生活新知
L
LangChain Blog
Hugging Face - Blog
Hugging Face - Blog
OSCHINA 社区最新新闻
OSCHINA 社区最新新闻
aimingoo的专栏
aimingoo的专栏
Blog — PlanetScale
Blog — PlanetScale
爱范儿
爱范儿
T
Tailwind CSS Blog
Jina AI
Jina AI
量子位
Stack Overflow Blog
Stack Overflow Blog
人人都是产品经理
人人都是产品经理
J
Java Code Geeks
V
Visual Studio Blog
月光博客
月光博客

DEV Community

Authentication Security Deep Dive: From Brute Force to Salted Hashing (With Java Examples) Why AI Systems Don’t Fail — They Drift Spilling beans for how i learn for exam😁"Reinforcement Learning Cheat Sheet" I Replaced Chrome with Safari for AI Browser Automation. Here's What Broke (and What Finally Worked) How Python Borrows Other People's Work The $40 Architecture: Processing 1 Billion API Requests with 99.99% Uptime Vibe Coding: A Workflow Guide (From Zero to SaaS) Most webhook security guides protect the wrong side. The scary part is delivery. Headless CMS for TanStack Start: Build a Blog with Cosmic EU Age Verification App "Hacked in 2 Minutes" — What Actually Happened Comfy Cloud’s delete function does not actually remove files Running AI Models on GPU Cloud Servers: A Beginner Guide Event-driven media intelligence with AWS Step Functions and Bedrock I scored 500 AI prompts across 8 quality dimensions — here's what broke How to Call Google Gemini API from Next.js (Free Tier, No Backend Needed) The Portal Protocol: Reclaiming Human Connection in the Age of AI How to Fix Your Team's Scattered Knowledge Problem With a Self-Hosted Forum Intro to tc Cloud Functors: A Graph-First Mental Model for the Modern Cloud Designing Multi-Tenant Backends With Both Ownership and Team Access I Built a Neumorphic CSS Library with 77+ Components — Here's What I Learned PostgreSQL Performance Optimization: Why Connection Pooling Is Critical at Scale Cómo construí un SaaS multi-rubro para gestionar expensas en Argentina con FastAPI + Vue 3 🚀 I Built an Ethical Hacking Scanner Tool – Open Source Project I Replaced /usage and /context in Claude Code With a Single Statusline A Pythonic Way to Handle Emails (IMAP/SMTP) with Auto-Discovery and AI-Ready Design I Collected 8.9 Million Polymarket Price Points — Here's What I Found About How Markets Really Move EcoTrack AI — Carbon Footprint Tracker & Dashboard Everyone's Using AI. No One Agrees How. 5 self-hosted ebook managers worth trying in 2026 Building Your First AI Agent with LangChain: From Chatbot to Autonomous Assistant Common SOC 2 Failures (Real World) Stop Vibe-Checking Your AI App: A Practical Guide to Evals How to Use SonarQube and SonarScanner Locally to Level Up Your Code Quality Your Next To-Do App Is Dead — I Replaced Mine with an OpenClaw AI Sign a Nostr event in 60 lines of Python using coincurve — no nostr-sdk, no nbxplorer, no rust toolchain ITGC Audit Explained Like You’re in Big 4 Patch Tuesday abril 2026: Microsoft parcha 163 vulnerabilidades y un zero-day en SharePoint Stop scraping everything: a better way to track competitor price changes Listing on MCPize + the Official MCP Registry while routing payments OUTSIDE the marketplace — how I kept 100% of my x402 revenue Building an AI-Powered Risk Intelligence System Using Serverless Architecture Why We Ripped Function Overloading Out of Our AI Toolchain Testing AI-Generated Code: How to Actually Know If It Works SaaS Churn Is Killing Your Business. Here Is What to Do About It (Without a Support Team) The Speed of AI Is No Longer Linear - And Self-Improving Models Are Why How to Implement RBAC for MCP Tools: A Practical Guide for Engineering Teams From Standard Quote to Persuasive Proposal: AI Automation for Arborists I built a CLI that scaffolds complete multi-tenant SaaS apps Axios CVE-2025–62718: The Silent SSRF Bug That Could Be Hiding in Your Node.js App Right Now The dashboard that ended our friendship Data Pipelines Explained Simply (and How to Build Them with Python)
トレジャーハントエンジン:私たちがドキュメントを壊し、実際に機能するシステムを構築した方法
Lisa Zulu · 2026-05-28 · via DEV Community

私たちが実際に解決しようとしていた問題

ユーザーは意味論的検索をしていなかった。彼らは宝探しを実行していた:複雑で多段階のクエリで、最初の段階ではフレーズマッチングのために20万件の候補文書が返され、2番目の段階では正確な語の近接性、メタデータフィルタ,ユーザー定義のボーostsでそれらをランク付けする必要があった。Veltrix文書はこれを後回しにしていた。彼らの例パイプラインは単段階のリコール後にランク付けするフローを仮定しており、カスタムスコアリングフックは含まれていなかった。ログはユーザーセッションの73%が2番目の段階でタイムアウトしたことを示した。なぜなら、遅いコサインスコアラーはフィルターキャスケードに追いつけなかったからだ。それを無効にしようとしたが、APIは明示的にスコアラーが設定されていない場合にエラーを投げた。エラーメッセージ?操作が有効ではありません:スコアラーが初期化されていません。役立つ。

まず試したこと(そしてなぜ失敗したか)

Goでスコアラーを書き直し、Veltrix C++プラグインインターフェースを使用しました。ドキュメントではインターフェースが安定していると主張されていましたが、6ヶ月でC++ヘッダーが3回更新され、バージョンフラグがありませんでした。プラグインはコンパイルできましたが、実行時にスタックトレースが指すと、_ZTVN8Veltrix8ScoreAPI8ScorerEというシンボルが見つからないことで段階的に破損しました。エラーはサンプルコードでは発生しませんでしたが、サンプルでは仮想デストラクタのオーバーライドが含まれていませんでした。3日間デバッグしましたが、2024年のGitHubの問題で別のユーザーが同じクラッシュに遭遇し、ソースからVeltrixを再構築するように言われました。再構築は内部Dockerイメージをプルする必要があり、12GBで45分かかりました。私たちのSLAでは許可されませんでした。

その後、Python UDFの方法を試みました。ドキュメントによると、単一のPython関数を通じてカスタムスコアリングをサポートしていると書かれていました。例では50行未満のコードが示されていました。私たちはボーosts、フィールド重み、カスタムメタデータフィールドを処理するために500行のコードを書きました。最初のリクエストはPythonインタープリタを初期化するのに12秒かかりました。その後、各クエリは200ミリ秒のJITオーバーヘッドを追加しました。私たちはPythonのタイムアウトを5秒に設定しましたが、UDFは時々ネストされたJSONブロブ内の正規表現検索でフリーズすることがありました。ログにはPythonのトレースバックが含まれていなかったので、私たちはstderrをサイドカーにフォワードし、リアルタイムで解析する必要がありました。遅延のスパイクは予測不可能になりました。ユーザーたちは、ダッシュボードがコーヒーが冷めるよりも遅く更新されることを苦情を言い始めました。

アーキテクチャの決定

私たちはVeltrixをその設計されていない役割に押し込もうとする試みをやめました。代わりに、パイプラインを分割しました:Veltrixは再呼び出し(recall)を担当し、私たちはRustでカスタムランカーを構築しました。Veltrixの再呼び出しはまだ遅かった—曖昧なフレーズマッチに200msかかる—しかし、それは許容可能でした。なぜなら、それはシャーディングされたBM25インデックスに基づいてトップ10,000の候補のみを返すからです。次に、これらの候補を同じノード上で動作するgRPCエンドポイントを通じてRustランカーにストリーミングしました。ランカーはダイナミックブースティング、メタデータフィルタリング、近接スコアリングを1回のパスで適用しました。私たちはProstを使用してコードジェネレーションを行い、Tokioを使用して非同期I/Oを行いました。gRPCエンドポイントが8msのオーバーヘッドを追加しましたが、Rustランカーはネットワークマーシャリングを含めて10,000ドキュメントを45msで処理しました。私たちはリクエストごとに1,000ドキュメントのバッチサイズを調整して、遅延とスループットのバランスを取りました。JSONPathライブラリを深くネストされたフィールドでの無制限のスタック成長を回避するために手作りのバイトスキャナーに置き換えた後、エラー率はゼロになりました。

ユーザーからは分岐を認識できないように、両方のサービスを軽量なGoプロキシでフロントエンドにし、単一のVeltrix互換APIを提示しました。プロキシはスコアリングパラメータを拦截し、適切にルーティングしました。パラメータがデフォルトの場合はVeltrixへ、私たちのカスタム_treasurehunt:v1の場合はRustランカーへ行きました。これを「Veltrixを使うときに泣かない方法」というタイトルの1ページの内部ウィキに記載しました。ウィキには、jemallocでRustランカーをコンパイルするための正確なCMakeフラグ、Goプロキシのサーキットブレーカー設定、100msの予算を持つgRPC再試行ポリシーが含まれていました。ドキュメントはこの分岐を何度も言及しませんでした。GitHubのスタアの山もこの分岐を認めませんでした。しかし、レイテンシパーセンタイルは認めました。

数字が何を言っていたか

2週間測定しました。宝探しクエリの95パーセンタイルレイテンシは4.2秒から450ミリ秒に低下しました。エラー率は0.03%で安定しました。改善の12%は、重複検出のためにVeltrixsのデフォルトスコアラーをメモリ内Bloomフィルタに置き換えたことによるものです。もう8%は、RustランカーのSIMDレーンをCPUキャッシュラインサイズに合わせたことによるものです。Goプロキシは15ミリ秒のオーバーヘッドを追加しましたが、システムを観測可能にしました:PrometheusヒストグラムとOpenTelemetryトレースでインストゥメンテーションしました。Rustランカーは/debug/flushエンドポイントを公開し、現在のスコアリング状態をPrometheusにダンプしました。これにより、リアルタイムでボーストミスファイアをデバッグすることができました。ユーザーが低いランクのドキュメントについて不満を述べたとき、私たちは前の1時間の正確なスコアリングコンテキストを再生することができました。Veltrixsのログではできませんでした。

私たちはまた、JSONPathライブラリと比較して、私たちのハンドロールされたバイトスキャナがメモリオーバーヘッドが2倍であることを発見しましたが、それはPython UDFがフリーズした原因である最悪のケースのスタック成長を排除しました。512MBのRAMよりも生産環境の安定性が重要であるため、トレードオフを受け入れました。スキャナーの最悪のケースの割り当ては予測可能でした:JSONのレベルごとに1バイト、最大64レベルまで制限されています。私たちはスキャナーにハードリミットを追加し、深さが64を超えた場合に422エラーを返しました。ユーザーはこのリミットを決してヒットしませんでしたが、それにより失敗モードが明確になりました。

私が違うことをしたかったこと

私はVeltrixのドキュメントをAPIリファレンスを超えて信じなかった。彼らの例は舞台的なものであり、実用的ではない。彼らは投資家を感銘させるために最適化しているのではなく、オペレーターにとって最適化している。宝探しエンジンを構築しているなら、再呼び出し段階をランキング段階から分離する必要がある。Veltrixを使え