慣性聚合 関心のあるブログ、ニュース、テクノロジーを効率的に追跡
原文を読む 慣性聚合で開く

おすすめ購読元

小众软件
小众软件
博客园 - 叶小钗
有赞技术团队
有赞技术团队
大猫的无限游戏
大猫的无限游戏
博客园_首页
钛媒体:引领未来商业与生活新知
钛媒体:引领未来商业与生活新知
L
LangChain Blog
Hugging Face - Blog
Hugging Face - Blog
OSCHINA 社区最新新闻
OSCHINA 社区最新新闻
aimingoo的专栏
aimingoo的专栏
Blog — PlanetScale
Blog — PlanetScale
爱范儿
爱范儿
T
Tailwind CSS Blog
Jina AI
Jina AI
量子位
Stack Overflow Blog
Stack Overflow Blog
人人都是产品经理
人人都是产品经理
J
Java Code Geeks
V
Visual Studio Blog
月光博客
月光博客

DEV Community

Authentication Security Deep Dive: From Brute Force to Salted Hashing (With Java Examples) Why AI Systems Don’t Fail — They Drift Spilling beans for how i learn for exam😁"Reinforcement Learning Cheat Sheet" I Replaced Chrome with Safari for AI Browser Automation. Here's What Broke (and What Finally Worked) How Python Borrows Other People's Work The $40 Architecture: Processing 1 Billion API Requests with 99.99% Uptime Vibe Coding: A Workflow Guide (From Zero to SaaS) Most webhook security guides protect the wrong side. The scary part is delivery. Headless CMS for TanStack Start: Build a Blog with Cosmic EU Age Verification App "Hacked in 2 Minutes" — What Actually Happened Comfy Cloud’s delete function does not actually remove files Running AI Models on GPU Cloud Servers: A Beginner Guide Event-driven media intelligence with AWS Step Functions and Bedrock I scored 500 AI prompts across 8 quality dimensions — here's what broke How to Call Google Gemini API from Next.js (Free Tier, No Backend Needed) The Portal Protocol: Reclaiming Human Connection in the Age of AI How to Fix Your Team's Scattered Knowledge Problem With a Self-Hosted Forum Intro to tc Cloud Functors: A Graph-First Mental Model for the Modern Cloud Designing Multi-Tenant Backends With Both Ownership and Team Access I Built a Neumorphic CSS Library with 77+ Components — Here's What I Learned PostgreSQL Performance Optimization: Why Connection Pooling Is Critical at Scale Cómo construí un SaaS multi-rubro para gestionar expensas en Argentina con FastAPI + Vue 3 🚀 I Built an Ethical Hacking Scanner Tool – Open Source Project I Replaced /usage and /context in Claude Code With a Single Statusline A Pythonic Way to Handle Emails (IMAP/SMTP) with Auto-Discovery and AI-Ready Design I Collected 8.9 Million Polymarket Price Points — Here's What I Found About How Markets Really Move EcoTrack AI — Carbon Footprint Tracker & Dashboard Everyone's Using AI. No One Agrees How. 5 self-hosted ebook managers worth trying in 2026 Building Your First AI Agent with LangChain: From Chatbot to Autonomous Assistant Common SOC 2 Failures (Real World) Stop Vibe-Checking Your AI App: A Practical Guide to Evals How to Use SonarQube and SonarScanner Locally to Level Up Your Code Quality Your Next To-Do App Is Dead — I Replaced Mine with an OpenClaw AI Sign a Nostr event in 60 lines of Python using coincurve — no nostr-sdk, no nbxplorer, no rust toolchain ITGC Audit Explained Like You’re in Big 4 Patch Tuesday abril 2026: Microsoft parcha 163 vulnerabilidades y un zero-day en SharePoint Stop scraping everything: a better way to track competitor price changes Listing on MCPize + the Official MCP Registry while routing payments OUTSIDE the marketplace — how I kept 100% of my x402 revenue Building an AI-Powered Risk Intelligence System Using Serverless Architecture Why We Ripped Function Overloading Out of Our AI Toolchain Testing AI-Generated Code: How to Actually Know If It Works SaaS Churn Is Killing Your Business. Here Is What to Do About It (Without a Support Team) The Speed of AI Is No Longer Linear - And Self-Improving Models Are Why How to Implement RBAC for MCP Tools: A Practical Guide for Engineering Teams From Standard Quote to Persuasive Proposal: AI Automation for Arborists I built a CLI that scaffolds complete multi-tenant SaaS apps Axios CVE-2025–62718: The Silent SSRF Bug That Could Be Hiding in Your Node.js App Right Now The dashboard that ended our friendship Data Pipelines Explained Simply (and How to Build Them with Python)
私はATプロトコルAPIを使用してBlueskyスクレイパーを構築し、Apifyに公開しました
Daniel Ainsw · 2026-05-28 · via DEV Community

Blueskyは今年初めに4000万人を突破し、Twitterとは異なり、オープンなプロトコルであるATプロトコルで動作しており、公開データは本当に公開され、設計上マシンが読み取れる。月額5000ドルのエンタープライズAPIレベルはなし。法律家が必要なレート制限もなし。ただクリーンなREST APIで誰でもクエリできる。

私はそれをスクレイピングしたいと思った。ここに私は本番用のアクターをどのように作成したかと、その過程で学んだことを説明する。

なぜ Bluesky は簡単にスクリプティングできる(合法的に)

ほとんどのソーシャルメディアスクリプターは Cloudflare、ローテーションプロキシ、サービス利用規約の曖昧な部分と戦うことになります。Bluesky は違います。AT プロトコルは明確にサードパーティクライアントとデータアクセスのために設計されています。public.api.bsky.app にある公開 API は認証なしの読み取りリクエストを処理します。指紋認識はありません、CAPTCHA はありません、DOM パースはありません。

唯一の問題点は、検索エンドポイント(app.bsky.feed.searchPosts)が現在、無料のアプリパスワードを通じて認証が必要になったということです。他のすべて——著者フィード、スレッド、プロフィール——はトークンなしで動作します。

私が作成した三つのモード

私は主要なB2B使用例をカバーする役割を一つ作りたかったです:

投稿を検索 — キーワードとハッシュタグの検索、日付範囲、言語フィルタリング、並び替え順序を使用します。bsky.social/xrpc/app.bsky.feed.searchPosts はベアラー・トークンを使用します。

著者フィード — 1つまたは複数のハンドルからすべての投稿を取得します。認証不要。競合監視やクリエイターのコンテンツ履歴の監査に便利です。

スレッド — 投稿URLから完全な会話木を取得します。APIはネストされた木を返します;私は深さ優先に平坦化するので、投稿のクリーンで順序付けられたリストを得ます。

注意点は:APIルーティングです。

これは私を傷つけた。私は認証されたリクエスト(JWTを使って)をpublic.api.bsky.appに送っていた。そのエンドポイントはCloudflareでフロントエンドされており、認証トークンを送ると403を返す——それは認証されていないトラフィック専用だ。

対処法:認証された呼び出しはbsky.socialに行き、認証されていない読み取りはpublic.api.bsky.appに行く。bsky.socialに対して認証し、JWTを取得し、そのJWTをその後のすべてのリクエストでだけ使う。bsky.social

を呼び出します。 モノレポデプロイメントの悩み

TypeScriptのモノレポでnpm workspacesを使ってApifyのアクターのポートフォリオを作成しています。共有ライブラリ (@apify-actors/shared) にはPPE充電のヘルパーとエラークラスが含まれています。ローカルでは、ワークスペース解決がきれいに処理されます。Apifyのビルドサーバーでは、モノレポがない——アップロードされたアクターのフォルダだけです。

解決策:共有ソースをsrc/shared/を使用し、相対的なインポートを行います。tsupはそれらを単一のdist/main.jsにバンドルします。共有コードはリポジトリ内の1つの標準的な場所に残り、各アクターはビルド時に独自のコピーが組み込まれます.

出力スキーマ

各投稿はフラットなJSONレコードとして返されます:

{
  "url": "https://bsky.app/profile/user.bsky.social/post/3lhxxxxxxxxx",
  "text": "Post content here",
  "authorHandle": "user.bsky.social",
  "authorDisplayName": "User Name",
  "likeCount": 142,
  "repostCount": 28,
  "replyCount": 19,
  "images": [{ "thumb": "...", "fullsize": "...", "alt": "..." }],
  "externalEmbed": { "uri": "...", "title": "...", "description": "..." },
  "createdAt": "2025-11-15T10:30:00.000Z"
}

フルスクリーンモードを開始 フルスクリーンモードを終了

Apify から直接 JSON、CSV、または Excel としてエクスポート。Zapier または Make にプラグインインしてノーコードワークフローを実行.

アクターは稼働中

何も構築せずに使用したい場合は: Apify Store 上的 Bluesky Posts Scraper

PPE 価格: 各実行 $0.25 + 各投稿 $0.003 ($3/1,000)。サブスクリプションなし。

ATプロトコルはBlueskyを現在、扱える最もクリーンなデータソースの一つにしています。もしあなたの使用例がソーシャルリスニング、ブランド監視、または成長著しいテクノロジー志向のオーディエンスからのリードジェネレーションシグナルを含む場合、スタックに追加する価値があります。