Blueskyは今年初めに4000万人を突破し、Twitterとは異なり、オープンなプロトコルであるATプロトコルで動作しており、公開データは本当に公開され、設計上マシンが読み取れる。月額5000ドルのエンタープライズAPIレベルはなし。法律家が必要なレート制限もなし。ただクリーンなREST APIで誰でもクエリできる。
私はそれをスクレイピングしたいと思った。ここに私は本番用のアクターをどのように作成したかと、その過程で学んだことを説明する。
なぜ Bluesky は簡単にスクリプティングできる(合法的に)
ほとんどのソーシャルメディアスクリプターは Cloudflare、ローテーションプロキシ、サービス利用規約の曖昧な部分と戦うことになります。Bluesky は違います。AT プロトコルは明確にサードパーティクライアントとデータアクセスのために設計されています。public.api.bsky.app にある公開 API は認証なしの読み取りリクエストを処理します。指紋認識はありません、CAPTCHA はありません、DOM パースはありません。
唯一の問題点は、検索エンドポイント(app.bsky.feed.searchPosts)が現在、無料のアプリパスワードを通じて認証が必要になったということです。他のすべて——著者フィード、スレッド、プロフィール——はトークンなしで動作します。
私が作成した三つのモード
私は主要なB2B使用例をカバーする役割を一つ作りたかったです:
投稿を検索 — キーワードとハッシュタグの検索、日付範囲、言語フィルタリング、並び替え順序を使用します。bsky.social/xrpc/app.bsky.feed.searchPosts はベアラー・トークンを使用します。
著者フィード — 1つまたは複数のハンドルからすべての投稿を取得します。認証不要。競合監視やクリエイターのコンテンツ履歴の監査に便利です。
スレッド — 投稿URLから完全な会話木を取得します。APIはネストされた木を返します;私は深さ優先に平坦化するので、投稿のクリーンで順序付けられたリストを得ます。
注意点は:APIルーティングです。
これは私を傷つけた。私は認証されたリクエスト(JWTを使って)をpublic.api.bsky.appに送っていた。そのエンドポイントはCloudflareでフロントエンドされており、認証トークンを送ると403を返す——それは認証されていないトラフィック専用だ。
対処法:認証された呼び出しはbsky.socialに行き、認証されていない読み取りはpublic.api.bsky.appに行く。bsky.socialに対して認証し、JWTを取得し、そのJWTをその後のすべてのリクエストでだけ使う。bsky.social は
を呼び出します。 モノレポデプロイメントの悩み
TypeScriptのモノレポでnpm workspacesを使ってApifyのアクターのポートフォリオを作成しています。共有ライブラリ (@apify-actors/shared) にはPPE充電のヘルパーとエラークラスが含まれています。ローカルでは、ワークスペース解決がきれいに処理されます。Apifyのビルドサーバーでは、モノレポがない——アップロードされたアクターのフォルダだけです。
解決策:共有ソースをsrc/shared/を使用し、相対的なインポートを行います。tsupはそれらを単一のdist/main.jsにバンドルします。共有コードはリポジトリ内の1つの標準的な場所に残り、各アクターはビルド時に独自のコピーが組み込まれます.
出力スキーマ
各投稿はフラットなJSONレコードとして返されます:
{
"url": "https://bsky.app/profile/user.bsky.social/post/3lhxxxxxxxxx",
"text": "Post content here",
"authorHandle": "user.bsky.social",
"authorDisplayName": "User Name",
"likeCount": 142,
"repostCount": 28,
"replyCount": 19,
"images": [{ "thumb": "...", "fullsize": "...", "alt": "..." }],
"externalEmbed": { "uri": "...", "title": "...", "description": "..." },
"createdAt": "2025-11-15T10:30:00.000Z"
}
Apify から直接 JSON、CSV、または Excel としてエクスポート。Zapier または Make にプラグインインしてノーコードワークフローを実行.
アクターは稼働中
何も構築せずに使用したい場合は: Apify Store 上的 Bluesky Posts Scraper
PPE 価格: 各実行 $0.25 + 各投稿 $0.003 ($3/1,000)。サブスクリプションなし。
ATプロトコルはBlueskyを現在、扱える最もクリーンなデータソースの一つにしています。もしあなたの使用例がソーシャルリスニング、ブランド監視、または成長著しいテクノロジー志向のオーディエンスからのリードジェネレーションシグナルを含む場合、スタックに追加する価値があります。












