惯性聚合 高效追踪和阅读你感兴趣的博客、新闻、科技资讯
阅读原文 在惯性聚合中打开

推荐订阅源

Cloudbric
Cloudbric
E
Exploit-DB.com RSS Feed
SecWiki News
SecWiki News
Forbes - Security
Forbes - Security
N
News | PayPal Newsroom
S
Security @ Cisco Blogs
Schneier on Security
Schneier on Security
V
V2EX - 技术
S
Secure Thoughts
W
WeLiveSecurity
Google DeepMind News
Google DeepMind News
C
CERT Recently Published Vulnerability Notes
NISL@THU
NISL@THU
S
Securelist
S
Security Archives - TechRepublic
Know Your Adversary
Know Your Adversary
V
Vulnerabilities – Threatpost
Security Latest
Security Latest
Recent Commits to openclaw:main
Recent Commits to openclaw:main
G
GRAHAM CLULEY
H
Hacker News: Front Page
Microsoft Azure Blog
Microsoft Azure Blog
I
Intezer
Google Online Security Blog
Google Online Security Blog
美团技术团队
阮一峰的网络日志
阮一峰的网络日志
T
The Exploit Database - CXSecurity.com
钛媒体:引领未来商业与生活新知
钛媒体:引领未来商业与生活新知
Webroot Blog
Webroot Blog
Jina AI
Jina AI
Engineering at Meta
Engineering at Meta
P
Proofpoint News Feed
The Cloudflare Blog
I
InfoQ
L
LangChain Blog
U
Unit 42
P
Proofpoint News Feed
S
Schneier on Security
S
Security Affairs
Y
Y Combinator Blog
T
Tenable Blog
N
News and Events Feed by Topic
MyScale Blog
MyScale Blog
量子位
Google DeepMind News
Google DeepMind News
Cyberwarzone
Cyberwarzone
博客园 - 聂微东
D
Darknet – Hacking Tools, Hacker News & Cyber Security
GbyAI
GbyAI
AWS News Blog
AWS News Blog

分享发现

推荐 2 个好玩的在线游戏站 Claude code 的 Designs 和 Routines 居然是独立额度,我的 Claude Pro 订阅又升值了 偶然看到一篇文章《文化已死:当绝大多数人听的音乐,读的书都来自 10 年前》,给大家推荐一下,非常值得一看 66 个入狱教程 国家超算互联网平台提供 Coding Plan(20 元/100 元两档) supergeo.info 送兑换码 V2EX › 登录 古风提示词 Bright Data 代理和 Browser API 90 天 6 折,优惠码 BESTPROXY60 飞机上 Starlink 测速 zig 写的 100kb 的 wasm 可以 http 读写任意 git 仓库 GPT Image 2 韩文 prompt 实测:不是“能看懂”,而是“能还原” 网页端 GPT-5.5 Thinking 体感好快啊,这速度第一反应还以为是降智到 4o-mini 了 新开中转站,有 GPT 包月可以薅,分享给有缘人 google 搜索的 AI 模式(自动右侧弹出)是个谜啊? 小红书下场做 app 工厂 做了一个 GEO 工具平台,想听听大家对 AI 搜索优化的看法 XChat 正式上架 App Store 了 大 F 彻底沦为历史了,公司宣布停业。 记一次 QQ 被盗事件记录 codex 5.5 强的离谱 用 Claude 做了视频“关于 ping0.cc 静默上传用户真实 IP” AI 辅助英语学习,无推广,讨论一下 gpt5.5 写完界面,还会进行截图查看效果 DeepSeek4 的数据没清理好啊,估计有得折腾 做了一个自动识别云朵的网站 claude 太抠门了 继上次讨论自媒体问题后,我决定下架流量最大的视频 DeepSeek V4 上线了! deepseekv4 来了 DeepSeek V4 正式发布了! 搞起,试试试试!附官网更新的模型链接 模型之外, Codex 也更新了 Auto-review 功能,不用 Full access 了 DeepSeekV4 来了, 希望可以抗衡御三家 DeepSeek V4 上了,连发布会都省了 DeepSeek V4 终于来了,是牛子是马拉出来溜溜 一个性价比极高的数据冷备份路子 苹果中国官网挂了 Gemini One 免费 4 个月邀请链接,,稳不稳 今日乐子:天星银行(AirStar)改名象象银行(Elebank) 分享两个我刚开源的 Codex 插件: Spec 驱动开发 + 飞书知识库接入 “WildCrad 余额兑换 gpt 会员”, Gemini 警告“疑似诈骗” 支付宝的神券团购怕是自己都没用过吧 《 AI 带来的革命性改变,为何还没发生 》 分享一个用自然语言整理 Chrome 书签的小工具 微信聊天记录时间 BUG 我觉得比这个什么问界趴窝更奇葩的是这个豆包 AI,看完雷军得被当场气晕 使用中转站要擦亮眼睛!不说别的,倍率计算 充值好乱。 DeepSeek API 更新新模型了? 图一乐 Prompt|让 GPT-Image-2 根据记忆为你设计一个书房 vibe 了一款记忆训练游戏 3 月工作了 269 个小时,于是奖励了自己一辆唐 L EV 我怀疑最近有人拿 v 站当小红书来使了 简单分享下自己回农村后试图搞短视频/直播电商的经历 codex 新模型 大家有更新吗 收集一下对老年人友好的记忆类的小游戏 超顶! GPT-Image 2 图像模型全量上线,很强大 问一下你给 AI 的印象,估计大家估计都是 tony Stark opus 4.7 消耗太快了 说个暴论: gpt plus 比 5x claude code 还耐用啊 今天不小心把 typc-c 线插进电脑 usb-A 母口了,还是不够“防呆” 安徽宿松未婚生子退彩礼案会不会给一些人提供了思路? [填坑] 德国沃达丰 eSIM 手机号充值 & 保号教程 避雷这个中转站,三天两头不行,还不退款 你见过 AI 被“逼疯” 了吗? 手机贴膜之 类纸膜 [虚拟机挂微信也会掉线] 下文 谷歌商店的 Mi Fitness 似乎不能连接国行的小米手环了 招商银行真是奇葩,半夜三更偷偷给你的银行卡签约在线支付 小米+ iPhone 双持体验分享 Aniu——利用 AI 进行全自动操作模拟仓炒股的程序 为什么你该停止使用 Ollama 亲测已撸|成功拿下德国 O2 eSIM 卡申请记录分享 [开源分享] transpec,开发框架转换工具 使用 bitwarden 导致 Chrome 浏览器卡顿的问题 Claude Design 新发现? qwem3.6 35b a3b 官方模型写刘备文 6 得很 [开源]浏览器里设计 3D 键盘,打开就能玩 今年的 lenny newsletter 年订阅大包 大家觉得值不值? 签到 bug 正好在整十日 喜大普奔, authy 可以收到验证码了 再开一贴,讨论 claude code 的平替 qq 邮箱居然开始有广告了 通过 AI 编程 Token 用量,也能“大概”能看出你靠 AI 的盈利能力 openai 注册不需要手机号了,日本、美国节点测试都可以 中转站三步曲 看看你的中转站到哪一步了 Codex 这个申请权限的交互好有意思 移动下场了。免费送一个月 coding Plan(3w 次调用) Codex 又更新了 我的语言学习,基础打好后,学习就会变得无痛 浅试了一下 Qwen3.6-35B-A3B,很强 DESIGN.md 被反诈拦截 第一次在自媒体上赚到钱 用回测筛选因子的一点经验分享 阿里百炼平台上 glm5.1 了 花了两周整理了一份比特浏览器(BitBrowser)中文指南,从下载到指纹防关联全覆盖 v2ex 是 good hacker for spamming program 🤣 我发现支付宝新推出的 AClaw 能够解决账单自动导出的难题! 慢讯, Gemini 推出 Mac 客户端 分享一个自己做的 Nginx 可视化配置工具,实时请求动态预览! [实测生产环境稳定运行半年以上没毛病] claude code 会话团队 hermes 抄袭中国团队 EvoMap 的开源引擎 Evolver
如何让 OpenClaw 自动追踪 AI 前沿论文和 GitHub Trending
game115 · 2026-06-10 · via 分享发现

最近我给自己搭了一套自动化流程:每天追踪 AI / CS 方向的新论文和 GitHub Trending 热门项目,然后自动筛选、整理、生成中文摘要,最后沉淀成日报。

这套系统的目标很简单:

不再靠手动刷 arXiv 、GitHub Trending 、Twitter/X 和各种群消息来追前沿,而是让 AI Agent 每天帮我完成第一轮信息筛选。

我用的是 OpenClaw ,主要让它承担三件事:

  1. 定时抓取 arXiv 最新论文和 GitHub 热门项目;
  2. 按主题、质量和工程价值做过滤;
  3. 自动生成中文摘要、深度解读和每日归档。

这篇文章简单分享一下系统是怎么搭的,以及目前踩到的一些坑。


1. 为什么要做这套东西?

如果你关注 AI 工程化,信息源会非常碎:

  • arXiv 每天都有大量新论文;
  • GitHub Trending 每天都有新项目冒出来;
  • Hugging Face 、OpenAI 、Anthropic 、Google 、Meta 、微软等团队会不定期发布模型、框架或技术报告;
  • 很多有价值的项目不是一开始就爆火,而是在小范围技术圈里先出现。

手动追踪的问题是:

  • 很容易漏掉重要论文;
  • GitHub Trending 噪声很大,很多项目只是短期热闹;
  • 标题和 README 经常看起来很强,但实际工程价值一般;
  • 每天都刷一遍非常耗时间。

所以我想做一个自动化系统,先让 Agent 帮我做“第一轮粗筛”,把候选论文和项目整理出来,再对其中高价值内容做中文精读。


2. 整体架构

目前流程大概是这样:

定时任务 / Cron
   ↓
数据源抓取
   ├── arXiv API
   ├── GitHub Trending / GitHub API
   └── 其他公开信息源
   ↓
候选池入库
   ↓
规则过滤 + 去重
   ↓
Agent 精读 / 摘要生成
   ↓
Markdown / JSON / SQLite 归档
   ↓
公众号草稿 / GitHub 日报 / 后续分发

核心不是“抓取”,抓取其实不难。真正麻烦的是:

  • 怎么过滤垃圾信息;
  • 怎么避免每天重复写同一个方向;
  • 怎么判断一个项目是不是真的值得看;
  • 怎么让生成内容尽量可验证,而不是 AI 胡编。

3. 论文部分:从 arXiv 候选到中文精读

论文侧主要关注这些方向:

  • RAG / Retrieval-Augmented Generation
  • Search / Information Retrieval
  • Agent / Tool Use / Function Calling
  • Long Context
  • Evaluation / Benchmark
  • LLM Application Engineering
  • Knowledge Base / Re-ranking / Query Understanding

数据源主要是 arXiv API ,例如:

每篇论文进入候选池后,会先做基础解析:

  • 标题
  • 作者
  • arXiv ID
  • 摘要
  • 分类
  • 发布时间
  • PDF 链接
  • 关键词

然后做几层过滤:

  1. 主题相关性:是否和 AI 工程化、RAG 、搜索、Agent 等方向有关;
  2. 新鲜度:优先最近 1 个月,越新越优先;
  3. 机构/作者可信度:顶级实验室、大厂、知名高校会加权,但不绝对迷信;
  4. 工程价值:有没有方法、框架、评测或实践启发;
  5. 重复度:是否和之前已经写过的主题过于接近。

通过过滤后,Agent 会读取论文摘要、PDF 或 HTML 版本,生成结构化产物:

paper_slot/
  deep_read_article.md
  deep_read_meta.json
  sources.md
  evidence-notes.md
  seo-title.json

我比较看重 sources.mdevidence-notes.md,因为 AI 写论文解读很容易“看标题发挥”。所以每篇文章都需要保留来源、证据和不确定点。


4. GitHub 部分:不只看 Star ,更看工程价值

GitHub Trending 的噪声非常大。

有些项目一天几千 Star ,但可能只是:

  • 一个简单 UI 壳子;
  • 复刻已有项目;
  • README 写得很夸张;
  • Demo 很漂亮,但代码不可复用;
  • Star 暴涨,但最近维护质量一般。

所以我没有只按 Star 排序,而是做了几个维度:

  • Star 总数;
  • 最近增长速度;
  • 最近 commit 活跃度;
  • README 是否清晰;
  • 是否有真实代码结构;
  • 是否有 license ;
  • 是否有 release / examples / docs ;
  • 是否和 RAG 、Agent 、搜索、LLM 应用工程相关;
  • 是否解决真实工程痛点。

一个项目进入精读流程前,至少要检查:

repo_slot/
  repo-evidence.json
  readme.md
  key-files.md
  sources.md
  deep_read_article.md
  seo-title.json

我希望最后生成的不是“这个项目很厉害,大家快去看”的营销文,而是能回答几个问题:

  1. 它解决了什么问题?
  2. 它和已有方案相比有什么不同?
  3. 它的架构或实现有什么可复用点?
  4. 它现在成熟吗?适不适合生产使用?
  5. 如果我要试用,第一步应该看哪里?

我需要的不是单次 ChatGPT 问答,而是一个能长期运行的个人自动化 Agent 。

OpenClaw 对我比较有用的点:

  • 可以读写本地工作区文件;
  • 可以跑脚本、定时任务;
  • 可以维护长期记忆和每日日志;
  • 可以把流程拆给多个子 Agent ;
  • 可以把产物写成 Markdown / JSON / SQLite ;
  • 可以接入公众号草稿、Discord 、QQ 等通知渠道。

换句话说,它更像一个“能干活的个人自动化工作台”,而不是只会聊天的模型。

当然,最重要的是:所有自动生成内容都要有检查门禁。比如:

  • 没有来源链接不能进正式稿;
  • 没读 primary source 不能写深度解读;
  • 不能出现“待补充”“TODO”“正式发布前请检查”这类占位词;
  • 标题不能为了吸引点击而歪曲论文或项目本意;
  • GitHub 项目不能把 README 里的宣传语直接当事实。

6. 目前的每日输出

现在我的目标是每天产出两类内容:

  1. 论文精读:偏研究方法、技术路线、评测和启发;
  2. GitHub 项目精读:偏架构、代码、工程价值和可落地性。

每日内容会先进入本地归档,再进入公众号草稿箱,最后人工检查后发布。

我也准备把其中一部分公开成 GitHub 仓库,作为每日 AI 论文和 GitHub Trending 的中文索引:

  • 每日论文列表;
  • 每日热门项目列表;
  • 中文简介;
  • 原始链接;
  • 主题标签;
  • 后续可能补充脚本。

完整版的深度解读会继续放在公众号里。


7. 踩过的一些坑

7.1 不要只追热点

GitHub Trending 很容易让人被短期 Star 牵着走。后来我加了“工程价值”和“主题相关性”的过滤,否则日报会变成项目搬运。

7.2 AI 很容易把摘要写成鸡汤

如果 prompt 不约束,论文解读很容易变成:

本文提出了一种创新方法,显著提升了性能,具有重要意义。

这种话基本没信息量。

所以我现在要求每篇都必须回答:

  • 方法具体是什么;
  • 输入输出是什么;
  • 对比基线是什么;
  • 适用边界是什么;
  • 工程上能学到什么。

7.3 需要保留证据文件

自动化写作最怕“看起来很完整,但来源不可查”。

所以每个 slot 都会保留来源文件,例如:

  • arXiv 链接;
  • PDF 链接;
  • GitHub repo 链接;
  • README 摘要;
  • 关键文件路径;
  • 生成时的判断理由。

这样后面出了问题可以回溯。

7.4 公众号不是终点,归档和分发更重要

如果内容只存在公众号里,后续搜索和复用都不方便。

所以我会同时保留:

  • Markdown 版本;
  • JSON 元数据;
  • SQLite 主账本;
  • GitHub 公开索引;
  • 后续可能加网页展示。

8. 后续计划

接下来我想继续做几件事:

  • 开源每日论文和 GitHub Trending 中文索引仓库;
  • 加入更细的主题分类,比如 RAG 、Agent 、Search 、Evaluation ;
  • 对高价值论文做系列化追踪;
  • 对 GitHub 项目增加“可运行性”和“维护质量”评分;
  • 把日报沉淀成一个可搜索的 AI 工程知识库。

如果你也在做类似的论文追踪、GitHub Trending 筛选、AI 技术日报,欢迎交流。

我会把完整的中文精读和每日筛选结果放在公众号「 AltenAI 观察」。

最后放一句软广:如果你关心 RAG 、搜索、Agent 、API 接入和大模型工程化落地,可以关注一下「 AltenAI 观察」。我会持续把每天筛出来的论文和项目做成中文摘要和工程解读。

也把文章放在了 github: https://github.com/AltenLi/daily-paper-github-trends