惯性聚合 高效追踪和阅读你感兴趣的博客、新闻、科技资讯
阅读原文 在惯性聚合中打开

推荐订阅源

Threat Intelligence Blog | Flashpoint
Threat Intelligence Blog | Flashpoint
E
Exploit-DB.com RSS Feed
T
Tenable Blog
P
Privacy International News Feed
C
CXSECURITY Database RSS Feed - CXSecurity.com
Cisco Talos Blog
Cisco Talos Blog
T
Tor Project blog
H
Hacker News: Front Page
S
Securelist
Recent Commits to openclaw:main
Recent Commits to openclaw:main
A
Arctic Wolf
K
Kaspersky official blog
C
Cybersecurity and Infrastructure Security Agency CISA
Cloudbric
Cloudbric
Help Net Security
Help Net Security
钛媒体:引领未来商业与生活新知
钛媒体:引领未来商业与生活新知
I
Intezer
Simon Willison's Weblog
Simon Willison's Weblog
博客园 - 叶小钗
The Cloudflare Blog
L
LINUX DO - 热门话题
Last Week in AI
Last Week in AI
V
V2EX
L
LINUX DO - 最新话题
AWS News Blog
AWS News Blog
酷 壳 – CoolShell
酷 壳 – CoolShell
奇客Solidot–传递最新科技情报
奇客Solidot–传递最新科技情报
The Hacker News
The Hacker News
W
WeLiveSecurity
cs.AI updates on arXiv.org
cs.AI updates on arXiv.org
PCI Perspectives
PCI Perspectives
SecWiki News
SecWiki News
Application and Cybersecurity Blog
Application and Cybersecurity Blog
WordPress大学
WordPress大学
罗磊的独立博客
博客园 - 【当耐特】
Apple Machine Learning Research
Apple Machine Learning Research
J
Java Code Geeks
D
Docker
O
OpenAI News
Martin Fowler
Martin Fowler
N
News and Events Feed by Topic
S
Security @ Cisco Blogs
G
Google Developers Blog
H
Heimdal Security Blog
T
Troy Hunt's Blog
Vercel News
Vercel News
Recent Announcements
Recent Announcements
爱范儿
爱范儿
AI
AI

36氪

滨化股份港股上市获中国证监会备案-36氪 飞南资源:一季度净利润4.05亿元,同比增长7919.37%-36氪 A股三大指数集体收跌,全市场超3300股飘绿-36氪 阳光电源股份有限公司向港交所提交上市申请书-36氪 沪深两市成交额连续第222个交易日突破1万亿元-36氪 证监会部署打击和防范上市公司财务造假专项行动 天辰生物港股IPO获中国证监会备案-36氪 阿里云:4月30日10:00起,Qoder Teams版新购价格调整为300RMB/席位月-36氪 超捷股份:第一季度净利润1422.89万元,同比下降1%-36氪 外汇局:1-3月,中国外汇市场累计成交75.78万亿元人民币-36氪 当升科技:第一季度净利润2.77亿元,同比增长150%-36氪 最前线|AI收入破亿后的路径选择:微盟推行AI First战略与B端交付的挑战-36氪 洛阳钼业:第一季度净利润77.6亿元,同比增长96.65%-36氪 高德地图发布“AI 伴行”-36氪 赤峰黄金:第一季度净利润9.88亿元,同比增长104%-36氪 恒指收涨0.24%,恒生科技指数涨0.75%-36氪 中材科技:第一季度净利润5.07亿元,同比增长40.15%-36氪 东阿阿胶:第一季度净利润4.55亿元,同比增长7.14%-36氪 杭钢股份:第一季度净利润960.76万元,同比扭亏为盈-36氪 法国国民健康数据将从微软迁移至本土平台-36氪 歌尔股份:公司MEMS传感器产品在消费电子和汽车电子领域内均有较多应用场景-36氪 财政部:截至上周,消费品以旧换新带动销售额超5400亿元,惠及近7500万人次-36氪 财政部:一季度国债发行规模超3.62万亿元,投资者认购积极踊跃-36氪 DeepSeek V4发布,海光DCU完成Day0适配-36氪 财政部:一季度全国税收收入4.85万亿元,同比增长2.2%-36氪 财政部:股票市场交易活跃,一季度证券交易印花税增长78.1%-36氪 财政部:一季度全国一般公共预算收入6.16万亿元,同比增长2.4%-36氪 日本将从5月1日起释放第二批石油储备-36氪 天猫与长安汽车达成合作,正式入局整车销售-36氪 理想L9 Livis计划于5月15日正式上市,并开启交付-36氪 百度联盟正式发布海外App业务-36氪 挪威将禁止16岁以下儿童使用社交媒体-36氪 小马智行联合宁德时代首发L4级无人驾驶轻卡-36氪 日本将成立特别工作组应对金融体系网络安全风险-36氪 美股新高之际 高盛警告:美股近期可能下跌,切莫贸然加仓-36氪 有道龙虾已率先集成DeepSeek-V4和Kimi K2.6-36氪 PPIO首批上线DeepSeek-V4-36氪 特斯拉:赛博无人驾驶电动车Cybercab在北美投产-36氪 航油价格飙升令多家美国航空运营商业绩承压-36氪 国家能源局:3月核发绿证3.03亿个-36氪 每日互动DeepSeek-V4私部方案已就绪-36氪 沪深两市成交额连续第13个交易日突破2万亿-36氪 博硕科技:蓝海芯新材料已投入运营,当前营收规模较小-36氪 DeepSeek V4终于发布,但它留下的5道主观题还没有答案-36氪 起亚公司第一季度销售额29.5万亿韩元,高于市场预期-36氪 小鹏第二代VLA智驾报告首发,全系Ultra车型订单环比提升118%-36氪 北京君正:目前公司在研发LPDDR5-36氪 融了2000万美金,这家2000万美金ARR的AI公司,推出“视频版Photoshop”「Buzzy」 阶跃发布新一代自动语音识别模型StepAudio 2.5 ASR-36氪 NEC宣布与Anthropic达成网络安全合作-36氪 Keep发布9.0版本-36氪 李斌:汽车行业决赛期还有五年结束-36氪 电投贵安数据中心公司注册资本增至2.98亿元-36氪 半日主力资金加仓基础化工板块,抛售通信板块-36氪 海光C86全栈产品与解决方案亮相第87届教育装备展-36氪 茅台向经销商「要利润」-36氪 香港机场3月客运量同比增长19.6%-36氪 恒指午间休盘跌0.2%,恒生科技指数涨0.34%-36氪 英特尔CEO:半导体行业整体潜在市场规模已逼近1万亿美元-36氪 江苏省环保集团注册资本增至约63.6亿元 A股三大指数午间休盘集体下跌,贵金属板块领跌-36氪 英特尔CEO:所有业务板块需求仍高于供给,预计至强服务器CPU今明两年保持强劲增长势头-36氪 中国首款原生开发Robotaxi亮相北京车展,曹操出行定制版计划2027年量产 摩根士丹利:新兴市场股票远未进入新的长期牛市-36氪 Gartner:2025年阿里云中国市场份额32.8%,同比提升2.7个百分点-36氪 DeepSeek官网公布DeepSeek-v4接口文档-36氪 2026年大众汽车将在中国推出13款新能源车型-36氪 华尔街多家公司承诺提供60亿美元支持QXO收购TopBuild-36氪 现货白银向下跌破75美元/盎司-36氪 软银拟改造工厂为数据中心生产电池-36氪 蔚来在武汉成立新能源科技公司-36氪 万兴科技旗下万兴脑图上线“万兴脑图AI”-36氪 国家能源局:1-3月全国电力市场交易电量同比增长25.6%-36氪 菲律宾央行暗示将小幅加息以抑制通胀-36氪 可灵AI 3.0模型新增原生4K能力-36氪 用“活人感”做科技社区,小红书能成吗?-36氪 创业板指跌逾2%,AI硬件、软件领跌-36氪 天鹜科技发布对话式蛋白质研发智能体MatwingsVenus™-36氪 人工智能初创公司Cognition AI进行融资谈判,估值达250亿美元-36氪 恒生指数跌幅扩大至1%-36氪 OMV新西兰公司预计毛伊气田将于2026年停产 维塔流动近日完成数千万元Pre-Seed轮融资-36氪 亚马逊支持的X-Energy通过IPO募资10.2亿美元-36氪 千问加速上车,10多家车企同日宣布接入-36氪 天问三号任务计划于2031年前后携带火星样品返回地球-36氪 统筹推进商业航天标准化建设,商业航天标准体系(1.0版)发布-36氪 博裕、经纬、顺为等投资前新石器COO超亿元,押注AI超便携电子纸|硬氪独家-36氪 A股三大指数集体低开,新易盛跌超9%-36氪 央行今日开展50亿元7天逆回购操作-36氪 恒指开盘跌0.7%,恒生科技指数跌0.8%-36氪 人民币兑美元中间价报6.8674-36氪 小米汽车:新一代SU7已交付26000台-36氪 8点1氪丨华谊兄弟被申请破产重整;普华永道因恒大审计赔偿10亿港元;伊朗将恢复往返中国的航班-36氪 打造生物智能基础设施,AI4S企业「奥明星程」获超亿元A轮融资|36氪首发-36氪 美国百年太妃糖易手,Roca乐家被全资收购-36氪 破局“智驾双雄”,千里科技如何以AI之力重塑行业格局-36氪 氪星晚报|ThinkPad发布AI主机,可一键部署“龙虾”、较云主机三年总成本可节省48%;量化投资先驱马丁·卢克警告勿将交易决策全盘交予人工智能;国家知识产权局:2025年我国共授权发明专利97.2万件-36氪 创·问|炜璨医疗李强:从理解规则,到建立规则——重塑植入式给药路径-36氪 固态激光雷达“像素竞赛”加速,速腾聚创VGA大面阵SPAD-SoC产品发布|最前线-36氪 36氪官方AI专属社群,正式开放招募!-36氪
6.4k Stars!用Claude Code写论文的全套流水线,有人打包开源了-36氪
2026-05-17 · via 36氪

听雨 发自 凹非寺量子位 | 公众号 QbitAI

用Claude Code写论文的一整套流水线,有人打包开源出来了。

完全戳中了学生党的痛点,github星标直达6.4k

academic-research-skills

项目名叫academic-research-skills(以下简称ARS),是一套Claude Code技能包。

里面涵盖4个skill,分别对应论文的研究、写作、审稿、定稿

只需两行命令安装,直接一条龙串起整套学术研究流水线。

academic-research-skills

只能说,我读研的时候怎么没碰到这种好东西呢…

示意图

4个skill,跑通整套科研流程

ARS的核心架构由4个skill组成,它们各司其职,拼在一起就是一条从选题到交稿的完整链路。

我这里还做了图,大家可以看得比较直观:

Deep Research是一支13个Agent的研究团队。

它负责文献调研、研究问题构建、方法论设计,还能写系统性的PRISMA综述。

团队里有专门做文献溯源的Agent,会调用Semantic Scholar API验证每一篇引用的真实性。

有苏格拉底导师Agent,通过对话引导研究者理清思路。

还有魔鬼代言人Agent,专门挑刺,防止研究者在早期就陷入思维定式。

Academic Paper是一支12个Agent的写作团队。

从大纲设计、论证构建、草稿撰写,到双语摘要生成、图表可视化、引用格式转换,全流程覆盖。

特别值得一提的是风格校准功能,AI会学习你过往作品的写作风格,让输出更像你自己写的,而不是千篇一律的AI味。

输出格式支持Markdown、DOCX、LaTeX,最终可以编译成APA 7.0或IEEE格式的PDF。

Academic Paper Reviewer是一支7个Agent的审稿团队。

模拟真实学术期刊的评审流程,由主编EIC带领三位领域审稿人,再加上一个魔鬼代言人,从方法论、学科视角、跨学科价值等多个维度打分。

评分采用0到100的量化标准,80分以上接受,65到79小修,50到64大修,50以下拒稿。

审稿团队还会输出详细的修改路线图,告诉作者下一步该做什么。

Academic Pipeline是流程编排器,把前面三个团队串联成一条10阶段的流水线。

从研究、写作、完整性检查、同行评审、修订、最终检查,到发表准备和流程总结,每个阶段都有明确的产物和检查点。

你可以在任意阶段插入,比如已经有了初稿,就从Stage 2.5的完整性检查开始;收到了审稿意见,直接从Stage 4的修订切入。

费用参考也很透明,一篇1.5万字的论文,全程跑下来大约4到6美元

比较有意思的设计

用Claude Code做学术研究的开源项目已经很多了,但是深扒之后,我发现ARS在底层设计上还是有些过人之处。

可以简单总结为一句话:系统性防止AI搞砸学术研究

第一,引用核验

AI写论文最忌讳的,就是幻觉引用。

不只是编造不存在的文章,还包括标题相似但作者年份全错、DOI真实但内容对不上等更隐蔽的情况。

ARS在Deep Research阶段就埋了一个引用核验机制,每一篇文献都要过Semantic Scholar API的存在性确认。

不是简单查一下标题对不对,而是用Levenshtein相似度算法做模糊匹配,阈值设在0.70以上才算通过。

第二,完整性闸门

在流水线的Stage 2.5和Stage 4.5,有两道不可跳过的完整性闸门,会运行一份7项AI失败模式检查清单

这份清单直接来自2026年Nature上发表的一项全自主AI科研研究,其中总结了7种翻车模式,覆盖引用幻觉、数据捏造、方法论造假等情形。

7种翻车模式

任何在2.5被标记为SUSPECTED的问题,必须在4.5变成CLEAR,或者由人工手动覆盖并留下记录。

设计逻辑是:把「我相信AI不会出错」变成「我要求AI证明它没出错」。

实测中,这套机制在一篇真实论文里抓到了15个伪造引用和3个统计错误。

第三,反谄媚协议,让AI敢于说不

大多数AI工具都有一个隐形毛病,讨好用户。你让它改,它就改,哪怕改得更差。

所以ARS在审稿环节专门设计了反谄媚机制。

审稿团队里有一个Devil’s Advocate,也就是魔鬼代言人,职责是挑刺。

但挑完刺之后,还有一个让步阈值协议。

DA的反驳会被评分1到5,如果低于4分,写作团队不允许承认。

换句话说,AI不能为了显得好合作就轻易让步。

同时,攻击强度在修订过程中必须保持。如果第一轮审稿把方法论批得体无完肤,作者修订后不能让审稿人突然变得温柔。

评分轨迹也会被追踪,任何维度的分数下降都会被标记为回归。

这和软件工程里的不引入新Bug原则一样,改一个地方不能搞砸另一个地方。

第四,三层数据隔离,不让AI偷看答案

ARS把数据流严格分成三层:

Layer 1是原始输入,默认不可信,可能幻觉、过时、带偏见。

Layer 2是通过完整性验证后的产物。

Layer 3是评分标准、参考答案和金标数据,这层材料永远不能出现在写作AI的上下文中。

具体实现上,写作团队和审稿团队分两次独立调用,中间有阶段边界隔离。

写作AI只能收到审稿AI的自然语言反馈,比如「第二章论证跳跃,建议补充对比实验」。

但它看不到原始的评分标准,也不知道每个维度占多少分。

这个设计的灵感来自于Anthropic今年的w2s-researcher研究,其中也用了同样的三层隔离模型。

结论是当AI能读取标签数据时,结果可能不是真的泛化,而是在优化表面特征。

解决方案不是更好的提示词,而是结构上的隔离。

最后一点,诚实文档化,「我不保证能复现」

学术界经常遇到「这个结果我复现不了」的问题。ARS给每个产物生成一个repro_lock文件,记录运行时的完整配置。

但文件里有一段强制声明,LLM输出不是字节级可复现的,模型提供商会更新权重而不改模型ID,外部API每天返回不同的数据。

这个文件只是配置文档,不是重放保证。

在更新日志上,可以看到ARS已经经历了很多轮迭代。从2月上线到现在,提交的commit数达到了三百多次。

从每次版本更迭中,也能看出作者对AI学术研究系统风险有着深刻理解。

这也是我觉得目前学术研究AI工具的关键所在——

让AI帮你写论文并不难,重点是如何防止它出错、讨好,让整个流程变得更系统更可靠。

ARS的设计哲学,可以总结为README里那句话:

「AI是你的副驾驶,不是飞行员。」

如何安装

安装方式很简单,如果你已经在用Claude Code,只需要两行命令:

/plugin marketplace add Imbad0202/academic-research-skills/plugin install academic-research-skills

验证安装是否成功,运行:

/ars-plan

然后描述你正在写的论文主题,ARS就会启动苏格拉底对话,帮你梳理论文结构。

如果你偏好单条命令测试,也可以用:

/ars-lit-review “你的研究主题”

不过最简单的安装办法,其实是直接把SKILL.md上传到claude.ai项目知识库

不需要安装Claude Code,打开浏览器就能用。

不过要注意,这种方式不支持多Agent并行,功能上是单Agent版本,适合轻度体验;想跑完整流水线还是需要Claude Code。

还有一点,项目支持繁体中文和英文

那么,又到了大家最关心的,要花多少钱的环节。

作者推荐使用Claude Opus 4.7搭配Max订阅计划

完整跑完10个阶段,单次可消耗超过20万输入token和10万输出token,单独使用某个子模块则少得多。

Max订阅计划分两档,每月100刀或200刀,相当不便宜。

但如果你的科研经费可以报销的话,那…

示意图

本文来自微信公众号“量子位”,作者:关注前沿科技,36氪经授权发布。