惯性聚合 高效追踪和阅读你感兴趣的博客、新闻、科技资讯
阅读原文 在惯性聚合中打开

推荐订阅源

P
Proofpoint News Feed
WordPress大学
WordPress大学
Recent Commits to openclaw:main
Recent Commits to openclaw:main
N
News and Events Feed by Topic
K
Kaspersky official blog
I
InfoQ
H
Hackread – Cybersecurity News, Data Breaches, AI and More
E
Exploit-DB.com RSS Feed
博客园 - 聂微东
Recent Announcements
Recent Announcements
D
Docker
小众软件
小众软件
cs.CV updates on arXiv.org
cs.CV updates on arXiv.org
S
Security Archives - TechRepublic
C
Cybersecurity and Infrastructure Security Agency CISA
Know Your Adversary
Know Your Adversary
The Register - Security
The Register - Security
GbyAI
GbyAI
Application and Cybersecurity Blog
Application and Cybersecurity Blog
F
Full Disclosure
博客园 - Franky
V
Vulnerabilities – Threatpost
Simon Willison's Weblog
Simon Willison's Weblog
Google DeepMind News
Google DeepMind News
L
LINUX DO - 最新话题
T
The Blog of Author Tim Ferriss
The GitHub Blog
The GitHub Blog
A
Arctic Wolf
J
Java Code Geeks
T
Tenable Blog
H
Hacker News: Front Page
美团技术团队
奇客Solidot–传递最新科技情报
奇客Solidot–传递最新科技情报
P
Palo Alto Networks Blog
Cisco Talos Blog
Cisco Talos Blog
B
Blog
有赞技术团队
有赞技术团队
罗磊的独立博客
Spread Privacy
Spread Privacy
L
LangChain Blog
N
News and Events Feed by Topic
F
Fox-IT International blog
Google Online Security Blog
Google Online Security Blog
Y
Y Combinator Blog
N
Netflix TechBlog - Medium
S
Schneier on Security
量子位
Microsoft Security Blog
Microsoft Security Blog
T
Tailwind CSS Blog
让小产品的独立变现更简单 - ezindie.com
让小产品的独立变现更简单 - ezindie.com

文章列表

LTO 磁带存储初探 混乱Web,无头存档,开源拖拉机——2025 GSoC 最终报告 存档误入深水区——If Summer is calling us OKOKDragon 对《 [译]如何成为“海盗”存档者? 》的评论 丑搜 v3 出炉 感谢 GitHub 的 $617 欢乐赞助(误) STWP 2023 第 15 周周报 新年特别活动:糗事百科1.3TiB福利送大家 博主们的2021年终总结
科学网博客平台存档计划
Micheal Chen · 2022-10-21 · via

科学网的博客平台(https://blog.sciencenet.cn)是国内少有的能存活到现在的博客平台(2007~)。

「科学网」由「中国科学报社」运营。「中国科学报社」是「中国科学院」所属唯一经国家新闻出版署批准的新闻媒体单位。(一句话:背景很大。)

其博客平台粗略目测没有任何广告,建站之初(2007)的老文章的存活率很高,而现今这个博客平台仍然有大量的活跃用户和新文章发布(估计每5分钟就会有一篇新文章,且多为长篇)。(一句话:存档价值很高!)

因此我们发起「科学网博客平台存档计划」,这是个长期项目,完成第一阶段的存档行动后,会定期 跟踪并存档 平台上新发布的文章。

目前用于该项目的存档脚本程序已经写好并运行。会将所有文章的 URL 推送到 IA 存档,待第一阶段存档完成后,我们会将详细存档结果(Archive.log)公开。

估计需要存档的文章数量在一百万左右,仅存档可公开访问的文章。


2022-10-21,已完成 100,000 的 id 进度。
2022-12-24,已完成 400,000 的 id 进度。
2023-02-13,已完成 1,000,000 的 id 进度。(追赶到 2021-8-16)