惯性聚合 高效追踪和阅读你感兴趣的博客、新闻、科技资讯
阅读原文 在惯性聚合中打开

推荐订阅源

www.infosecurity-magazine.com
www.infosecurity-magazine.com
Security Archives - TechRepublic
Security Archives - TechRepublic
TaoSecurity Blog
TaoSecurity Blog
Cloudbric
Cloudbric
cs.CL updates on arXiv.org
cs.CL updates on arXiv.org
N
News and Events Feed by Topic
Threat Intelligence Blog | Flashpoint
Threat Intelligence Blog | Flashpoint
S
Securelist
The Cloudflare Blog
让小产品的独立变现更简单 - ezindie.com
让小产品的独立变现更简单 - ezindie.com
D
DataBreaches.Net
S
Schneier on Security
L
LangChain Blog
Jina AI
Jina AI
M
MIT News - Artificial intelligence
Recent Announcements
Recent Announcements
T
Tenable Blog
B
Blog RSS Feed
V
Visual Studio Blog
Simon Willison's Weblog
Simon Willison's Weblog
G
Google Developers Blog
T
The Exploit Database - CXSecurity.com
Exploit-DB.com RSS Feed
Exploit-DB.com RSS Feed
WordPress大学
WordPress大学
W
WeLiveSecurity
I
InfoQ
The Hacker News
The Hacker News
雷峰网
雷峰网
月光博客
月光博客
P
Privacy & Cybersecurity Law Blog
O
OpenAI News
Hacker News: Ask HN
Hacker News: Ask HN
T
Threat Research - Cisco Blogs
GbyAI
GbyAI
The Last Watchdog
The Last Watchdog
P
Privacy International News Feed
Cyberwarzone
Cyberwarzone
S
SegmentFault 最新的问题
L
Lohrmann on Cybersecurity
人人都是产品经理
人人都是产品经理
V
V2EX
V
Vulnerabilities – Threatpost
cs.CV updates on arXiv.org
cs.CV updates on arXiv.org
C
Cybersecurity and Infrastructure Security Agency CISA
freeCodeCamp Programming Tutorials: Python, JavaScript, Git & More
T
Troy Hunt's Blog
Application and Cybersecurity Blog
Application and Cybersecurity Blog
阮一峰的网络日志
阮一峰的网络日志
SecWiki News
SecWiki News
Microsoft Azure Blog
Microsoft Azure Blog

星辰日记

临时邮箱:开发者的隐私工具实践笔记 为 QuMagie 备份的照片添加 Exif 信息 Riverpod - flutter 状态管理的应用 夜景随拍 大疆 Mini 4K 初体验 5月12日 随笔 你好 2024 HHKB 使用体验 历经59天, 终于拿到软著 渺软公益CDN - 又一个静态资源加速站 你好 2023 大一 碎语 试用 Google CA 的 SSL 证书 Waline 邮件异步推送 Magic Trackpad 使用体验 Centos 编译安装 php81 Redis 统计实时在线人数 Centos 7 升级 Glibc-2.28 Nginx 重写 Query 参数
记一次 RAID 硬盘离线
xcsoft · 2022-12-26 · via 星辰日记

事故

使用 Dedipath 的服务器应该已经超过三年了吧。价格便宜,客服服务也挺不错的。但是,这次的事情,让我对其服务的可靠性及服务态度产生了怀疑。

事情应该是发生在今年的12月1日,收到Uptime-Kuma发来的邮件, 说我的 OpenID 的后端似乎离线了。

检查了一下,发现其所在的服务器 文件系统变成了 Readonly Filesystem . 无奈,只能发工单联系其客服,客服给出的回复是:

We are currently trying to run maintenance on the host server for this node. We will contact you once we have an update. Sorry for the delay. and thank you for your patience.

简单来说,就是我们正在对宿主机所在的节点进行回复。但其并没有任何的预先通知,再次询问过后,客服给出了如下的回复:

VPS’ on Node Los Angeles OpenVZ Node DC04R11SRV36
We discovered a disk in this node which fell out of the RAID-10 array, but was marked as in good health. As such, we re-added the disk to the array, but for unknown reasons, we immediately begun to see file system errors.
As such, we are requesting that all customers on this node login to SSH (we have tested SSH on various VMs and it does respond) and create a backup of any important data. Once complete, please open a technical support ticket and request that we re-create your VPS on a new node.
Our sincere apologies for the troubles caused. We are not sure why the behaviour that occured has occured, but an examination into our processes will be undertaken to try and prevent such issues from re-occuring.

简单来说,就是因为 RAID-10 阵列的一块硬盘离线, 但其 SMART 数据显示状态正常。将其重新加入到阵列中,但是出现了文件系统错误。

什么是 RAID

可能有的人不懂什么是 RAID, 这里简单的介绍一下.

RAID, 即磁盘阵列。通常由多块硬盘组成,通过硬件或者软件的方式,将多块硬盘组合成一个逻辑的磁盘,以提高数据的可靠性和可用性。

此处使用的 RAID-10 至少需要4快硬盘。可以理解为 RAID10 是: 2快硬盘组成 RAID1,再由2组 RAID-1 组成 RAID-0。

通常来说, 这似乎能够允许最少两块硬盘的损坏,不会影响数据的可靠性和可用性。

给出的解决方案

Dedipath 给出的解决方案是: 给我在一个新的 node 上重新开一台 VPS。

在我询问对于我原先的数据如何迁移,以及这期间造成的损失时,客服表示,他们没有 SLA 赔偿协议。

It is your responsibility to maintain frequent backups of your data. We are not liable for any data loss.

挺离谱的,但还好对于数据库有定期备份,所以并没有造成太大的损失。

反思

不论使用的是一些不知名的服务商,还是一些大厂如腾讯云,阿里云。对于服务器,还是建议对其进行定期备份。

DB-Backuper

对于数据库的备份,花了点时间,通过 Golang 实现了一个简单的数据库定时备份工具: DB-Backuper

目前仅支持 Mysql, 以及自动备份至腾讯云的对象存储。