关于重要数据备份的一些调研

保存重要数据是一件很麻烦的事情,尤其是那些一年都不用一次,但是需要用到的时候却需要保证他的完整性。从我开始玩电脑到现在因为储存设备损坏丢过不少数据,不太重要但属于回忆的照片更是不在少数,所以我对储存很是看重。现在我的重要数据根据重要性拷贝多份存放在数个不同的设备和云端上,并且不定期交叉校验,虽然数据量不大(约 500G),但定期校验也是个烦心事。

现在云储存已经相当成熟了,我在考虑要不要把这些数据全部云端化,大型云服务商的储存可靠性至少比我在本地搞各种可靠性低下的设备进行冗余储存高的多了,现在初步策略是 OneDrive、GCS、Azure Blob、百度云各存一份。备份的 Workflow 大概就是 rclone 先把数据批量 sync 去几个云服务上,然后百度盘因为没 SDK,rclone 并不支持,所以 rclone sync 一份加密副本到本地,然后整个副本扔上百度盘。

百度云是白送的 2T,虽然各方面是个弟弟,不过加密后放上去作为 cache 使用还是比较可以的,毕竟不花钱的东西嘛。然后是 OneDrive,Office365 附赠的 1T,划算的很,平时用来存文档和笔记挺好的,但是因为直接可以在资源管理器访问,有手滑删除的风险,OneDrive 依然只能作为一个 cache 使用,不过微软并没有窥探用户数据的前科和理由,因此可以储存明文文件。

最后是 GCS Coldline + Azure Blob Archive,有 Google 和微软做后台,GCS/Azure 在技术上并不怎么需要担忧,有前面两层 cache 保障,以及 两大科技巨头的技术水平,我相信可靠性肯定比我用几个储存设备都存一份高,价格上,Azure 是的存档储存是最便宜的,最便宜的储存方式可以做到 0.02USD/G/月,AWS 好像是 0.04USD/G/月,没仔细研究,虽然 AWS 占有率最高,但是我觉得界面很难看,不想用,然后 GCS 是最贵的,0.07USD/G/月。

值得注意的是,虽然 Azure 的多数据中心冗余储存最便宜只要 0.04USD/G/月,但是从一个数据中心复制数据到另一个数据中心的流量费你是要给的,而且还不便宜,我传了 100G 数据上去测试,被扣了约 2.5USD,不过还好初次使用有 200 刀赠送费用用于测试,综前所述,Azure 我选择了最便宜的单数据中心储存,反正还有 GCS/OneDrive/百度盘做备胎。

现在 GCS 和 Azure 已经存了 100G 左右的数据做测试,现在 Azure 每天会花 0.01USD 的样子,但是按照费率计算的话应该每天花费是 0.06USD 才对,GCS 也还没见账单上有费用,不知道是每月统计还是费用太小被约掉了,这一点得先观望一阵看看,日后有需要继续更新。


6 月 25 日更新:

经过一个多月的试用,月均储存量是 89.5GB,Azure Blob Archive 的月均费用是 0.26USD,GCS Coldline 是 0.36USD,费用上 Azure 的确是便宜一点,但是有一点问题是 Azure 的操作面板太过难用了,主要是各种功能分割在不同的细分页面里,要调整一个设置要点好几次,而 GCP 选项摆放首先就比较集中,其次因为整个面部是 ng 写的 sap,几乎不需要重新加载,体验相比 Azure 好很多,贵那么一点也无所谓了。

于是最终使用一个自写的小工具把部分数据进行了无损压缩,把体积缩减了大概一半,然后在 GCS 和 使用镁光 SLC 的 128G U 盘中各存一份,完事。