副本放置&Copyset Replication

分布式存储系统 中说明了,在一定情况下,copyset的数量不是越多越好,在恢复时间确定的情况下,找到合适的copyset的数量可以降低数据丢失的概率。

阅读更多

数据存储中Zipf分布

最近团队在对存储系统做一些性能测试,期间遇到了不少问题,测试过程中得出的结果也没有很好的数据支撑,所以尝试了非常多的方法来对性能问题进行定位。

小王童鞋是挺厉害的,使用了非常多的工具进行性能问题定位,包括iosnoop对IO请求进行跟踪、iostat进行磁盘状态记录、go-pprof从runtime层面收集性能profile数据、使用go-torch对profile生成直观的火焰图、使用trace2heatmap对延迟数据生产热力图 等等。

阅读更多

硬盘性能简测

各种存储系统,数据库、文件系统,在性能上无不都在与磁盘做斗争。希望能够尽量发挥系统有限的资源,提供最大化的性能。其中涉及到的技术包括

  • page cache
  • write buffer
  • raid卡缓存

阅读更多

大规模存储物理架构

大规模对象存储究竟应该采用什么样子的存储物理架构?如何规划物理机架部署?如何进行网络部署?通过学习一些经典系统如GFS、HDFS,并且结合自身在这方面的经验和需求进行了一些总结。

考虑的因素包括

  • 故障域
  • 恢复域

阅读更多

分布式存储系统可靠性-设计模式

从上文分布式存储系统可靠性-系统估算示例 中详细分析了系统可靠性量化的估算手段,并且给出了示例代码,代码的主要输入参数为如下所示。

1
2
3
4
5
6
LoseRate(S, N, RepNum, T, AFR)
N:系统中磁盘的数量(包括磁盘的容量信息)
S:系统Copyset的数量
RepNum:存储的备份数量
T:坏盘情况下的恢复时间
AFR:磁盘的年度故障率

阅读更多

分布式存储系统可靠性-系统估算示例

1 估算示例

上文分布式存储系统可靠性-如何估算中,我们提供了一些基本的估算的方法。接下来我们提供一个具体的估算的示例子。

阅读更多

分布式存储系统可靠性-如何估算

1. 存储系统的可靠性

常规情况下,我们一般使用多幅本技术来提高存储系统的可靠性,不论是结构化数据库存储(典型mysql)、文档型Nosql数据库存储(mongodb)或者是常规的blob存储系统(GFS、Hadoop)等。

阅读更多

网易云对象存储服务发布**“直传加速服务”**

1. 价值创造者的烦恼

打造一款互联网产品时,我们都会非常关注用户体验,当下短视频、线上KTV、线上多媒体互动 等场景越来越多。对于此类产品,我们非常依赖价值创造者,比如美女主播,小视屏制作者,音乐制作人等等。如何为你的价值提供者创造更好的用户体验,这次我们从价值提供者生产并传播价值(上传数据)的用户体验说一说。

阅读更多

Split Data With Salt

前一阵子团队来一新人,分享了其所从事物联网相关领域的事件经验。其主要核心逻辑是收集处理来自海量的物联网设备上报的一些信息。比如大楼电路、温度、湿度等一些周期性的上报信息,记录这些信息的方式为使用HBase。其中一点是使用Salt 来避免数据分布的不均匀特性。

|  EntityID | TimeStamp  | Temp | Current| humidity|

阅读更多

“网易云存储服务”从0到1发展之路

1. 从0诞生

2012年云计算在业界已经风起云涌,云计算为企业带来的价值为世界所认同,按需提供的计算、存储、网络等底层IAAS基础设施、以及丰富的PaaS和SaaS服务为IT公司产品的开发、运营以及快速可持续发展提供了强有力的支撑。云计算犹如肥沃的土壤,让产品和idea犹如雨后春笋般在晴朗的空气和阳光中快速成长,势如破竹。

阅读更多