© 1999-2048 dssz.net 粤ICP备11031372号
[讲义] 强琦:大数据开发平台
说明: 强琦介绍,*集团与百度或者其他公司最大的区别是拥有更多结构化的数据,而且业务线非常多。目前该集在梳理内部的结构化数据,其中很少一部分的数据表量已达150万个,如果加上分库和分表,数量达到400多万个。目前已经结构化的数据总量是80PB,数据量月增将近3PB。*建设集团统一数据平台的进展情况。关于如何解决“找得到”数据的问题,*建设了一个很大数据管理系统,在系统中可以找到整个集团的所有数据。<admin> 在 上传 | 大小:1048576