Hadoop的创造者Doug Cutting在不久的将来将解开大数据的技术( 二 )


不过,Cutting表示,为了简化处理过程,还有一些限制需要解决,Cloudera计划改进从AWS S3和其他云存储向Hadoop数据处理引擎提供数据的支持 。
“我们需要对Hadoop做一些调整,使它能够更好地在云中工作 。我们需要把存储,比如Amazon的S3,和HDFS (Hadoop分布式文件系统)一起作为一等公民来对待,这样人们就可以动态地启动集群 。
而且云中的集群更有可能向上或向下旋转,Cutting说Cloudera也想要改善启动时间 。
Cutting想要解决的另一个问题是使Hadoop集群从一个云平台转移到另一个云平台变得更容易,而cut对当前的云锁定状态感到沮丧 。
“我们认为,我们可以提供一些真正的价值,让人们在云提供商之间的可移植性 。现在,如果你开始在云中开发你的应用程序,你很快就会被锁定在一个云供应商那里 。”
随着Hadoop的发布,Cutting说Cloudera正在构建“一个层,让人们决定工作负载是在本地进行,还是进入亚马逊、谷歌、微软或其他云提供商 。”
他表示,目前Cloudera的董事在一定程度上可以使用这一功能,“我们将继续推进这一功能,使其更加无缝” 。
进一步展望分布式系统的未来,Cutting说需要一种能够同时参考实时和历史数据的架构来帮助做出实时决策 。
“现在有各种各样的方法,但都有缺陷 。我想我们很快就能解决这个问题 。”
最终,他相信Hadoop的遗产将在使大数据成为规范、开源软件成为软件的实际选择以及将关系数据库打入小众市场方面发挥作用 。
【Hadoop的创造者Doug Cutting在不久的将来将解开大数据的技术】“我们讨论的不是大数据,而是数据系统 。开放源代码栈将不再是一个新事物,它将是现有的和人们操作的方式 。关系系统将是与cobol相当的系统,并且是非常重要的遗产 。10年后,我们将取得长足的进步 。”