6年半以前,我回到中国,重新加入我近19年前离开的公司:Sybase中国,负责在中国地区推动列式数据库产品Sybase IQ。从去年开始角色有些转换,从列式数据库转而关注SAP的数据库战略,同时关注在“极端OLTP”场景下的数据库技术发展方向。现在似乎是一个回顾一下列式数据库这个技术过去近10年来的发展过程,并展望一下未来的发展方向的时候了。
如果你是一个资深的SQL Server DBA,那么关于它的每一个功能你应该都会接触过至少一次。事实上,SQL Server发展到现在,它的根基并没有变,一个大树上长出纷繁的枝叶。今天的这篇文章,我将在这些“枝叶”中挑选几个我认为值得关注的,来仔细聊一聊。列存储索引(Columnstore Indexes)和Hekaton内存数据库是新版SQL Server中很重要的两个功能,它们都是跨时代的技术革新,能够大大提升SQL Server数据库的性能。
随着大数据时代的到来,日益增长的数据给数据库带来了越来越大的压力。据统计现在我们每天大概将会产生2.5 quintillion bytes的数据,大数据时代的数据查询效率引起了越来越多的关注。SQL Server 2012新增加了列存储索引,微软称这是其独有的特性,可以为数据仓库查询建立只读索引……
在去年发表的评测文章《列式数据库评测最终篇——Ingres VectorWise》中,我们介绍了列存储数据库Ingres VectorWise的功能特点,同时采用tpc-h scala=10数据评估它的性能。时隔一年,这种数据库又取得了哪些进展?下面为读者们揭开答案。
这十几年的发展下来,数据库市场似乎是IT行业中的一个独特的子行业,DBA像中医一样,以经验谋生。微调、改进被认为是数据库行业的突破、创新,一个索引优化技术、内存Cache优化技术,甚至像物化视图这样的文字游戏也被拿出来当作突破性技术……
7月26日,2012 SAP中国商业同略会今日在北京国家会议中心开幕。今年的大会以“蕴韬略 促转发 共发展”为主题,探讨了如何利用创新的信息化思维来帮助企业进行可持续的发展之路。自两年前SAP收购Sybase是开始,这两家技术型的公司融合之路就已经开始,Sybase的数据库开始更加从容的支持SAP的上层应用。
KingbaseDBCloud所具有的分布式技术能力,可以高效管理上百个存储执行节点和PB级海量数据,强大的并行处理能力,保证其整体能和数据容量随着存储执行节点的递增线性增长,确保用户可根据实际需要进行容量和性能的扩展。
,现在谈大数据时代,很多管理者或者业务负责人怎么认识到数据的重要性,还在一个转型的过度中。大数据未来对于DBA一个机会。我们必须理顺团队的发展,而选择在高速成长的企业是我们不二之选。
众所周知,传统基于LAMP架构的网站面临的一个难题是:如何实现从MySQL到异构数据系统的数据同步?赶集网在实践过程中开发一套基于Tungsten Replicator的通用的CDC解决方案。
管理好开发团队本身是一件非常有挑战的事情。由于文化上存在差异、语言上存在障碍,沟通方式也会有所不同,管理者会面临着项目失控的危险。这里,我为大家分享当今最成功的项目管理技巧,来帮助分布式软件开发团队保驾护航,成功管理好项目。
近年来,互联网技术的飞快发展,以及物联网、云计算等新兴领域的应用与拓展,使得企业系统里的数据正在呈海量势头增长。IDC预测,到2011年将会产生1800艾字节(Exabyte,也称EB)新数据,每隔一年半,任何企业的数据将会翻一番,而且在这些新的数据中大概95%为非结构化数据。
随着海量数据的爆炸增长,存储空间开销以及存储性能瓶颈成为制约数据解决方案的最关键因素。神舟通用为与会者介绍了神通KSTORE海量数据管理系统,是如何使用高性能压缩数据引擎,极大缩减数据存储容量,并利用智能索引技术进一步降低查询扫描的I/O带宽占用,提供支持OLTP应用的海量数据仓库。”
毫无疑问,大数据已经站在了数据存储的风口浪尖。根据IDC预测,到2020年,电子数据存储量将在2009年的基础上增加44倍,达到35万亿GB。数据显示,截止到2010年,这个数字已经达到了120万PB,或1.2ZB。
IBM发布新一代大型机zEnterprise时,随同附带了智能分析优化器(Smart Analytics Optimizer,SAO),它是一个分析工作负载加速装置,IBM将之称为列式设备