Jeff Zeahan是美国咨询公司Z Solutions Inc.的总裁,他认为,分析技术专家的工作根本与分析业务无关,他们只是销售员,或者称为“变更的仲裁者”。
2012年9月13-15日,一年一度的中国系统架构师大会(SACC)将于北京福朋喜来登酒店拉开序幕。自2009年以来,架构师大会已经成功举办了三届,受到了业界的广泛关注与赞誉,并已经成为当前国内最高技术水准的架构师盛会。
USTA从5年前就与IBM公司进行了深度的合作,后者通过名为SlamTracker的应用软件为美网提供赛事数据统计,用户还可以通过在线面板来访问其中的数据。但相比于今年的需求,过去几年的数据还是属于最基础的数据,用IBM负责体育行业项目的技术负责人John Kent的话来讲,这些数据太“表面化(surfacey)”了。
在支持有状态增量处理方面,Nova类似于数据流处理系统,但不同之处在于,它使用类似于基于磁盘处理的方式来处理海量数据。批次式增量处理对于互联网公司很适合,因为可以应对不断道来的数据,并受益于增量算法,同时不需要满足有超低延时性需求的处理。
SAP亚太及日本区商务解决方案事业部高级副总裁柯德泰和SAP中国区副总裁、商务解决方案事业部总经理曹学深向大家介绍了SAP五大市场领域之一的商务分析领域,并就记者关心的问题进行了解答。所谓商务分析,从宏观上的理解就是在正确的时机、通过任何设备,把实时的知识提供给需要信息的人。
三种社交网络每天都会产生大量的用户数据(UGC,User Generated Content),并且具有空前的规模性和群体性,吸引着无数研究者从无序的数据中发掘有价值的信息。这就像概率统计中经常举的投硬币算其正反面概率的例子,从几次的投掷结果中很难看到规律,但通过几万次的大量投掷实验……
SAP数据库及技术平台市场经理金江带来基于SAP HANA的实时分析应用在线研讨会,并进行了主题为《大数据时代的实时分析》的演讲,分享SAP强大的内存计算技术如何改变决策过程,实现现有工作流程的加速,以及大数据的实时访问。
首席信息官们总结出了5大影响他们进行分析的IT趋势。它们分别为:大数据的增长、快速处理技术、IT商品的成本下降、移动设备的普及和社交媒体的增长。
近几年,大数据日渐火爆,数据呈现非结构化趋势,据Gartner统计,数据中有80%是半结构化或非结构化数据。因此,如何应对大数据的新挑战成为数据库厂商面临的一大难题,对此IT168记者采访了Sybase中国技术总监卢东明先生,针对大数据这一热点话题进行深入探讨。
今天,通过使用列式分析基础架构,组织机构便可对“大数据”带来的焦虑置之不理,相反,还能够让“大数据”更好为企业运营服务。在列式数据库中,用户可以随时调用和分析大数据集,即使对诸如非结构化数据等各种数据类型的大数据集亦是如此。
大数据分析现在很火。只要你浏览任何IT出版物或者网站,你都能看到商务智能供应商和他们的系统集成合作伙伴推销帮助企业实施和管理大数据分析系统的产品和服务。这些广告和大数据分析的新闻以及供应商匆匆提供的案例研究可能会使你误认为大数据是很容易的事,误认为要成功部署只需要一种特别的技术。
我们要介绍一下本次旅行的交通工具:阿里云开放数据处理服务(Open Data Processing Service,简称ODPS)。ODPS是构建在大规模分布式计算系统上的海量数据处理服务,以REST API的形式支持描述性查询语言SQL的数据处理,适用于海量数据统计、数据模型、数据挖掘、数据商业智能等诸多互联网应用。
处理大数据惯常是属于商业智能(BI)的事情。抽取数据、挖掘数据,制成报表、OLAP、仪表盘、挖掘模型,作为辅助决策之用。不过在BI领域都不这么叫法,大伙儿都说海量数据,Large-scale Data。这听起来还是略显学术气,不如Big Data来的通俗——大数据。
一群活跃在网络的非法“骑士”,通过木马病毒攻击网游私人服务器,非法获利7000万元,而他们多是仅有高中、初中文化的“80后”。日前,重庆市公安局网络安全监察总队破获的这起非法入侵计算机信息系统案已向法院提起公诉。
9月20日消息,Teradata天睿公司大中华区CEO辛儿伦先生在北京主持召开了媒体见面会,详细介绍了Teradata天睿公司今年上半年相取得的成绩、在技术及服务层面近期收获的成果,以及透析了产业趋势。
随着互联网、移动互联网和物联网的发展,谁也无法否认,我们已经切实地迎来了一个海量数据的时代,数据调查公司IDC预计2011年的数据总量将达到1.8万亿GB,对这些海量数据的分析已经成为一个非常重要且紧迫的需求。
为了制定具有战略性、战术性、操作性且行之有效的经营决策,各大商业企业和政府机构力求通过商业智能手段,将有关企业、客户、市场、业务流程的原始数据转换为极具价值的信息。然而,随时数据类型和数据量的高速增长,企业和机构的数据分析和优化决策的制定面临着巨大的挑战。
随着大规模数据采集和处理技术的飞速发展,高性能计算机系统存储的数据已达到PB量级,即使采用当今最大容量(1TB量级)的磁盘,对于PB级的存储系统仍然需要数千块磁盘。
如果使用谷歌、雅虎或者微软的Bing,将会得到大量的结果。而使用了IBM的分析工具之后,搜索结果能从上百万降低到几千,从几百降低到25。