技术超前40年颠覆性大数据仓库ArrayDB;美《中华商报》载文推荐硅谷大型基础软件华人创业团队

【IT时代网、IT时代周刊综合】在旧金山硅谷附近,很多名不见传的创业公司却做着改写历史和改变世界的工作。2月26日,中华商报报社在北加州的报馆办公室接待采访了一家这样的公司。公司的团队成员全部都是华人,在美国的大公司积累了多年的宝贵经验。华人在美国公司工作,大都是勤恳能干,积极学习和积累大量知识。在我们接触采访过的创业公司中,他们是唯一在大型基础软件领域展开创业的华人团队。他们现在开发的产品是针对大数据的大型数据仓库,属于基础设施软件。此类软件系统需要大量的专业知识和经验积累,而且系统非常复杂。开发高质量的数据仓库软件有相当的门槛高度,非是一般创业团队能胜任。这家中文名称为速瑞(Exeray)的公司,是一家于2014年初在硅谷成立,专注于创新型高速云端大数据仓库研发的创业公司。创始团队成员来自于数据库及大数据行业的领头公司, 如Oracle, Yahoo, SAP,长期从事SQL及NoSQL数据库的研发工作。ArrayDB是他们开发出的首款核心软件产品。

革新性算法改变了沿用40年的数据库算法

近年来,随着互联网,电子商务,社交,金融,政务及无线终端的迅速普及,数据量呈爆发性增长,数据库逐步成为了大数据应用的瓶颈。面对井喷式发展的大数据朝阳行业,速瑞公司的核心产品ArrayDB采用了创新型的阵列算法,将数据库的写入及查询的速度提高了20到50 倍,同时可以节省大量内存,可支持各种硬件平台。速瑞公司团队创始成员Jonathan Yue(岳战军)拥有芝加哥伊利诺大学计算机博士学位及超过20 年的大数据及数据库开发和应用经验。之前服务于雅虎及美国银行,十年前就曾创建过大型网络云存储系统。Jonathan 在谈到他们为什么要做这个项目时说, “我们在美国大公司做技术工作,遇到的数据问题越来越严重。 首先是数据量越来越大,公司用了近3000台Web服务器,700台数据库服务器。没过多久,服务器增加到上万台设备。面对大量的数据,处理时间越来越长,以前很容易完成的数据任务,现在要花几十个小时,甚至几天时间。而大多情况下,瓶颈就在于数据库。

面对大量的数据,数据库越发吃力,数据调用查询速度跟不上。如果我们想办法能让数据库的性能提高,将具有非常大的商业价值。”Jonathan 于是放弃雅虎公司优厚的待遇,于2013年4月毅然辞职,潜心钻研数据库的快速存储和查询算法。花了近一年的时间,终于研发出了一套很先进的算法。但没过多久,他又找到一套更先进的算法。于是对先前的算法又进行改写,重新开发软件。“现在我们采用的技术就是这个最新的算法,传统数据库用的数据查询方法是40年前发明的算法,现在我们把这个算法整整向前跳跃了40年。并且它可以支持更广泛的应用场景。”Jonathan 跟我们解释道。

后来Kevin 和James加入了速瑞公司一同创业发展,为公司带来了丰厚的经验和智慧。Kevin Wang 拥有卡内基梅隆大学信息管理硕士及在Oracle多年的数据库开发经验。 James Wang拥有电子工程博士学位及美国西北大学Kellogg MBA学位,SAP超过8年以及总共超过22年的工作经验。  2014年硅谷高创会上,速瑞公司的大数据数据库项目在100多支参会企业中脱颖而出,并成为前25名唯一获得大奖的企业软件类公司。速瑞公司的ArrayDB数据库产品于2014年11月正式发布。现在公司有六个全职人员,八个兼职人员。团队成员都信心十足,脚踏实地工作。

据了解,ArrayDB主要使用了独有的创新算法,而不再使用传统的平衡树算法,解决了大数据应用中的数据关联查询的瓶颈问题,并且将所需内存降低到其它数据库的20%左右,从而不但实现了高速运算,更可以大大降低大数据应用的硬件成本。ArrayDB着重于企业级市场,SQL及NoSQL并存的应用场景,并为此开发出接口支持目前市场上流行的其它数据库,使得企业用户整合企业应用,结构性数据与海量非结构性大数据成为可能。并因为高速及低硬件资源,在最大程度上降低了企业的实施成本。目前为主要发展的客户包括政府、电信、金融、电力、互联网和医药等拥有海量业务数据的行业提供大数据解决方案,也为大数据行业内做数据分析,数据智能及报表产品提供数据库及数据仓库。

专注于大数据及云端应用

ArrayDB与现在市面上主流的数据库最大区别在于更专注于企业级市场,并为此开发出创新的查询索引技术,该技术比目前主流数据库沿用了40年的平衡树索引理论上可以提高速度50倍,并且节省内存在75%左右。ArrayDB可以在不同的硬件环境下使用,不但可以提高磁盘存贮数据库的速度, 也可以提高SSD内存数据库的速度。

虽然ArrayDB的第一个产品是关系型数据仓库,但速瑞公司也看到了文本型数据库市场的快速发展及巨大的市场潜力,目前市场上有很多优秀的NoSQL产品,例如Redis, MongoDB, Cassandra, HBase等,每个产品都有其特性,但都有其明显的缺陷,特别是速度上不能满足实时企业级应用。因此速瑞公司将阵列索引专利应用做成插件, 支持这些数据库,使得用户使用大数据应用时可以通过这些插件提高数据库的速度。

快速服务市场与合作伙伴

自从ArrayDB于2014年11月发布产品后,受到了市场的测试、验证,特别是行业内的很多专家,包括图灵奖得主Donald Knuth都给与了指导。通过与市场份额占7成的数据库主流产品比较测试,目前版本的ArrayDB的数据写入及查询速度可以提高20倍以上,所需内存为25%左右。目前两个从事数据库及大数据平台的合作伙伴通过全面的比较测试,验证了阵列算法专利技术的先进性及可行性。

速瑞公司目前积极发展大数据平台的合作伙伴,提供整合了关系型数据库与文本型数据库的解决方案。随着数据的海量增长,传统数据库明显有很多不适合的场景和技术局限性,主要局限性表现在数据模型僵硬、可扩展性差、处理海量数据时的性能瓶颈、缺乏处理半结构和非结构化数据的能力上。在最近几年,随着大量非结构化化与半结构化数据进入企业,关系型数据库开始显现了越来越多的局限性和不足。 而市场上现有的文本型数据库缺乏事务和SQL支持、与Hadoop系统的整合不紧密等,对企业客户现有的数据库并不友好,包括在开发人员技能的延续性、和现有的应用程序对接等方面。因此速瑞公司将阵列索引专利应用做成插件,整合、支持这些数据库,使得用户使用大数据应用时可以通过这些插件提高数据库的速度,实现大数据应用的平稳实施。

大数据平台与应用的核心引擎在于数据库,解决了数据库问题,就可以很大程度上提高大数据平台的性能。而数据库产品的开发不但需要大量的数据库方面的资深开发人员,更需要一个好的算法来革新引擎的性能及灵活性。 ArrayDB的核心价值在于阵列算法可以将数据库的速度带来数量级的提高,为克服大数据的难题打下基础。

最近加入速瑞公司的清华大学博士赵会超先生说:”我觉得速瑞公司的技术潜力非常巨大,在解决很多跟大数据有关的难题上都会带来相当大的突破。公司不但在技术革新上起到标杆性的作用,而且在市场开发运营方面也富有经验。我对速瑞公司充满信心,也充满希望。”

目前速锐公司在快速招聘人才,并且在积极与各个早期投资者洽谈,进行A轮融资。公司的网站是www.exeray.com。

来源:IT时代网、IT时代周刊

IT时代网(关注微信公众号ITtime2000,定时推送,互动有福利惊喜)所有原创文章版权所有,未经授权,转载必究。
创客100创投基金成立于2015年,直通硅谷,专注于TMT领域早期项目投资。LP均来自政府、互联网IT、传媒知名企业和个人。创客100创投基金对IT、通信、互联网、IP等有着自己独特眼光和丰富的资源。决策快、投资快是创客100基金最显著的特点。

相关文章
技术超前40年颠覆性大数据仓库ArrayDB;美《中华商报》载文推荐硅谷大型基础软件华人创业团队

精彩评论