分布式存储只能是“小而美”吗?
2023-02-27 编辑:刘军
在医疗行业,PACS系统的平均阅片速度是每秒20~50幅图,而上海市胸科医院可以做到每秒调用300幅图。为上海市胸科医院PACS系统提供数据存储支撑的上海霄云信息科技有限公司(以下简称“霄云科技”)创始人兼CEO李小勇博士表示,这对于PACS应用来说是一次重大的飞跃,如同铁路行业从绿皮车迈入高铁时代。
上海霄云信息科技有限公司创始人兼CEO李小勇博士
像上海市胸科医院这样的大型三甲医院,为什么会在PACS这样关键的业务系统中选择霄云科技这样一个创业公司的分布式存储产品?这背后的答案确实令人好奇。
行业突破没有“假如”
假如PACS系统不存在应用痛点,上海市胸科医院当初也不会冒着风险尝试选择一家创业公司的产品。假如霄云科技的分布式存储产品不能在性能、稳定性、数据迁移等方面解决医院的应用痛点,也不会有后来上海市胸科医院两次扩容霄云科技的分布式存储,并彻底替换原有国外高端存储系统的结果。
生活中哪有那么多的假如?实际上,是新兴的分布式存储能够更好地解决海量数据存储面临的挑战。而霄云科技凭借在分布式存储领域独树一帜的创新和高端品质,以医疗行业为切入,完成了一次破冰之旅。据李小勇介绍,在上海大型三甲医院PACS系统存储中,霄云科技产品的占比快速增长,已经接近并超越国内外其他主流的存储厂商其实不仅仅是上海,霄云科技的分布式存储在北京、山东、江苏、浙江、广东等地的多家大型医院都有成功的部署与应用。
找准行业应用的突破口,是霄云科技脱颖而出的重要原因,但究其根本,存储还是要以核心技术、性能指标说话,而这正是霄云科技的深厚底蕴所在。
业内一般都有这样的共识:做发动机需要30年的积累,开发操作系统、数据库需要20年,而做存储至少要10年起步。作为一项“根技术”,存储是一个技术门槛非常高,需要长期投入,而且会面临很大市场不确定性的行业。因此对涉足于此的公司来说,存在一定的风险性。但如果能够攻艰克难,一旦确立了属于公司自己的技术和市场壁垒,却可以”长治久安“,国外很多主流存储厂商能够屹立市场几十年就是最好的例证。
风险与机遇并存,这可能正是存储市场的魅力所在。而对于市场的后来者说,在惯常的赛道上实现追赶并超越的难度无疑会更大。作为一条新兴的赛道,分布式存储自诞生之初,关于它能否全面替代SAN就成了讨论的焦点。今天,除了要求极致可靠性与低延迟的某些核心数据库场景,分布式存储还不能取代传统SAN以外,其他应用场景分布式存储都能比较好地覆盖。“正是像分布式存储这样的技术变革,给了创业公司机会。”李小勇分析说,“分布式存储是软件定义存储,采用通用的服务器,所以硬件方面的壁垒消除了,竞争的焦点集中在软件上。而在软件定义分布式技术上,传统存储厂商因新技术与现有产品冲突而投入有限,目前在分布式存储这个新方向上,活跃的是像霄云科技这样没有历史负担、能够全身心投入并逐渐积累起技术优势的创新企业。”
在分布式存储这条道路上,霄云科技也曾经历过诸多曲折,按李小勇的话说,就是踩过了无数的坑,一项关键技术第一次就能成功的概率极低,往往要失败三次以上,到第四次时拿出的方案才是可行的。从2010年开始分布式存储项目的研发到2019年实现产品的商业销售,真的是十年磨一剑,如今在市场上声名鹊起的霄云科技,其自研分布式存储产品——碧海分布式存储系统(BOSS)已经能够在医疗、金融、教育等领域独挡一面。
霄云科技的碧海分布式存储系统(BOSS)具有五大核心技术优势:第一,性能佳,其IOPS性能达到开源存储和国外高端存储的3倍以上;第二,海量小文件聚合优化能力强,能够实现百亿级文件性能衰减小于5%,远优于传统高端存储和Ceph开源存储;第三,从底层打通了对文件、对象等不同存储类型数据的互通访问,确保性能无损耗;第四,自适应流控技术可以根据系统I/O负载情况,自适应调整修复速率,不影响业务性能;第五,打造了高性能的专用数据迁移工具,业内常规迁移400TB数据需要2年时间,霄云科技的迁移工具可以将周期缩短至2~3个月。
有些人猜测,霄云科技的分布式存储之所以性能高,主要是因为算法好。李小勇揭秘说,这其实是全局综合优化的结果,从最基础的架构搭建,到产品的每一个细枝末节,都精益求精、持续优化,才确立了公司在分布式存储上的高技术壁垒。
高端存储难在哪?
建立技术壁垒是霄云科技的生存之道。顺理成章,霄云科技将目光放在了打造高端存储上,这是霄云科技的发展之道。
不同于其他IT软硬件设备,存储关系到企业战略资产——数据是否可用,所以对于存储产品来说,安全稳定才是第一位,成本等则是第二位的。谈到高端存储的定位,李小勇解释说,高端其实是一个综合性的概念,指的是存储产品具有全面的高品质,就像苹果手机一样,从设计、功能、操作到原材料,每个环节都是最优秀的。霄云科技对其分布式存储的要求也是高性能,稳定可靠,软件设计人性化,使用高效便利。“用户的需求是第一位的。从产品的设计开发、安装部署直到售后服务,每一个环节我们坚持最高标准。比如在产品易用性上,我们致力于做到用户不看操作指南也能上手操作。”李小勇表示,“高端存储对于我们来说既是目标,也是战略。我们不想走单纯追求性价比的老路,陷入价格战的泥潭,那是没有前途的。”
以前,IT的很多核心技术都掌握在国外厂商手中。如今,国内像霄云科技这样能够在某一细分领域取得突破的成功例子越来越多。信通院发布的首个《分布式存储发展白皮书》显示,2021年中国分布式存储产业规模达到178亿元,年增长率高达44%,已逐步形成规模,预计未来3年仍将保持40%以上的年增长。李小勇认为,虽然技术门槛很高,但是分布式存储的大市场为霄云科技提供了广阔的施展空间,只要专注深耕就能扎根立足。
现在回忆起十年前的那段经历,李小勇仍十分感慨:“当时的我们虽然充满技术情怀与热忱,但困难重重。感觉分布式存储就像是天上的星星,而我们则是一只小船,即使河流的水面再高,也够不到星星,整个研发过程像是在翻越珠穆朗玛峰。但我们并没有放弃,而是在不断的点滴积累之上,终于在2015年开发出第一个产品原型。积累到一定程度,那层窗户纸忽然一下就捅破了。”
自研没有回头路
有勇气、有坚守、更有理想的霄云科技,自然会引起资本市场的持续关注。截至目前,霄云科技已经完成了三轮融资,其中一家投资人元禾重元通常只会投即将上市的企业,而霄云科技是唯一一家在发展初期就获其投资的企业。
“有自研,为什么还要投开源?”这是让元禾重元最终选择霄云科技的重要原因。霄云科技没有走大多数人认为的康庄大道——开源,而是义无反顾地踏上充满荆棘的自研之路。几十万行代码,高性能、高稳定性的碧海分布式存储系统(BOSS),在医疗等行业迅速“出圈”,证明了霄云科技最初的坚守是正确的。
自研始终是霄云科技前进的动力与航标。“我们刚开始与行业用户接触时,别人一听说我们是完全自研的产品,而且性能比开源存储还高,都会投来质疑的目光。”李小勇回忆说,“但是经过产品实测,当用户看到我们确实能够做到别的厂商做不到的,有效消除其应用痛点,所有的疑虑和担心也就烟消云散了。”
霄云科技目前在众人眼中是一家“小而美”的创新企业,现阶段最大的优势可能就是技术,其产品在性能上远超友商。当前,中国市场上的分布式存储厂商虽多,但绝大多数都是基于开源进行开发的。而在李小勇看来,基于别人的开源做自己的To B产品是很难有竞争力的,其中同质化就是难以逾越的鸿沟。别人有的,你也有,无法做出差异化,无奈只能打价格战。选择开源,虽然可以打个短频快,迅速见到短期效益,但是当企业未来走向存储的更深层次,无论是对性能进行优化,还是提升稳定性、可用性,难度会越来越大。而霄云科技从自研起步,前期磨炼时间虽长,要踩的坑虽多,但是在产品稳定并确立了差异化的竞争优势之后,未来的发展就属于“降维打击”,会取得事半功倍的效果。
相对于整个存储市场来说,分布式存储可能只是一个“小而美”的细分市场,但从其自身的容量、未来发展空间,以及更好地满足客户对海量数据存储的需求来看,这确是一个值得持续投入的大市场。相对于千行百业来说,医疗可能是一个“小而美”的行业,但正是它对海量数据存储的高要求加速了分布式存储的替代与爆发,为霄云科技提供了生存和发展的机遇与土壤。相对于许多成名已久的存储大厂来说,霄云科技当前所展现出的是其“小而美”的特色,但是谁又能断言,今天的小苗不能长成未来的参天大树呢?在分布式存储的蓝海中,存在更多的可能性。