我们正处于大数据和数字化转型的时代,数据无处不在,运用数据驱动的思想和策略在实践中逐渐成为共识,数据的价值已在科学研究和工商业的不同领域得到充分展现。
2018年,国内有一个比较热的名词叫数字经济,我们经常会把它加一个前置叫“大数据驱动的数字经济”。从2012年提出开始,大数据逐渐从科学端、基础端一直延伸到技术端,现在又开始扩展到产业端,甚至开始影响到更全面的经济发展,这是今年大数据比较重要的特别或者变化。
无论是今年年初的福建数字峰会,还是一系列的数字经济相关活动,都在紧密围绕大数据产业和大数据推动下的数字经济所展开。大数据已经从原先客户或者用户创新型的需求变为实用型的需求,需要真正为业务带来提升,发掘数据价值,真正发挥效益。
12月18日雷锋网与中科院计算所科研处副处长王元卓博士,以及中科曙光大数据首席科学家宋怀明博士,就中科曙光大数据业务在2018年及未来的发展状况进行了交流对话。
行业化与产业化
人们传统印象中的大数据,通常都是“大数据”这个名词和概念本身。其实,想让大数据真正发挥作用,一定要跟各行各业紧密结合,且一方面要与行业数据紧密结合,一方面还要与行业的领域知识紧密结合,各个行业的特点也会对大数据的软件、硬件产生一系列的定制化要求。
雷锋网了解到,在今年的CNCC(中国计算机大会)上,中科院计算所前所长、计算机学会名誉理事长和大数据专家委创始主任李国杰院士,举了一个令大家印象深刻的例子:根据不完全统计,目前狭义的大数据产业,大数据相关软硬件的全国年产值是237亿元人民币。
“这个产值大吗?要知道现在女性面膜的年产值都有240亿元。”王元卓对这个案例也有着很深的感触,“喊了很多年的大数据,无论是技术创新还是行业创新,各方面也都做了很多推动性的工作,但是大数据产业确实才刚刚兴起,刚刚明确它与传统存储、计算的区别。”
在大数据发展的早期,大家都在谈技术,学术界或创新技术企业常提出架构上的创新,政府引导在这一初期阶段确实起到了非常重要的奠基作用。而近两年大家已经开始不再关注于具体技术了,切实通过大数据发掘价值、提升业务成了最核心的需求,这也是真正到了应用落地、精耕细作阶段的必然趋势。
“大数据的一个明显特点是行业化,现在已经不能概括的只讲‘我是做大数据的’,而是要讲具体做什么行业的大数据,像生物医疗大数据可能就与公共安全大数据有本质区别。”王元卓讲到,“另外以往信息化的特点以方法、算法或者技术上驱动为主,现在则呈现数据智能化的趋势,算法或方法这一块相对来说重要性不是那么突出了。人们要从海量数据里挖掘相关性,以数据作为很多业务重要的依据,提升业务或政府决策水平。”
大数据和智慧城市
2018年,大数据和智慧城市结合得非常紧密,许多城市都在相继建设城市数据中心。雷锋网观察到,这些数据中心主要集中在民政和警务两个方向,并且在这一结合过程中,逐渐形成了一个数据湖相关联盟,要把数据湖作为一个新的城市基础设施来推动。
对此宋怀明表示,在很多智慧城市案例中,民政和警务这两个方面确实是先行的。中科曙光在2009年便提出了城市云的概念,到现在已经将近10个年头,期间在全国共建设了40多个云计算中心,支撑超过了2000个各种应用。
“在建设过程中,主要围绕民生、产业经济和城市管理三大块业务,要紧密结合自身特点与当地政府需求。”宋怀明为我们分析了中科曙光的策略,“民生方面,核心是让老百姓的生活更便利;产业经济方面,为中小企业和当地经济提供服务或支撑;城市管理方面,即包括刚才提到的警务和综合治理等与社会治理相关的业务。”
而提到数据湖,宋怀明称其“其实是所有大数据应用的第一步”,数据湖的核心思想是让数据互联互通,能够更好地共享和交换,并在此基础上进行数据融合和数据治理。
他表示,中科曙光没有专门提出数据湖的概念,但在建设城市云数据中心时最核心的业务正是数据的共享、交换及融合。在此基础上,中科曙光针对原先的业务痛点做了性能和业务方面的优化,因为数据融合必然带来业务的融合。此外还通过挖掘到的数据价值对业务进行提升,这在不同行业或不同用户处会有不同的体现。
脱胎而出的新领域
在即将过去的2018年,中科曙光在大数据、高性能计算等领域稳步前进。对于即将到来的2019年,宋怀明和王元卓表示,眼下大数据在科研领域中已经不是依托于计算机学科交叉领域的新生事物,而是变得越来越实,正逐渐脱胎出一个相对边缘清晰的领域,形成它自己全面的外延和内核,这是大数据未来发展越来越具有独特发展领域和空间的特点。
首先,他们认为2019年会出现更多大数据处理的专业硬件,如大数据E级机、大数据分析专用芯片或大数据专用板卡等等,越来越多软件层面的东西会通过专业硬件来加速,大数据产业会逐渐形成软硬一体的规模,就像现在买服务器一样。
其次,2019年会有越来越多面向行业知识的知识库产品。他们指出,类似机器人把脉看病、股市预测等应用,并不是有了数据就可以实现,还要有大量行业知识,尤其是能让计算机理解和计算的知识。让这些知识作为字典去辅助后续的大数据应用,逐渐沉淀并且形成标准化知识体系,大数据与行业的结合会更加紧密。
第三,他们表示大数据的从业门槛会越来越高。以往有很多大数据行业的企业用人,岗位需求量非常大,工资薪酬很高,引得大家纷纷临时转行来做大数据和人工智能相关的工作。在这样的状况下,企业很难招到合适的从业者。据统计,这些从业者中甚至有超过50%的人,上一份工作不是做大数据的。
王元卓补充道,随着大数据行业的进一步发展,未来会有越来越多大数据专业人才进入市场,大数据的从业门槛会越来越高,“想来就来”的局面将很快终结,整个行业的人才链将进入良性发展的轨道。