ITValue社區

3年共享1萬億大數據市場,阿里云打算怎么做?

作者:吳寧川 / 日期:2016-01-22

2016年1月20日阿里云舉辦了云棲大會上海站活動,在活動中首次發布了阿里云的大數據品牌“數加”和首批20余款產品。同時,阿里云宣布要在3年內發現和培養5萬名數據科學家、1000名首席數據官和1000個合作伙伴,共享1萬億的大數據市場。

要打開1萬億的大數據市場,首先要有一個平臺和工具集,這就是阿里云剛推出的“數加”平臺和首批產品。據阿里云大數據事業部資深總監徐常亮介紹,這首批20余款產品涵蓋了數據采集、計算引擎、數據加工、數據分析、機器學習、數據應用等數據的全鏈條。

“阿里巴巴的命,拴在‘數加’上”,徐常亮如此強調“數加”平臺的重要性和可靠性。據悉,“數加”平臺目前承載了阿里巴巴集團和螞蟻金服集團EB級的數據計算量。也就是說“數加”平臺是阿里云近10年的數據能力積累所得,經過了阿里上萬名工程師的實戰檢驗,其中包括7次雙十一的“殘酷”考驗。

徐常亮表示:“該踩過的坑,我們都踩過了?!笔聦嵣媳敬伟l布的大部分大數據產品,都已經在阿里系的業務中經受過了反復的實踐。其中,本次推出的核心大數據計算引擎組件MaxCompute就是之前已經推出的ODPS,ODPS是阿里集團30多個事業部唯一的大數據處理平臺。

MaxCompute可在6小時內處理100PB的數據,相當于1億部高清電影。徐常亮強調MaxCompute是AWS大數據處理EMR平臺成本的1/5,本次還要再降價50%。阿里大數據計算引擎的另外兩個組件是分析型數據庫Analytic DB和流計算StreamCompute。Analytic DB可在100毫秒內完成百億量級的多維查詢;StreamCompute可日均處理萬億消息、PB級的數據以及千萬級的每秒查詢率QPS。

在計算引擎之上,“數加”平臺提供了豐富的云端數據開發套件,以及集成了包括特征工程、大規模機器學習、深度學習等在內的阿里巴巴核心算法庫。

阿里云總裁胡曉明強調,阿里云“數加”大數據平臺主要面向中小企業用戶和創業者生態。這也反應了“共享”1萬億大數據市場背后的主要推動群體,而這個群體的一個主要來源即為是阿里系現有的商戶?!白屘煜聸]有難做的生意”,阿里云的大數據平臺就是其中重要一環。

那么,有了堅實的大數據平臺和工具后,真正讓中小企業、創業者能夠用好這個平臺,還需要一批數據工程師和合作伙伴,而這才是推動1萬億大數據市場的攻堅之戰。實際上,當互聯網變成基礎設施、數據成為生產資料、計算成為公共服務的時候,所有的企業和行業并非站在同一條起跑線上——誰擁有的數據分析師和數據工程師越多,誰就越有優勢。

這其實也反應了當前大數據應用的一個普遍現狀,就是懂實際業務、數據分析和IT的復合性人才少之又少。因為這其中涉及到了幾個不同的領域,懂數據分析就需要數學專業出身,懂IT就需要計算機專業出身,懂業務就需要不同專業領域的出身,這幾個交叉起來就沒有幾個能符合要求的人才了。

在大數據人才培養方面,阿里云從2004年開始堅持舉辦每年一屆的“天池大數據大賽”,這是一個很好的培養人才以及選拔人才的渠道。截止2015年11月,阿里巴天池大數據平臺 注冊用戶數為3萬人,覆蓋全球40多個國家和地區的1500所學校,其中“90后”占比約80%。南京航空天大學的學生憑借賽決排名,可申請學校學分6分,相當于一門必修課全年的學分,此外阿里云也與全國十幾所高校展開了積極的合作。

在2015年12月的廣州云棲大會上,阿里云還宣布推出了全球大數據人才認證計劃,覆蓋專業認證、高級認證、大師認證等全階段,專業的認證也方便企業招收獲阿里云認證的人才。

隨著阿里大數據平臺的推出,“束縛大數據的技術瓶頸已經被完全打破,數據將從企業的成本中心轉變為價值中心,2016年我們將迎來大數據應用的全面落地。”徐常亮表示,希望通過“數加”平臺以及數據應用人才的培養,讓所有企業都能像阿里巴巴一樣更高效地使用大數據。

推薦閱讀