ITValue社區

阿里巴巴CTO王堅:只有跑在互聯網和云計算上的才是大數據

作者:胡敏 ITValue / 日期:2015-03-06

互聯網最初是一個工具,后來變成了一個國家經濟社會發展的基礎設施,阿里巴巴的成功就緣自于相信互聯網會成為這樣的基礎設施。


但有兩件事情是今天很多人沒有意識到的:


其一是很多人會脫離互聯網講大數據,以為企業內部的大量數據就是大數據;其實這個觀點是錯的,只有在互聯網上、與互聯網連著的數據才是真正意義上的大數據。如果純粹從量的角度看,歐洲做基本物理學研究的地方可能是世界上數據最多的一個地方,但很少人會說那個地方的數據是大數據,因為其數據不在互聯網上。今天所謂的大數據時代,也是因為有了互聯網,才使得所有數據獲得了重新定義價值的時候。


當互聯網發展起來的時候,一定會沉淀下來大量數據。這些數據不是搜集來的,而是互聯網上沉淀下來的。互聯網的特征就是它知道誰在看什么,看了多長時間,看完了又看了什么,總之,這是一個數據沉淀的過程。


這個數據沉淀的過程在傳統社會也存在,但是,數據只有到了互聯網上才變得真正具有價值,因為互聯網讓數據沉淀變得很簡單,就像我們從現金支付到信用卡支付、再到今天的支付寶,這個過程沉淀了很多相關數據,而使用現金則根本不知道在什么地方銷售了多少,或是商品最終被送到了哪里。基于互聯網的整個業務流程決定了你知道每個業務環節,所以數據是沉淀下來的而不是搜集下來的。


其二是云計算的重要性。有一個關于數據的誤區,經常有人會說,阿里巴巴的數據特別值錢。其實,數據值不值錢與數據本身沒有關系,而與使用數據的方法有關,數據產生價值,靠的是計算能力。


一個非常經典的例子就是谷歌,他具有足夠的計算能力可以去索引萬萬億網頁的公司。大家都說,谷歌靠廣告掙錢,其實并非如此。谷歌能夠掙錢,是因為他發現一個人按了一下鼠標,這個簡單的動作是沒有價格的,但當有成千上萬的點擊放在一起的時候,如果用足夠多的計算能力去處理他,就能夠猜出每一個點擊的商業意義,所以他就拿這個做廣告,從而使他有了今天的競爭能力。


數據時代,都在講怎么把沙子變成金子,這個過程靠的就是計算能力。數據是靠計算來產生價值的,如果谷歌每處理一個點擊所用掉的計算成本高于他掙回來的錢的話,他要破產。因此,云計算除了給你足夠的計算能力,還要有足夠便宜的計算成本,才能夠讓你的生意做下去。


總之,互聯網是一個國家經濟社會發展的基礎設施,它使得數據可以比人類歷史上更快的速度、更大的規模被沉淀下來,不是被收集下來,而且因為有了符合成本的計算能力,從而造就了一個新的大數據時代。


下面以物流、醫藥、交通和金融為例,看看數據如何基于互聯網和云計算(阿里云)上產生價值的(以下內容引自鈦媒體)。

1物流
貴州有個企業叫貨車幫,2010年開始做的。他做的就很簡單的一件事,當時有一個測算,一輛貨車運一次貨如果空跑100公里,那基本上這一趟就虧了。這個老板當時就想要做一個平臺,把貨物的運輸需求和貨車信息都放在平臺上,讓雙方能夠在上面互相匹配需求,既方便了貨物運輸,也提高了貨車的運營效率。貨車幫做到現在,已經有了超過15萬貨主,60萬車主,在上面沉淀了大量的物流數據,這是很了不起的。但是過往的數據沉淀后就沉淀了,沒有發揮應有的作用。


貨車幫的數據全部遷移到阿里云后,開發了新的功能,將過往的數據用于信貸審核,這些沉淀數據的作用就發揮出來了。貨主過往發過什么貨物,有沒有及時支付物流款。車主過往都跑什么線路運多少貨,下面多少輛車。這些都清清楚楚一一對應。克強總理去微眾銀行,給微眾銀行發放的第一個小額貸款,就是發放給了貨車幫的一位司機。而對這些貸款申請人的資信審核,就是基于對貨車幫這些數據的分析而做出的判斷。

2醫藥
國家藥監局原先做了一個很了不起的嘗試,就是給所有的藥品加上了二維識別碼,作為對假藥的識別預防機制。就這樣下來累計了大量的醫藥數據,但是對于這些藥品出售后的使用,以及對藥品的進一步數據的了解,他們完全不了解。


我們幫藥監局把數據遷移到了阿里云上,很多事情突然就找到了解決的新方式。藥監局做了一個試點,醫療保險的報銷應該將對應使用的藥品二維碼掃描一下與之前的購買數據相對應,結果一下發現騙保的金額比假藥的金額還大。現在他們通過阿里云的技術,基于之前沉淀的數據又開始在石家莊做另一個試點。

3交通
大家都知道12306搶票特別麻煩,阿里巴巴也幫12306做過很多事情,這么大量級的數據沖擊對鐵道部的技術是一個極大的挑戰,每年總是有很多人抱怨延遲和卡頓。今年阿里巴巴幫助鐵道部對12306做了改進,我們看看能不能有所改觀。12306賣全國所有的火車票,不知道大家有沒有聽說過12308?12308是想要賣全國所有的長途汽車票,實際上這是一個民營企業自己在做的事,當然名字聽起來挺山寨的。根據目前的統計,每賣出一張火車票,就要賣出10張長途汽車票。但是目前國內并沒有一個能夠統一購買全國各地長途汽車票的網站。12308就是想做這樣一件事情。目前他已經接入了全國三百多個城市的售票數據,實現了80多個城市的銷售。2015年他的目標是實現覆蓋全國300多個城市的銷售,讓我們拭目以待。掌握了全國交通運輸的數據是極其有價值的,這個數據很多時候連政府部門都不一定完全掌握,而這些數據可以在將來發揮出巨大的用途。

4金融
大家都知道余額寶。實際上余額寶當時做的時候阿里巴巴并沒有想到這個產品會有這樣的量級。選擇天弘基金做為余額寶的合作對象時,天弘基金在基金中的排名在50名以外,是一家非常靠后的基金公司。結果余額寶一推出,三個月就有了500萬用戶,這個增長速度當時天弘基金完全沒法想象,并且此后增長速度一直保持一個高增長的趨勢。按照當時天弘基金的系統,完全沒法承載這個量級的用戶數。在升級了兩次服務器和系統后,天弘基金最終決定將系統遷移到阿里云上。遷移之后到現在,余額寶一共有了1.49億用戶,差不多每9個人就有一個用戶在使用余額寶。互聯網女王Mary Meeker的報告中,天弘基金已經成為了全球第四大的貨幣基金,從2013年推出余額寶到現在一年半的時間,天弘基金從一個默默無名的小基金公司成為全球第四大貨幣基金,這是一個非常了不起的成就。


在有了這么多的用戶數后,余額寶上面已經沉淀了非常多的用戶數據。雖然現在由于銀行的限制,余額寶上面的企業存款增速已經逐漸減慢,但是個人用戶數還是一直在維持增長的。可以說,余額寶是全中國最了解民眾收入和消費水平的,因為他們每個月收到工資后都會把部分錢存到余額寶上來,而且也在使用余額寶進行消費。現在很多監管機關,包括人行、銀監會、證監會經常來阿里巴巴做調研,這些數據的重要性都是不言而喻的。(文/胡敏 以上內容根據王堅的發言整理而成)

推薦閱讀