作者:彭勁松|文 / 日期:2011-06-13
中國中化集團(以下簡稱“中化”)是一個有60年歷史的國企,2009年的收入是3千多億人民幣,橫跨五個行業,全部都是主業。它的業務遍及海內外,在世界和國內都有營銷網絡和業務運行平臺,有上市公司一些監管和治理的要求。
在“十一五”之前中化就確定下來“五統一”的信息化建設策略,將中化在全球所有的信息系統應用平臺集中統一管理和建設,包括所有銀行、證券、交易公司等等這些外圍系統,無論對內還是對外全部建成一個集中統一的應用平臺。
基于這個平臺,到2008年底2009年初,中化的法人單位達到200多個,93%的企業已經全部通過ERP進行管控。管控不是簡單的財務財務,而是三個組成部分:一是在流程當中進行管控;二是財務管控;三是風險管控。
通過多年的建設,在當時應用的不是現在的系統平臺,但是我們也知道,現在的商業也好、經濟環境也好是日新月異,都是在不斷變化的。如果我們用很多年前的ERP系統支撐現代的商業模式,很明顯有一個很大的問題,如何支持業務的變化,如何支持業務的發展,更主要的是如何進行業務的創新,這是很大的問題。2008年我們集團的信息領導小組確定下來,把過去4.7版本升到ECC6,通過這種版本升級帶來更多的商業軟件,這些軟件里面都有很多的商業思想在其中,從而為企業的業務創新提供一個很好的手段。
在這里不講升級的過程,只是詮釋一下升級是按照一定的階段來做的,有一個方法論。前面已經做了介紹了,所有的系統支撐著整個的商業運作,是不可停滯的,而且是離不開的。所有的升級是在同步進行發展,這就會帶來很大的挑戰。我們不說其他的跟業務進行協調等等,到今天首先有一點大家都是專家也都知道,就是資源上的調整,我們需要大量的資源,同時支撐這一時間需要超量規模資源的需求如何進行滿足。剛才我們看到了前面有方法論,我們自然是按照一個科學的方法進行計劃、布局和策略制定,這一切到此為止都非常順利。
2008年全球金融危機,無論企業也好,國家也好,都會同樣存在一個問題,2009年我們怎么面對?對于我們IT工作者來說,我們已經制定的這些升級計劃怎么辦?無論是內在還是外在的需求都不允許我們打退堂鼓。我們要有跟常規不一樣的思考,對于前面的這些布局都要進行重新的定義。
2008年2月份我們成立了一個小組專門研究云計算,到8月份基本上了解到它能夠帶來的一些效益,尤其對它可能帶來的一些風險進行了很好的控制和評估。所以我們在做2009年計劃的時候,確定下來就要用這種創新的方法來重新定義我們的系統升級,要在云計算上實現我們要完成的工作。
現在這個系統支撐了中化3千億的收入,95%以上的核心應用全部都在這個集中的系統當中,我們機房面積400平方米,在京郊還有一個70平米的備份數據中心,里面還有輔助的東西,包括UPS、空調還有監控的面積。在所有都不允許的情況下,我們沒有機會再去擴充,也沒有機會增加任何設備,所有故事的發生就是在這個470平米當中發生的。
云計算所關心的要建立一個動態資源池,統一的管理。云的核心實際上就是云控制器,可以很好的進行動態分配。比如現在要布置一個開發系統,云控制器來進行分配去哪個資源的空間進行調整。接著假設再做測試系統,當這一部分不夠的情況下,又會另外找一個地方再補充。所有的資源都按照你的需求和服務進行匹配,從而滿足你的要求。還有一種狀況,我們叫做服務器故障。這個云是如何應對的?它所有的服務會動態的調整到另外一個資源池里,所以所有服務在一個資源池的情況下完全可以擴充,按照需求服務進行匹配,而且在一個網絡環境下進行。用戶根本就不會感知,或者不需要了解這個服務是在哪一臺物理機上發生的,所有的由云進行,并且資源可回收,為下一次云的需求而提供資源。
技術已經完全脫離了物理的概念,全部在一個云中,管理、資源調配、提供的服務和為了滿足需求的一些設計,全部都在云里進行,極大的縮短了IT交付時間,為商業提供服務。
我有三點體會:
第一,做云計算一定要有需求上的考慮,沒有需求為什么要上?一定要有應用的需求。在座有我們的同行,我們也都知道,有很多應用,像煉化這種企業,很多MES系統,那也是IT的一部分,這種應用就不適合做云計算,所有這些東西需要去分析和思考。
第二,需要有步驟。我們做出的決定絕不是拍腦袋,有步驟的進行所有應用的實施,做服務統一,進行集中的工作。2005年就在11臺機器上承載了公司2千億業務,所有的ERP系統裝在這臺機器上,不通過虛擬化是不可能完成的。2007年我們又實現了SOA。但是面向服務不是你的硬件或者程序,而是要提高到服務這個層次,這些融合才是云計算的基礎,所以才構成了我們2009年成功的實施了云計算。
第三,就是安全。我在這里要說的是,什么事情都有安全的問題,尤其是IT行業。中化全球都用一個單域部署的平臺,卻沒有發生安全威脅事件,在于有一個安全體系的支撐。
最后給大家講一個小故事,我也是國際注冊信息系統設計師,很關心安全問題。一個機房按理說它的管理是非常固化的東西,換了一個人,過來以后告訴領導要換這個換那個,換了很多東西,把每天的巡檢制度撤了,把規章制度撤了,每天的記錄也撤了,最主要的把檢查的巡視員也撤了。這個機房之前10年沒有發生事故,撤完以后,5個月之后全部停了,影響工作6個小時。實際上查出來問題很簡單,北京1月份到6月份春天有很多柳絮,按原來的規則是一年換5次控制濾芯罩,春天兩次,一個季度一次,整個花下來600塊錢全解決了。解決這個人說沒有什么測試系統,就是這些探頭,花了30多萬都裝了很多探頭,最后好像解決了,接著又過半年又出事了,電源全斷了,有一天加班,又花了幾十萬,請了一個外包,把機房的監控給外包出去了,說現在全世界都做外包,我們也要做外包。結果外包的這個人正好有一天加班,他走了,換了一個公司其他人,沒有經過任何培訓,結果他關燈把總電源全關了,這樣就出事了。出事了以后又找問題,如果找對了問題也可以,結果問題就是這個負責的經理說我不讓你加班,你為什么要加班?這是哪兒跟哪兒?所以這是體系的問題,技術沒有百分之百的,我們必須來彌補,才能降低我們的風險。安全在很多時候,尤其是云計算討論的最為熱鬧的時候,我認為不是阻礙我們使用云計算一個根本的因素。只要我們體系上是健全的,云計算仍然對于一個企業是安全的。公共云我不好說,但是對于私有云,因為是在網絡邊際以內,我覺得完全可以通過體系進行管控。
(本文作者為資深云實踐專家。本文由ITValue韓洋根據其在第三屆云計算大會“云計算與信息化創新”分論壇的演講整理而成,未經本人確認。)