ITValue社區

鄒勝:深交所核心交易系統轉型的四大策略和五大經驗

作者:鄒勝 / 日期:2017-03-10

傳統金融機構因其體量龐大、牽一發而動全身,在互聯網轉型的路徑中總是顯得步履維艱而又疑慮重重。敢于“吃螃蟹”的深交所則開創了金融領域改革創新的一個先例。他們不僅大膽轉向開放平臺,制定“世界一流交易所IT”戰略,還在“步步為營”的決策思路下,用數據說話,最終打消了所有人的疑慮,完成了整個核心系統的重大升級換代。

引領這一宏大工程的深交所前副總經理、深圳證券通信公司前董事長鄒勝日前坐客ITValue微信群公開課【深V課堂】,與大家共同分享了他的一些經驗和體會。



以下是鄒勝的分享內容,由ITValue編輯整理:

在去年的三亞IT價值峰會上,我曾分享過深交所新一代交易系統如何用開放平臺和分布式架構順利實現轉型。去年的話題主要聚焦這一系統有哪些特點,今天主要跟大家分享一下在具體的實施過程中有哪些關鍵環節以及我個人的一些體會。

1
多項業務指標躋身全球前十

先給大家介紹一下深交所和新一代交易系統的背景。作為傳統大型金融機構的代表,深交所在很多業務指標上都排名全球前十。就2016年來說,公司市值排名全球第八,交易金額全球第三,籌集資金全球第二,成交筆數(即一年處理過的交易筆數)超過美國納斯達克,高居全球第一。這樣規模體量如此龐大的一個金融機構,要完成核心系統的重大升級換代,并非易事。如果沒有十足的把握很難下定決心去做,即使做了也很難有把握完全做好。

去年5月9日,深交所第五代核心交易系統上線。從系統能力來看效果顯著。新一代交易系統全部采用開放平臺和分布式架構,以較低成本實現了非常好的技術指標:系統持續訂單處理能力達到每秒30萬筆,平均訂單的處理時延達1.1毫秒,整個系統的容量是能夠處理5萬支證券,每天能夠處理4億筆訂單。

在可靠性上,新一代交易系統對一般故障的處理時間是小于10秒鐘,做同城災備的切換時間小于3分鐘。我們也對其五年總擁有成本做了一個測算,

第五代核心交易系統的整體成本只有舊有系統的1/3。

根據國際交易所聯合會發布的一些官方數據,以及互聯網媒體的一些公開報道,相較全球主要交易所,包括紐交所、納斯達克、倫敦交易所、德國交易所、日本交易所和香港交易所等,深交所每天處理的訂單容量和安全可用性記錄都處于最高水平;在持續的訂單處理能力上僅次于美國納斯達克和德國交易所;在委托處理時延上,深交所也是名列前茅。

在此有兩點要特別提一下。一個是安全可用性記錄。深交所有一個專門的團隊去持續跟蹤全球主要交易所的技術進展和動態,一些重大安全事故都會記錄備案。從歷年數據來看,深交所的記錄堪稱最好,保持連續14年的一個安全記錄,這個在全球主要交易所里面都屈指可數。還有一個就是我們的自主可控能力,整個新一代核心系統都是完全由我們自己設計研發。

從技術上講,這次轉型實際上就是把我們以前使用的HP的一個容錯主機全部換成了標準的X86的服務器,也把一個封閉的操作系統都轉用到Linux的操作系統,變成一個以消息總線為中心的一個分布式處理架構,從以前的垂直升級變成了一個水平擴展這樣的一個分布式架構。

2
用“步步為營”攻城略地

我們此次轉型所采用的一個方法,叫“步步為營”。歷史上,曾國藩跟太平天國作戰,流傳有一個典故叫“結硬寨打呆仗”。由來是這樣的:太平天國軍隊非常驍勇,很難對付,所以曾國藩經常吃敗仗。這樣幾個回合下來,他發現進攻比較難,于是就改變策略,集中優勢兵力把太平天國圍住,然后把寨子扎得異常堅固,壕溝挖得很深,吸引太平軍來打他,這樣守比攻易,慢慢他就開始打勝仗了。

就深交所轉型來說,最關鍵的就是對方向的判斷和把握以及決策。

在做這個項目之前,我們做了一個非常小的規劃項目,包括對全球主要交易所同行都做了一些考察和調研,同時也請咨詢公司做了一些小型咨詢,另外對關鍵技術涉及到的架構也進行了非常深入的驗證,綜合之后再做決策。

當時我們考察了全球主要的交易所,主要集中在美國和歐洲。給我印象非常深刻的一個是美國納斯達克,還有就是紐交所以及在美國新興的一些ECN,包括也有一家叫Archipelago(群島)的ECN,還有一個叫Inet的ECN。考察后我們發現,2005~2006年時,美國開始推出一個名叫MIFID的法案,鼓勵交易所競爭。此后,美國的交易所就都開始動腦筋,想怎么把交易系統做得更快、更先進。之前大部分交易所都在用主機平臺,法案頒布后,有想法的交易所就開始考察使用新的平臺,這個新平臺就是開放平臺。

國際領先的交易所都在采用開放平臺,采用以消息為中心的這樣一種技術方向,所以,回國后我們就找了幾家咨詢公司做了一個小的咨詢項目,同時邀請了幾個主要供應商,對可能涉及到的技術方案進行架構驗證,主要是關鍵技術,比如消息總線這樣的一些基礎架構。

我們的驗證方案非常詳盡,尤其是把大家重點關注的開放平臺這么便宜的系統究竟可不可靠作為重要的驗證指標。通過數據說話,以便讓相關決策人員能夠拿到足夠令人信服的數據。

驗證結果也非常理想。不管是性能、時延、擴展性,還是最重要的可靠性、可用性等指標都非常理想,由此也打消了很多疑問,最后進入到決策環節。我們做了一個非常果斷的決定,就是正式立項來實施新一代交易系統。在實施時,也是先做了一個總體的藍圖,然后分步驟實施,首先是核心架構,第二就是核心業務功能的實現,第三步是實現全部的業務功能,第四步就是對整個證券市場進行動員、測試、組織切換。

核心架構就是根據我們的架構驗證中選擇的方案的基礎上,把應用所需要的架構方面的支持和功能進行了實現,這是第一步。接下來我們就把和交易,比如說撮合、行情分發像這樣一些核心的業務功能在核心架構上進行了實現,這兩步之后,測試結果出來,相關人員都比較有底氣了。然后我們就開始第三步,把團隊規模進行了大幅擴張,來支持全部的業務功能。我記得我們團隊在做核心架構的時候,只有十來個人,做核心業務功能的時候也就是二三十個人,到了第三階段做實現完整業務功能的時候,團隊規模已經最多達到110個人。

在第四個步驟我們對市場進行了動員,組織我們的會員和參與者進行測試,并且安排了切換。在此我們用了一個比較好的辦法,就是對原有系統的接口提供六個月的兼容期,這樣會員能夠非常從容地安排他的切換上線的一個時間計劃。最后事實證明,這個方案得到了市場的歡迎,效果也非常好,整個切換非常平穩。

所以去年5月9號我們叫切換試運行,6月6號正式開始上線,到目前已經有9個多月的時間。回顧整個系統的運行,各項業務基本都達到了我們的設計指標,整個切換也非常平穩,市場運行良好。

3
CIO要勇于溝通和擔當

下面談一下我的幾點體會。

第一就是要以我為主,用好咨詢。沒有任何一家咨詢公司比我們自己更了解業務。所以我們雖然用了咨詢公司,但是是把它切分在不同的主題里面,從每一個主題里尋找那個方向上的優秀單位來咨詢。全局和總控還是由我們自己來做控制,這個也是我們成功的一個經驗。

第二要把握好整個升級換代的優先級。很多人可能覺得高性能、低時延是很吸引人的一些指標,但是我認為,最優先級要保證的還是一個“高可用”,要把高可用放在一個最高優先級上。事后證明,在整個領導的溝通決策過程中,這也是非常正確的一個決定,如果你把可用性、可靠性的問題解決好了,你就成功了一半。

第三,要做關鍵技術的充分驗證,而且要做的非常扎實和到位。這種驗證投入的成本并不高,但是能夠建立起各方的信心,尤其是內部做決策的人,這個是我們成功的一個非常重要的一個點。所以我們在各種方案的驗證方面也下了很大的功夫。

第四點就是在核心團隊的構建上面,我們并沒有因為采用了全新的技術就推倒重來,而是保留原有交易系統核心團隊的骨干,因為他們是最熟悉自身業務的一批人員,圍繞這批人員來補充一些所需要的新技術和新技能人才,共同組建一個混合團隊,也是成功不可或缺的。

最后一個就是CIO的溝通能力和擔當。總的來說,這是一個非常重大的升級換代,對整個機構、整個市場的影響都非常巨大。在此過程中,CIO要善于主動跟領導、跟相關業務條線去溝通,得到他們的全力支持和配合。另外在關鍵點的決策上,容不得一點含糊,該拍板的時候必須拍板,所以也需要一些擔當。

推薦閱讀