文/中國郵政儲蓄銀行軟件研發中心 閆寶旺 黃靜 王莉
數據作爲新型生產要素,國家對數據的重視程度已達到前所未有的戰略高度,從目前各行業數據管理及應用實踐來看,大多面臨數據質量及應用效率的雙重挑戰。大數據測試對於確保數據質量、保障系統穩定性、提升業務處理能力等方面具有重要意義。通過有效的大數據測試,可以發現潛在問題,提高數據準確性和利用率,增強數據造血能力,釋放數據要素價值。郵儲銀行深入研究並制定標準化大數據測試工藝,積極開展技術創新,自主研發大數據測試服務平臺,提升數據測試能力,保障全行數據質量,降低潛在業務風險,爲銀行產品和服務創新奠定堅實的基礎。
大數據測試面臨的挑戰
爲保障全行數據質量,賦能數據應用,軟件研發中心深耕大數據測試領域,實現行內大數據類工程測試實施全覆蓋。在此過程中積累了很多經驗,也面臨不少痛難點問題,總結爲以下幾個方面。
1. 測試技能門檻較高。伴隨着海量數據(維權)處理和多樣化業務場景需求,對測試人員的專業技能提出了更高要求。技術方面應熟悉大數據生態圈,具備複雜業務邏輯的SQL腳本編寫能力;業務方面需深入理解銀行業務知識,熟悉上下游業務系統的數據加工規則和取值邏輯。
2. 業務場景覆蓋不夠全面。大數據測試具有數據量大、數據複雜多樣等特點,且測試環境資源受限,數據量、數據內容與生產環境存在較大差異,難以滿足真實的業務場景需求,數據的不充分性往往對測試結果的可靠性造成一定的影響。
3. 腳本管理不夠規範。在數據測試領域,開發、測試人員通常將測試腳本存儲在本地環境中,難以實現版本維護及工程之間的複用,且腳本編寫質量參差不齊,缺少統一的線上化管理、版本控制和質量檢核工具。
4. 手工測試效率較低。大數據業務複雜且數據量龐大,涉及數據庫表和字段衆多,傳統的手工測試僅能採用抽樣測試,覆蓋率和執行效率較低,迴歸測試成本高。複雜SQL關聯分析難度較大,缺少自動化、可視化的工具,人工檢核費時費力,且容易出錯。
打造大數據測試質量保障體系
1. 構建大數據測試方法論。經過多年的大數據測試實戰摸索,針對數據質量測試、數據業務測試等多種測試類型,以郵儲銀行測試管理體系爲基礎,形成數據倉庫測試、報表測試、模型測試等實踐指導手冊,100%覆蓋數據集市、數據中臺、監管報送、分析報表類等系統,保障系統功能正確性和數據服務穩定性。
2. 創新大數據測試工藝。在總體策略方面採用灰盒測試,既關注系統輸入輸出,又關注代碼邏輯及程序內部結構;在數據範圍方面以靜態數據測試爲主,動態數據測試爲輔,數據整體測試和重點數據抽樣測試相結合,測試環境與驗證環境雙線並行,儘可能還原真實的業務場景。在數據測試領域拓展測試邊界,踐行測試左移,測試人員深度參與需求分析與設計,檢查開發映射文檔與業務需求的一致性,避免因規則定義錯誤而導致開發測試返工;同步開展測試右移,根據業務上線驗收問題單,開展測試根因分析和覆盤總結,反哺測試覆蓋率的提升。
3. 定製化大數據系統測試策略。基於行內數據倉庫、數據集市系統架構,採用分層測試策略:根據各層級映射邏輯,有側重地開展數據質量測試、彙總指標驗證和業務規則校驗。而針對數據中臺、統一報表等平臺類、應用類系統,採用端到端的測試策略:測試人員基於源表梳理業務邏輯,從技術角度編寫測試腳本實現端到端加工邏輯驗證。從業務角度預先在源系統埋數,經過各層數據加工處理後,在下游系統驗證整個鏈路的準確性。
4. 自主研發大數據測試服務平臺。爲解決大數據測試面臨的技術要求高、數據量大、測試效率低等問題,軟件研發中心自主研發大數據測試服務平臺,提供數十種規則校驗及跨庫、跨表數據比對等功能。同時輸出標準化測試模板,支持豐富多樣的數據質量、數據加工測試場景,通過對數據測試底層能力的封裝,以自動化、工具化的手段替代手工持續測試,提升數據測試效能。除測試環境,平臺還部署至準生產環境,使用脫敏後的批量數據模擬實際生產環境進行測試,保障測試充分性。
5. 規範管理大數據測試資產。針對數據測試腳本大多保存在本地、無法複用的問題,依託大數據測試服務平臺對測試腳本等資產進行線上化管理,實現腳本統一維護和版本控制。支持測試腳本按照規範自動檢核,提高腳本編寫規範性;支持SQL語句解讀,形成血緣分析圖,有效降低複雜SQL的關聯分析難度,全方位提升數據測試效率。
大數據測試體系應用效果及價值分析
1. 提升數據質量,助力全行數據治理。數據質量是銀行業關注的焦點問題,大數據測試作爲保障數據質量的重要防線,發揮着舉足輕重的作用。在郵儲銀行2024年信息化工程建設過程中,依託完善的大數據測試體系,提前發現並解決的數據質量問題數較上一年度大幅提升,數據精確度和完整性顯著提高,爲業務經營、決策分析等提供可靠的數據支撐。通過測試套件集自動進行批量檢測,對各系統開展常態化數據質量監控,實現數據問題早預警、早識別、早處理,有效促進數據治理的精細化與高效化。
2. 加速測試創新,促進測試提質增效。基於自主研發的大數據測試服務平臺,實現數據測試自動化。當測試場景涉及海量數據時,藉助平臺將抽樣檢核升級爲全量測試,大幅提高了測試覆蓋率;針對行內通用的數據文件格式和內容進行驗證時,單次文件檢驗已從小時級縮短至秒級,實現測試時長驟減。隨着平臺的持續應用和推廣,累計編寫和執行的數據測試腳本數較同期增長約一倍,實現測試質量及效率的顯著提升。
3. 降低業務風險,賦能數據應用場景。通過實施全面精細的大數據測試,不僅能夠提升數據質量,更能夠預先識別並規避由數據偏差引發的業務風險。經測試驗證的準確數據可以幫助數據分析師更好地挖掘數據潛在價值。在風控領域,大數據測試使風險評估和預警模型更精準,強化銀行風險識別和防控能力;在客戶畫像和個性化服務領域,大數據測試可以保障客戶數據準確性,以深入瞭解客戶需求和行爲特徵,提高客戶洞察能力。
在數字化浪潮推動下,郵儲銀行積極擁抱大數據,通過一系列科學規範的流程、創新的方法和工藝,持續開展大數據測試,保障系統功能與數據質量,爲銀行業務決策提供可靠的數據分析,充分發揮數據要素的核心價值,提升客戶體驗。
未來,隨着海量數據的不斷激增、金融監管要求的日益嚴格,大數據測試向更高效、更智能的方向發展是必然趨勢。我行將繼續深化大數據測試研究,完善大數據測試體系規範和平臺建設,擴大應用場景和覆蓋範圍,助推數據應用多元化發展,爲提供高質量的“數智化”金融服務保駕護航。
(此文刊發於《金融電子化》2025年4月上半月刊)
免責聲明:投資有風險,本文並非投資建議,以上內容不應被視為任何金融產品的購買或出售要約、建議或邀請,作者或其他用戶的任何相關討論、評論或帖子也不應被視為此類內容。本文僅供一般參考,不考慮您的個人投資目標、財務狀況或需求。TTM對信息的準確性和完整性不承擔任何責任或保證,投資者應自行研究並在投資前尋求專業建議。