當前位置:歷史故事大全網 - 歷史上的今天 - 更改表中字段時如何兼容歷史數據?

更改表中字段時如何兼容歷史數據?

業務是不斷變化發展的,產品也會不斷叠代。數據表作為壹個基礎組件,經常需要更改,這在我們的日常工作中是很常見的。

比如下面這個例子是壹個分析淘寶商家移動店鋪數據的產品,其中菜單“流量來源”就是店鋪流量分析。在店鋪發展初期,“淘寶內免費”、“付費流量”、“自主接入”可以支持商家方對店鋪數據的分析。然而,隨著門店業務的不斷發展,對流量分析的粒度要求越來越細化,但單純的流量劃分已經不能滿足業務方的需求。希望對淘客內部流量有更細致的分類,幫助商家對店鋪流量有更細致的了解,從而根據不同的流量大小調整運營策略,促進店鋪銷售數據的發展。

現狀:淘內免費付費流量接入

期待:免費搜索我的淘寶淘寶,其他淘寶微淘寶手掃等等。

需求:更改“流量來源”數據表中的字段。

當原有產品不能滿足當前業務發展時,為了滿足業務新需求,服務新場景。我們必須改變原來的產品設計和表中的字段設計。更改“數據表”的字段很容易導致數據沖突,包括數據類型沖突和數據格式沖突。

如果在更改表字段時不考慮數據沖突的影響以及如何兼容歷史數據,就會導致產品中數據的完整性和壹致性出現問題。比如上面的案例,如果不做歷史數據兼容性處理,選擇在3.19號上線新的統計功能,那麽流量劃分會有兩種不同的統計方法,19號之前的流量數據劃分和19號。

歷史數據在某種意義上成了“臟數據”,有“垃圾數據進,垃圾數據出”的說法。對於分析結果來說,數據質量甚至比分析方法和模型更重要。混有臟數據的輸出結果對業務造成嚴重影響,甚至做出錯誤決策,帶來不可磨滅的損失。

因此,我們有必要解決“表變字段”後的數據沖突,兼容歷史數據,減少變化對數據的負面影響。那麽問題來了,怎麽才能做到和史料兼容呢?

01歷史數據需要保存?

在表的變更字段發生數據沖突後,我們在兼容歷史數據之前可以思考壹個問題:是否所有的歷史數據都需要保留?我們來看看下面兩個場景。

場景1

某電商to b產品在壹次叠代中,在“店鋪銷售”的菜單中增加了“客單價”這個字段,那麽歷史數據中的客單價對我們有什麽意義嗎?

場景2

我們設計了壹套問卷來統計國內大學生不同專業的就業情況,並在壹段時間後修改了問題,那麽收集到的歷史數據對我們是否還有意義?

通過兩個具體場景,我們可以發現不同場景下“歷史數據”的留存策略是不同的:

場景1中的“客單價”可以幫助復制店鋪的歷史客單價,與當前的“客單價”進行對比,指導店鋪策略。在這種情況下,歷史數據非常重要,需要保存。

但場景2中收集的“妳的國家是什麽”與“國內大學生”這壹題目存在矛盾,而該題目是為解決這壹矛盾而修改的,所以該題目收集的史料無效,可以直接毫無保留地丟棄。

歷史數據是對過去業務情況的記錄和反饋,但不是所有的歷史數據都有意義,也不是所有的歷史數據都需要保留。在考慮歷史數據的兼容性之前,建議從實際場景出發,分析“歷史數據”對業務的價值和意義。如果是無關或錯誤的數據,直接丟棄歷史數據就可以了。對於要保存的歷史數據,我們需要考慮沖突在哪裏,如何兼容。

如何與歷史數據兼容

在思考了史料的價值和意義之後,我們決定保留史料,那麽如何才能做到與史料兼容呢?首先需要區分不同的數據表變化會帶來什麽樣的數據沖突,然後根據不同的沖突情況提出相應的兼容方案。

1.添加字段

我們經常會遇到在表上“加字段”的情況,比如增加新的業務字段,增加新的統計項目。

如果不兼容,添加的字段中將有新數據,但沒有歷史數據。在這種情況下,我們需要判斷歷史數據是否可以完成,如果可以,完成歷史數據;如果不能完成,新增字段的歷史數據將顯示為空白。

2.減少字段

當出現“減少字段”的情況時,如果不處理,減少的字段不會有新的數據,但是有歷史數據。在這種情況下,我們的處理方法是保留歷史數據,減少統計後該字段的空白顯示。

3.原有的字段統計邏輯或規則發生變化。

當統計邏輯或規則發生變化時,如果不進行數據兼容,由於新數據和歷史數據的統計方法不壹致,數據結果會有所不同。這時候就需要判斷歷史數據是否可以按照新的統計邏輯進行轉換,如果可以,就按照新的邏輯重新統計;如果不能保留歷史數據,並記錄統計邏輯的變化。

4.在原始字段中向下鉆取或合並統計數據。

這種變化會導致新領域與歷史領域的關系,這就需要我們完成歷史資料。例如,將字段A鉆取到壹個新字段B+壹個新字段C,並根據鉆取規則補充新字段B和C的歷史數據值。

在實際場景中,會同時出現多種數據沖突,采用的解決方案也是多種方案的組合。

比如下面這個案例,我們叠代了“客戶管理”模塊,通過調查發現內部銷售團隊希望在“客戶管理”菜單中增加“客戶微信”字段,並提供根據客戶等級自動計算“下次回訪時間”的功能,於是我們調整了“客戶管理”字段。

表格修改為:增加“客戶微信”和“下次回訪時間”字段,減少“創建時間”字段。有“加場”和“減場”兩種情況。通過分析“客戶微信”和“下次回訪”這兩個字段對現有客戶的意義,可以收集客戶的微信聯系方式和具體回訪時間,方便業務員開展業務,兩個字段的數據也可以完成。減少的“創建時間”字段對業務幾乎沒有影響,可以丟棄。基於以上考慮,我們對“客戶管理”菜單進行了如圖所示的處理。

叠代上線後,產品生提出“下次回訪時間”直接顯示時間,對銷售團隊來說不直觀。“下次回訪時間”可以進壹步處理,更加直觀,因為“下次回訪時間”字段原來的時間格式支持當前的規則轉換,所以時間可以轉換。

處理“下次就診時間”的顯示並計算“下次就診時間”和當前時間之間的差值:

原始統計格式:yyyy-mm-dd

新的統計格式:x天回訪;逾期x天。

隨著業務的發展,我們遇到了字段的統計邏輯和規則無法轉換的情況。“客戶管理”中“意向產品”的可選項目由“商品1、商品2、商品3”變為“商品5、商品6、商品7”。變更前後的數據不可能簡單地兼容,但是變更前後的數據對業務是有意義的,所以我們需要

從上面的案例中我們發現,換表並不只有壹個沖突,我們采用的各種解決方案都有。

03兼容歷史數據的價值和方案

表字段的變化會導致歷史數據和變化數據的沖突,數據沖突會導致產品層面的數據不壹致,進而導致用戶無法理解前後的數據,從而對產品產生懷疑甚至負面情緒。

簡單地在表中增減字段,對用戶的影響相對較小,會降低用戶的可讀性。比如上面的案例,添加或刪除字段會讓用戶混淆壹些有數據的案例和壹些沒有數據的案例,增加理解成本。

但是,統計邏輯的改變不僅僅是簡單的用戶體驗問題,還會對業務產生實際影響。比如上述意向產品中的可選產品發生了變化。如果歷史數據在時間上不兼容,並對相關變化進行說明,很容易給業務員帶來之前的商品還能銷售的誤判,最終導致訂單錯誤甚至下單後無法發貨,給公司業務帶來實質性的損失。

可見,兼容歷史數據的價值在於解決了這壹系列的數據沖突,既保證了產品層面的數據壹致性,又讓用戶了解了數據變化的原因,減少了用戶的負面情緒和理解成本。更重要的是,既能幫助用戶恢復業務,又能起到業務指導作用,避免意外和損失。

但是,歷史數據的兼容性並不適用於所有場景。當我們涉及到較大的變化時,比如由於業務發生較大變化,原有的表字段被完全推翻重新設計時,不建議采用上述兼容方案。我們可以選擇新舊數據交替過渡,原表提供對舊數據的支持,創建新表支持新字段的顯示。這樣就完成了歷史存量業務向新業務的過渡。例如,如果需要重建整個項目,可以選擇數據遷移方案。

現在遇到史料沖突,又需要兼容的時候,可以判斷如何選擇嗎?

  • 上一篇:慶陽歷史遺跡
  • 下一篇:茶文化在推動社會進步中的作用
  • copyright 2024歷史故事大全網