入庫過程后的自動優化,是為了解決傳統分布式數據庫甚至Hadoop平臺也非常常見的:在用戶使用一段時間后,發現如果沒有對數據庫的存儲進行人工定時維護,則會引起性能大幅下降的問題。
以柏睿數據的全內存分布式數據庫RapidsDB來具體解釋,RapidsDB的3個自動優化手段,就是解決核心的3個性能影響因素:
第一個是,無論做增刪改操作,數據庫都會自動對相關的列存行段中的數據自動重新排序,保證優秀的查詢性能。第二個是當列存行段內重新排序完成后,其外的行段組會重新做排序組織,進一步使數據有序,二次優化性能。第三個是經過上述2點的優化,有序數據使壓縮率得到提升,數據文件也得到合并,數據文件個數同時也會減少。IO讀寫性能可以在整個使用過程中,一直保存在極高的狀態中。
目前知道的是,這個全內存分布式數據庫RapidsDB已經在國有某大行普惠金融項目應用中運行超過10個月,產品自動優化證明了它的能力和價值。中間經歷過幾次10TB級的數據加載,每天10GB級的數據新增和更新,以及定時的滾動式刪除。過程中,技術團隊無需對數據庫做任何優化干預,相同場景的數據操作沒有任何性能下降的跡象。
審核編輯 黃昊宇
-
數據
+關注
關注
8文章
7085瀏覽量
89229 -
優化
+關注
關注
0文章
220瀏覽量
23928 -
內存數據庫
+關注
關注
0文章
9瀏覽量
6397
發布評論請先 登錄
相關推薦
評論