pg數據庫分庫分表 mysql表數據量太大,達到了1億多條數據,除了分庫分表之外,還有沒有其他的解決方式?
mysql表數據量太大,達到了1億多條數據,除了分庫分表之外,還有沒有其他的解決方式?在正常配置下,MySQL只能承載2000萬數據(同時讀寫,表中有大文本字段,單服務器)。現在已經超過1億,而且還在
mysql表數據量太大,達到了1億多條數據,除了分庫分表之外,還有沒有其他的解決方式?
在正常配置下,MySQL只能承載2000萬數據(同時讀寫,表中有大文本字段,單服務器)。現在已經超過1億,而且還在增加,建議按以下方式處理:
1子表。它可以按時間或一定的規則進行拆分,以便盡可能地查詢子表中的數據庫。這是最有效的方法。特別是寫,放入一個新表,并定期同步。如果記錄不斷更新,最好將寫入的數據放在redis中,并定期同步表3的大文本字段,將它們分隔成一個新的獨立表。對于較大的文本字段,可以使用NoSQL數據庫
4優化體系結構,或者優化SQL查詢,避免聯合表查詢,盡量不要使用count(*)、in、recursion等性能消耗語句
5使用內存緩存,或者在前端讀取時增加緩存數據庫。重復讀取時,直接從緩存中讀取。
以上是一種低成本的管理方法,基本上幾個服務器就可以做到,但是管理起來有點麻煩。
當然,如果總的數據量特別大,并且您不關心投資成本,您可以使用cluster或tidb
~]。
如果對表進行分區,則必須根據關聯條件在同一分區中分配主表和子表,或者使用全局表策略來避免跨分區聯接。
分庫分表中間件的大致原理,跨庫的join怎么做?
pgsql怎樣創建表,數據庫等?
子庫和子表是一種相對落后的優化方法,因為成本相對較高。
遇到數據庫瓶頸:
-首先考慮SQL優化,這是最簡單的方法。對現有系統沒有影響。
-第二個是考慮數據庫讀寫分離,這也是一個相對簡單的方法。在數據庫級配置中,系統級只需要調整獲取數據庫連接的邏輯即可。讀取數據時,可以同時獲得主庫和從庫連接。寫入數據時,僅獲取主庫連接。
-考慮添加緩存層。數據緩存在緩存中,再次訪問時不再從數據庫檢索。通常,緩存層對系統是透明的,對系統本身沒有影響。但是,cache的引入也引入了相應的需要考慮的問題,如雪崩、命中率、分布式cache等]-還有一種非技術手段,就是改變需求。性能問題的原因是否不合理?還是要求太復雜?需求可以簡化嗎?這種方法對系統的影響相對較小。
-最后,考慮子數據庫和子表。優先考慮子數據庫,因為它比子表簡單。將相應的表移動到新的數據庫中,并調整系統的邏輯以獲得數據庫連接。在這里,我們需要考慮移動哪些表。在提高性能的前提下,我們首先嘗試避免分布式事務。
-最后,考慮子表。子表的主要原因是單個表中的數據量很大。子表分為縱斷面和橫斷面。垂直剪切是按列剪切的,例如用戶表。常用信息為基本信息表,其他信息為明細表。橫切是按行切割。例如,一個有1億數據的表被分成10個有1000萬數據的表。這涉及到數據應該存儲在哪個表中或從哪個表中獲取。在表被劃分之后,可以對數據庫進行進一步的優化。
-如果涉及分布式事務,應考慮如何保證分布式事務。理論上,2個,3個,帕克斯,帽子,底座。相應中間件的使用。
系統的設計和優化不是模仿的問題,而是需要根據實際場景進行處理。