MySQL中大對象的多版本并發控制詳解

 更新時間:2018年11月02日 16:25:39   作者:Yujiaao   我要評論
這篇文章主要給大家介紹了關于MySQL中大對象的多版本并發控制的相關資料,文中通過示例代碼介紹的非常詳細,對大家學習或者使用mysql具有一定的參考學習價值,需要的朋友們下面隨著小編來一起學習學習吧

MySQL 8.0:InnoDB中大對象的MVCC

在本文中,我將解釋MySQL InnoDB存儲引擎中大對象(LOB)設計的多版本并發控制(MVCC) 。 MySQL 8.0有一個新功能,允許用戶部分更新大型對象,包括JSON文檔 。 使用此部分更新功能,當LOB部分更新時,MVCC對LOB的工作方式已發生變化。 對于正常更新(完整更新),MVCC將像以前的版本一樣工作。 讓我們看一下MVCC在不涉及部分更新時的工作原理,然后考慮對LOB進行部分更新的用例。

MVCC 常規更新

我使用術語常規更新來指代不是部分更新的更新。 我將通過一個例子解釋MVCC如何用于常規更新大對象。 我將為此目的使用以下mtr(1)測試用例:

 create table t1 ( f1 int primary key , f2 longblob ) engine = innodb ; 
 insert into t1 values ( 1 , repeat ( 'a' , 65536 ) ) ; 
 
 start transaction ; 
 update t1 set f2 = repeat ( 'b' , 65536 ) where f1 = 1 ; 
 
 -- echo # Connection con1: 
 -- 對于使用MySQL客戶端的用戶,可能需要通過另開一個終端窗口建立新鏈接, 下同。
 connect ( con1 , localhost , root , , ) ; 
 -- echo # Must see the old value 'aaaaaaaaaa' 
 select f1 , right ( f2 , 10 ) from t1 order by f1 ; 
 
 -- echo # Connection default: 
 connection default ; 
 disconnect con1 ; 
 commit ; 
 
 drop table t1 ; 

為了理解下面的解釋,仔細理解上述測試用例非常重要。

測試場景如下:

最初,表t1包含單個記錄(R1)。
事務trx1將記錄更新為新值。
當trx1仍處于活動狀態時,另一個事務trx2正在讀取記錄。 它將讀取舊值。

表t1僅包含一個記錄(R1)。 但是trx1和trx2會看到兩個不同的值。 該表實際上只包含最新值(trx1所見的值),而trx2看到的值或記錄是從撤消日志記錄中獲得的。 讓我們看下面的圖片來更好地理解它。

初始狀態:更新操作之前

下圖顯示了更新操作之前的情況。 撤消日志為空。 表的聚簇索引包含一行。 表中有一個LOB。 聚簇索引記錄包含對LOB的引用。

最終狀態:更新操作后

現在讓我們看一下更新操作后的情況。

以下是一些重要的觀察:

用戶表空間中有兩個LOB - 舊的LOB和新的LOB。 舊的LOB只能通過撤消日志訪問。 聚集索引記錄指向新LOB。
更新操作已創建包含更新向量的撤消日志記錄。 此撤消日志記錄指向舊LOB。
聚簇索引記錄通過DB_ROLL_PTR系統列指向撤消日志記錄。 此滾動指針指向撤消日志記錄,該記錄可用于構建聚簇索引記錄的先前版本。
撤消記錄不包含LOB本身。 而是它只包含對存儲在用戶表空間中的LOB的引用。
存儲在撤消日志記錄中的LOB引用與存儲在聚簇索引記錄中的LOB引用不同。

事務在連接1中采取的步驟如下:

事務查看R1并確定尚未提交修改聚簇索引記錄的事務。 這意味著它無法讀取該記錄(因為默認隔離級別是REPEATABLE READ)。
它查看R1中的DB_ROLL_PTR并找到撤消日志記錄。 使用撤消日志記錄構建R1的先前版本。
它讀取了這個構建的舊版R1。 請注意,此版本在聚簇索引記錄中不可用。 但它使用撤消記錄即時構建。
當R1指向新的LOB時,這個構造的舊版本的R1指向舊的LOB。 所以結果包含舊的LOB。

這是LOB的MVCC在不涉及部分更新時的工作方式。

MVCC部分更新

讓我們看另一個例子,了解MVCC在部分更新的情況下是如何工作的。 我們需要另一個例子,因為目前僅通過函數json_set()和json_replace()支持JSON文檔的部分更新。

 create table t2 ( f1 int primary key , j json ) engine = InnoDB ; 
 set @ elem_a = concat ( '"' , repeat ( 'a' , 200 ) , '"' ) ; 
 set @ elem_a_with_coma = concat ( @ elem_a , ',' ) ; 
 set @ json_doc = concat ( "[" , repeat ( @ elem_a_with_coma , 300 ) , @ elem_a , "]" ) ; 
 
 insert into t2 ( f1 , j ) values ( 1 , @ json_doc ) ; 
 
 start transaction ; 
 update t2 set j = json_set ( j , '$[200]' , repeat ( 'b' , 200 ) ) where f1 = 1 ; 
 
 -- echo # Connection con1: 
 connect ( con1 , localhost , root , , ) ; 
 -- echo # Must see the old value 'aaaaaaaaaa...' 
 select json_extract ( j , '$[200]' ) from t2 ; 
 
 -- echo # Connection default: 
 connection default ; 
 disconnect con1 ; 
 commit ; 

該場景與前面的示例相同。 只是longblob字段已更改為JSON文檔。 加載的數據也略有不同,以符合JSON格式。

提示 :您可以在上述mtr測試用例(兩者中)中添加語句set debug ='+ d,innodb_lob_print' ,以在服務器日志文件中打印LOB索引。 LOB索引將在插入后立即打印。 LOB索引將為您提供存儲的LOB對象的結構。
在部分更新操作之前

完全或部分更新操作之前的初始條件是相同的,并且已經在上面給出。 但是在下圖中,提供了一些附加信息。

讓我們看看圖中顯示的其他信息:

存儲在聚簇索引記錄中的LOB引用現在包含LOB版本號v1。 在初始插入操作期間,將其設置為1,并在每次部分更新時遞增。
每個LOB數據頁面在LOB索引中都有一個條目。 每個條目都包含LOB版本信息。 每當修改一個LOB數據頁時,它將被復制到具有新數據的新LOB數據頁中,并且將創建具有遞增的LOB版本號的新LOB索引條目。

附加信息是LOB版本號。 這在聚集索引記錄中的LOB引用中以及LOB索引的每個條目中都可用。

部分更新操作后

下圖說明了部分更新操作后的情況。

這里最重要的優化是用戶表空間中仍然只有一個LOB。 僅更新需要修改的那些LOB數據頁。 部分更新操作后的這個單個LOB包含舊版本和新版本的LOB。 圖中LOB數據頁面上的v1和v2標簽說明了這一點。

另一個重要的觀察是撤消日志和聚簇索引記錄中的LOB引用指向同一個LOB。 但LOB引用包含不同的版本號。 撤消日志記錄中的LOB引用包含v1(舊版本號),聚簇索引記錄中的LOB引用包含新版本號v2。

LOB版本號的目的

如上所示,具有不同版本號的不同LOB引用指向相同的LOB。 單個LOB包含來自不同版本的部分。 LOB版本號用于獲取各種LOB引用指向的正確版本。 在本節中,我們將了解如何完成此操作。

LOB索引包含組成LOB的LOB頁面列表。 它包含LOB數據頁的頁碼,每個LOB數據頁包含的數據量以及版本號。 此列表的每個節點稱為LOB索引條目。 每個LOB索引條目都包含舊版本的列表。 讓我們看一個說明上述部分更新測試用例的結構的圖。

最初,在完成部分更新之前,LOB索引總共包含4個條目。 四個條目的頁碼是5,6,7和8.沒有LOB索引條目具有舊版本。 所有四個條目的版本號均為1。

部分更新完成后,我們注意到頁碼9已替換頁碼7,頁碼7現在被視為頁碼9的舊版本。頁碼9的版本號為2,并且頁碼7的版本號為1。

部分更新完成后,當通過版本號為1的LOB引用訪問LOB時,將查看第5頁的第一個索引條目。 它的版本號為1.如果索引條目中的版本號小于或等于 LOB引用中的版本號,則將讀取該條目。 因此,將讀取第5頁。 然后將查看頁碼為6的索引條目。 它的版本號為1,因此將被讀取。 然后將查看頁碼為9的索引條目。 它的版本號為2.但是lob引用的版本號為1.如果索引條目中的版本號大于LOB引用中的版本號,則不會讀取該條目。 由于頁碼9的條目具有版本2,因此將查看其舊版本。 將檢查頁碼為7的索引條目。 它的版本號為1,因此將被讀取。 在此之后,將檢查頁碼為8的索引條目。 它的版本號為1,因此也將被讀取。 這是訪問舊版LOB的方式。

部分更新完成后,當通過版本號為2的LOB引用訪問LOB時,將查看第5頁的第一個索引條目。 它的版本號為1.如果索引條目中的版本號小于或等于LOB引用中的版本號,則將讀取該條目。 因此它將按順序讀取頁碼5,6,9,8。 由于版本號始終<= 2,因此無需使用舊版本訪問頁碼7。

需要記住的一點是LOB在InnoDB中不是獨立存在的。 它被視為聚簇索引記錄的擴展。LOB對事務是否可見并不由LOB模塊處理。 LOB模塊只是處理聚簇索引記錄。 如果事務訪問LOB,則意味著它已經在聚簇索引記錄中的DB_TRX_ID的幫助下確定它可以查看LOB(而不是LOB的特定版本)。 所以我們不擔心LOB模塊中的那個方面。 我們只專注于為給定的LOB版本號提供正確的內容。

結論

在本文中,我們了解了如何在InnoDB中為大對象完成MVCC。 當對LOB進行部分更新時,多個LOB引用可以指向同一個LOB。 但他們將擁有不同的版本號。 使用這些LOB版本號,可以訪問正確的LOB內容。

希望您發現此信息有用。

謝謝你使用MySQL!

注釋:

(1) Mtr即Mini-transaction的縮寫,字面意思小事物,相對邏輯事物而言,我們把它稱作物理事物。屬于Innodb存儲引擎的底層模塊。主要用于鎖和日志信息。

總結

以上就是這篇文章的全部內容了,希望本文的內容對大家的學習或者工作具有一定的參考學習價值,如果有疑問大家可以留言交流,謝謝大家對腳本之家的支持。

相關文章

  • 分析Mysql表讀寫、索引等操作的sql語句效率優化問題

    分析Mysql表讀寫、索引等操作的sql語句效率優化問題

    今天小編就為大家分享一篇關于分析Mysql表讀寫、索引等操作的sql語句效率優化問題,小編覺得內容挺不錯的,現在分享給大家,具有很好的參考價值,需要的朋友一起跟隨小編來看看吧
    2018-12-12
  • 如何查看MySQL連接的root密碼

    如何查看MySQL連接的root密碼

    前幾天在用Navicat去連本地的MySQL的時候發現我已經忘了密碼了,試了網上很多方式都不行…后來發現其實可以自己直接去看當初設置的密碼,下面將方法總結出來分享給大家,有需要的朋友們可以參考借鑒,下面來一起看看吧。
    2017-01-01
  • MySQL如何清空慢查詢文件

    MySQL如何清空慢查詢文件

    這篇文章主要介紹了MySQL如何清空慢查詢文件,如何在線生成一個新的慢查詢文件,感興趣的小伙伴們可以參考一下
    2015-12-12
  • MySQL DNS的使用過程詳細分析

    MySQL DNS的使用過程詳細分析

    當 mysql 客戶端連接 mysql 服務器 (進程為:mysqld),mysqld 會創建一個新的線程來處理該請求。該線程先檢查是否主機名在主機名緩存中
    2012-11-11
  • 忘記MySQL的root密碼該怎么辦

    忘記MySQL的root密碼該怎么辦

    忘記密碼總是一件令人頭疼的事情,當我們忘記了MySQL的root密碼該怎么辦?本文給出解決方法,感興趣的小伙伴們可以參考一下
    2016-05-05
  • MySQL子查詢用法實例分析

    MySQL子查詢用法實例分析

    這篇文章主要介紹了MySQL子查詢用法,結合實例形式對比分析了MySQL子查詢的設置技巧,需要的朋友可以參考下
    2016-04-04
  • mysql優化配置參數

    mysql優化配置參數

    mysql安裝好需要優化配置一下,打開c:\windows\my.ini文件
    2011-03-03
  • mysql修改自增長主鍵int類型為char類型示例

    mysql修改自增長主鍵int類型為char類型示例

    這篇文章主要介紹了mysql修改自增長主鍵int類型為char類型示例,需要的朋友可以參考下
    2015-04-04
  • MySQL創建帶特殊字符的數據庫名稱方法示例

    MySQL創建帶特殊字符的數據庫名稱方法示例

    這篇文章主要給大家介紹了MySQL創建帶特殊字符的數據庫名稱方法,文中給出了詳細的示例代碼,需要的朋友可以參考學習,下面來一起看看吧。
    2017-03-03
  • MYSQL中統計查詢結果總行數的便捷方法省去count(*)

    MYSQL中統計查詢結果總行數的便捷方法省去count(*)

    查看手冊后發現SQL_CALC_FOUND_ROWS關鍵詞的作用是在查詢時統計滿足過濾條件后的結果的總數(不受 Limit 的限制)具體使用如下,感興趣的朋友可以學習下
    2013-07-07

最新評論

码报108