精品国产人成在线_亚洲高清无码在线观看_国产在线视频国产永久2021_国产AV综合第一页一个的一区免费影院黑人_最近中文字幕MV高清在线视频

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

MySQL編碼機制原理

數據分析與開發 ? 來源:數據分析與開發 ? 2024-11-09 11:01 ? 次閱讀

前言

一位讀者在本地部署 MySQL 測試環境時碰到一個問題,我覺得挺有代表性的,所以寫篇文章介紹一下,看完相信你會對 MySQL 的編碼機制有最本質的了解,本文的目錄結構如下

讀者問題簡介

MyQL 編解碼機制介紹

問題解答

讀者問題簡介

為敘述方便,以下的「我」指代讀者

我們知道在 Java 中是通過 JDBC 來訪問數據庫的,以訪問 MySQL 為例,需要配置以下 url 才能訪問 MySQL

jdbc//10.65.110.9:3306/test?connectTimeout=5000&socketTimeout=20000

這樣配置之前在我司的測試環境中 CRUD 是沒有問題的,但是后來想在個人的機器上部署一下 MySQL 環境就出問題了,首先為了保證數據的完整性,我將公司測試機的 SQL 全部導出后再導入到個人的 MySQL 環境中,但是詭異的事情發生了:此時在 Java 工程中如果查詢的 SQL 中都是英文是可以正常工作的,但如果包含中文(比如 SELECT * FROM USER WHERE name = '張三')是無法查詢到結果的。

碰到這種情況,一般我們會想到是編碼轉換出現了問題,相信聰明你不難發現上面的 jdbc url 似乎少了點什么,沒錯,就是沒有指定編碼方式,只要按如下方式指定了編碼方式(characterEncoding=UTF-8)即可正常工作

jdbc//10.65.110.9:3306/test?connectTimeout=5000&socketTimeout=20000&characterEncoding=UTF-8

至此問題也就解決了,但奇怪的是之前為什么沒指定編碼方式也是可以的呢,應該是 server 指定了編碼方式,在哪指定的?要回答這個問題,就必須得對 MySQL 的編碼機制有所了解

MyQL 編解碼機制介紹

我們先來看看 MySQL 中涉及到哪些編碼流程,假設客戶端用的是 UTF-8 編碼,那么發送一條 SQL 語句會發生如下的編解碼流程:

835f57f0-9044-11ef-a511-92fbcf53809c.png

假設此時的客戶端為 Java 工程,用的是 intellj idea,其默認編碼為 UTF-8,那么執行后這條語句會首先被 UTF-8 編碼,然后再將其轉成 unicode,在 Java 中所有的 String 都是以 unicode 字符存在的,然后再將 unicode 轉為用 character_set_client 來編碼

character_set_client 編碼后是以二進制流的形式傳到 MySQL 服務器的,然后再用 character_set_connection 解碼,然后 MySQL 引擎(比如 innodDB 引擎)會對這條語句進行語法,詞法解析,執行操作

執行后的結果會轉為 DB 的編碼入庫

如果是 SELECT * FROM t 這樣的查詢操作,那么數據會從 DB 中解碼后再用 character_set_connection 編碼,再轉為用 character_set_result 編碼傳給客戶端,客戶端再用 UTF-8 解碼得到正常結果

先簡單介紹一下上述步驟中涉及到的編碼集

character_set_client: 客戶端最終發送到服務端 SQL 所采用的編碼字符集

character_set_connection: MySQL 服務端收到步驟 1 編碼后的二進制流后采用的編碼字符集,會將步驟 1 傳過來的數據進行解碼。一般與 character_set_client 是一樣的,有人可能會奇怪,為什么會有這個字符集,直接用 character_set_client 來解碼不就行了,它存在的意義是啥呢?其實主要是為了作用上的的分離,character_set_client 主要用來客戶端的編碼,而 character_set_connection 主要是為了賦予開發人員解析語義的自由,比如考慮 SELECT LENGTH('中') 這樣的場景,如果采用 GBK 一個漢字 2 個長度,結果是 2,而如果是 UTF-8 編碼,則結果是 3,所以額外設定一個 character_set_connection 編碼,讓開發人員可以根據需要更自由地定義不同的業務場景

character_set_result: 結果集返回給客戶端采用的編碼字符集

知道了以上各個字符編碼集所代表的釋義,現在就可以輕松解釋開頭的問題了,我們知道對 MySQL 來說,操作無非就是增刪改查,所以主要有以下兩個轉化流程

如果是增刪改操作,流程為:客戶端--->character_set_client--->character_set_connection---->DB

如果是查操作,客戶端--->character_set_client--->character_set_connection---->DB---->character_set_result

如果這兩個轉化流程對應的每一步都是無損轉換,那么結果集就沒有問題的

什么是無損轉換

假設我們要把用編碼 A 表示的字符 X,轉化為編碼 B 的表示形式,而編碼 B 的字符集中并沒有 X 這個字符,那么此時我們就稱這個轉換是有損的,如果在 B 的字符集都能找到 A 中的字符,那么就是無損的,所以最簡單的方式就是將每個步驟對應的編碼字符集都設置成一樣的,比如都設置成 UTF-8,這樣就肯定沒問題了。

開頭的問題解答

現在回過頭來看一下開頭的問題,為什么將 DB 數據從公司的測試機導入到個人機器后,如果 SQL 中包含有中文查詢如下 jdbc url 的配置會導致原本正常返回的結果集失效呢?

jdbc//10.65.110.9:3306/test?connectTimeout=5000&socketTimeout=20000

顯然是客戶端--->character_set_client--->character_set_connection---->DB---->character_set_result 這個步驟中的結果集發生了有損轉換,到底是哪一步呢?

DB 表數據采用的編碼都是 UTF-8,如果只要搞清楚 character_set_client,character_set_connection,character_set_result 這三個編碼字符集是啥問題就解決了,這個問題的答案得去官網找,來看下官網是怎么說的

The character encoding between client and server is automatically detected upon connection (provided that the Connector/J connection properties characterEncoding and connectionCollation are not set). You specify the encoding on the server using the system variable character_set_server (for more information, see Server Character Set and Collation). The driver automatically uses the encoding specified by the server.

To override the automatically detected encoding on the client side, use the characterEncoding property in the connection URL to the server. Use Java-style names when specifying character encodings. The following table lists MySQL character set names and their corresponding Java-style names:

從中我們可以看到,如果未設置 characterEncoding,那么 character_set_client,character_set_connection,character_set_result 這三的編碼字符集與 character_set_server 的設置相同,如果設置了 characterEncoding,那么這三者的值與 characterEncoding 相同,這就是為什么指定了characterEncoding=utf8后 SQL 能正常工作的原因了,

那為什么不指定 characterEncoding=utf8 在公司的測試 MySQL 服務器中可以正常工作呢,顯然是設置了 character_set_server,在哪設置?在 MySQL 的配置文件 my.cnf 設置

##my.cnf

[mysqld]
character-set-server=utf8

再來看為什么在個人的測試機中包含有中文的 SQL 卻不生效呢,因為個人的測試機當時用 docker 搭了一個 MySQL,它的 my.cnf 文件是空的,這種情況下 character-set-server 編碼字符集是 latin,于是 character_set_client,character_set_connection,character_set_result 這三者的編碼字符集也都為 latin 了,顯然在第一步客戶端轉 chacacter_set_client 就出現了問題

8380b0da-9044-11ef-a511-92fbcf53809c.png

我們之前提過在 Java 中所有的字符串都以 unicode 形式存在,而 latin 字符集是不包含中文的,那么顯然中文的 unicode 在 latin1 中是找不到對應的字符的,這一步就會發生有損編碼,這就是為什么在個人的機器上執行帶有中文的 SQL 會出異常的根本原因!

所以問題的根因本質上是因為遷移不完整導致的,只遷移了 DB 數據,但沒有把 my.cnf 這個配置文件也完整地拷過來!拷過來之后問題就解決了

總結

知道了 MySQL 編解碼機制,之后再碰到類似的問題就比較簡單了,比如亂碼,顯然就是上述步驟中的步驟發生了有損編碼

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 編碼
    +關注

    關注

    6

    文章

    935

    瀏覽量

    54760
  • MySQL
    +關注

    關注

    1

    文章

    801

    瀏覽量

    26439

原文標題:五分鐘看懂 MySQL 編解碼原理

文章出處:【微信號:DBDevs,微信公眾號:數據分析與開發】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    基于MySQL的鎖機制

    在數據庫系統中,為了保證數據的一致性和并發控制,鎖機制發揮著至關重要的作用。尤其在關系型數據庫MySQL中,其獨特的鎖機制設計更是贏得了許多開發者的喜愛。 本文將詳細探討MySQL的鎖
    的頭像 發表于 09-30 11:16 ?846次閱讀

    labview 在mysql數據庫存中文亂碼問題

    誰知道labview 在mysql數據庫存中文怎么存,mysql 數據庫已經設置utf-8編碼了,添加中文進去還是亂碼!
    發表于 12-06 20:23

    mysql連接labview字符編碼問題

    mysql和labview的字符編碼怎么統一啊,labview默認的編碼是什么,mysql那邊要怎么設置字符編碼,設置哪個,有誰知道嗎,告訴
    發表于 05-11 13:08

    0基礎學Mysql:mysql入門視頻教程!

    0基礎學Mysql:mysql入門視頻教程!目前MySQL技術雖然在國內發展了許多年,但是一直都沒有形成一個專門的學科,MySQL的數據庫,在很多中小企業的流行做法就是讓程序員來管。但
    發表于 07-08 10:51

    mysql中文手冊

    1 MySQL的一般的信息 1.1 什么是MySQL? 1.2 關于本手冊 1.2.1 本手冊中使用的約定 1.3 MySQL的歷史 1.4 MySQL的主要特征 1.5
    發表于 12-26 13:27 ?83次下載

    PHP/MySQL教程

    PHP/MySQL教程(一)  PHP/MySQL教程(二)  PHP/MySQL教程(三)  PHP/MySQL教程(四)  PHP/
    發表于 01-10 23:43 ?0次下載

    網絡編碼的無線網絡分布式協作通信機制

    本文提出了一種基于無線網絡編碼的協作通信機制NCCC.無線網絡編碼能夠在取得合作分集的性能增益的同時,降低網絡中斷概率.分布式中繼節點選擇算法是NCCC機制的核心,該算法根
    發表于 03-20 17:10 ?26次下載

    基于協作MIMO機制的預編碼算法

    基于協作MIMO機制的預編碼算法.....
    發表于 01-04 15:26 ?0次下載

    MySQL 5.7與MySQL 8.0 性能對比

    背景 測試mysql5.7和mysql8.0分別在讀寫,選定,只寫模式下不同并發時的性能(tps,qps) 最早 測試使用版本為mysql5.7.22和mysql8.0.15 sysb
    的頭像 發表于 11-03 09:26 ?1.7w次閱讀
    <b class='flag-5'>MySQL</b> 5.7與<b class='flag-5'>MySQL</b> 8.0 性能對比

    MySQL各存儲引擎使用了三種類型的鎖定機制

    MySQL數據庫由于其自身架構的特點,存在多種數據存儲引擎,每種存儲引擎的鎖定機制都是為各自所面對的特定場景而優化設計,所以各存儲引擎的鎖定機制也有較大區別。
    的頭像 發表于 11-17 14:09 ?2147次閱讀
    <b class='flag-5'>MySQL</b>各存儲引擎使用了三種類型的鎖定<b class='flag-5'>機制</b>

    探討MySQL的復制機制實現的方式

    MySQL Replication(主從復制)是指數據變化可以從一個MySQL Server被復制到另一個或多個MySQL Server上,通過復制的功能,可以在單點服務的基礎上擴充數據庫的高可用性、可擴展性等。
    的頭像 發表于 04-12 09:29 ?664次閱讀

    id的機制不同在mysql的索引結構以及優缺點

    ? 前言 一、mysql和程序實例 1.1.要說明這個問題,我們首先來建立三張表 1.2.光有理論不行,直接上程序,使用spring的jdbcTemplate來實現增查測試: 1.3.程序寫入結果
    的頭像 發表于 06-30 10:19 ?780次閱讀
    id的<b class='flag-5'>機制</b>不同在<b class='flag-5'>mysql</b>的索引結構以及優缺點

    MYSQL事務的底層原理詳解

    在事務的實現機制上,MySQL 采用的是 WAL:Write-ahead logging,預寫式日志,機制來實現的。
    的頭像 發表于 11-15 10:10 ?549次閱讀
    <b class='flag-5'>MYSQL</b>事務的底層原理詳解

    mysql數據庫默認字符編碼是什么

    MySQL數據庫的默認字符編碼是utf8mb4。下面我將詳細介紹MySQL數據庫的字符編碼相關知識,并展開討論相應的配置、應用和注意事項。 一、My
    的頭像 發表于 11-16 14:50 ?1539次閱讀

    一文了解MySQL索引機制

    接觸MySQL數據庫的小伙伴一定避不開索引,索引的出現是為了提高數據查詢的效率,就像書的目錄一樣。 某一個SQL查詢比較慢,你第一時間想到的就是“給某個字段加個索引吧”,那么索引是什么?是如何工作
    的頭像 發表于 07-25 14:05 ?240次閱讀
    一文了解<b class='flag-5'>MySQL</b>索引<b class='flag-5'>機制</b>