佳木斯湛栽影视文化发展公司

主頁 > 知識庫 > MySQL插入emoji表情失敗問題的解決方法

MySQL插入emoji表情失敗問題的解決方法

熱門標簽:呼叫中心市場需求 服務(wù)外包 AI電銷 地方門戶網(wǎng)站 Linux服務(wù)器 鐵路電話系統(tǒng) 網(wǎng)站排名優(yōu)化 百度競價排名

前言

之前一直認為UTF-8是萬能的字符集問題解決方案,直到最近遇到這個問題。最近在做新浪微博的爬蟲, 在存庫的時候發(fā)現(xiàn)只要保持emoji表情,就回拋出以下異常:

Incorrect string value: '\xF0\x90\x8D\x83\xF0\x90...'

眾所周知UTF-8是3個字節(jié), 其中已經(jīng)包括我們?nèi)粘D芤娺^的絕大多數(shù)字體. 但3個字節(jié)遠遠不夠容納所有的文字, 所以便有了utf8mb4, utf8mb4是utf8的超集, 占4個字節(jié), 向下兼容utf8. 我們?nèi)粘S玫膃moji表情就是4個字節(jié)了.

所以在此我們像utf8的數(shù)據(jù)表插入數(shù)據(jù)就會報出Incorrect string value這個錯誤.

Google一下很容易就找到了解決方案, 具體解決辦法是如下:

一、修改數(shù)據(jù)表的字符集為utf8mb4

這點很簡單, 修改語句網(wǎng)上找一大堆, 不過建議重新建表, 使用 mysqldump -uusername -ppassword database_name table_name > table.sql 備份相應(yīng)數(shù)據(jù)表, 并修改其中的建表語句的字符集為 utf8mb4 即可, 然后 mysql -uusername -ppassword database_name table.sql 重新導(dǎo)入sql即可完成修改字符集操作.

二、MySQL數(shù)據(jù)庫版本要5.5.3及以上

網(wǎng)絡(luò)上所有的文章都說明要MySQL 5.5.3以上的版本才支持utf8mb4, 不過我使用的數(shù)據(jù)庫版本為5.5.18, 最終仍能解決問題, 所以同學(xué)們不要急著找運維哥哥升級數(shù)據(jù)庫先, 先試試能不能自己解決問題.

三、修改數(shù)據(jù)庫配置文件/etc/my.cnf并重啟mysql服務(wù)

主要是修改數(shù)據(jù)庫的默認字符集, 以及連接, 查詢的字符集, [Mysql支持emoji 表情符號 升級編碼為UTF8MB4][1] 這篇文章有詳細的設(shè)置方法, [深入Mysql字符集設(shè)置][2] 這篇文章有其中設(shè)置的各個字符集的作用, 大家可以科普下.

四、升級MySQL Connector到5.1.21及以上

以上所有的操作, 最關(guān)鍵的是步驟3, 修改數(shù)據(jù)庫的配置文件, 其中大概修改了

[client]
# 客戶端來源數(shù)據(jù)的默認字符集
default-character-set = utf8mb4
[mysqld]
# 服務(wù)端默認字符集
character-set-server=utf8mb4
# 連接層默認字符集
collation-server=utf8mb4_unicode_ci
[mysql]
# 數(shù)據(jù)庫默認字符集
default-character-set = utf8mb4

這些配置指定了數(shù)據(jù)從客戶端到服務(wù)端所經(jīng)過的一條條管道使用的字符集, 其中每一個管道出現(xiàn)問題都可能會導(dǎo)致插入失敗或者亂碼.

但很多時候, 線上的數(shù)據(jù)庫是不能隨便修改數(shù)據(jù)庫文件的, 所以我們的運維同學(xué)很果斷的回絕了我修改數(shù)據(jù)庫配置文件的請求(T_T)

所以就只能用代碼解決了, 一開始是準備從JDBC連接時候就指定使用的字符集處下手.

jdbc:mysql://localhost:3306/ding?characterEncoding=UTF-8

主要把UTF-8修改為utf8mb4對于的Java Style Charset字符串應(yīng)該就能解決問題吧?

不過很遺憾的是, Java JDBC并不存在utf8mb4對于的字符集. 使用UTF-8的時候可以兼容urf8mb4并自動轉(zhuǎn)換字符集.

For example, to use 4-byte UTF-8 character sets with Connector/J, configure the MySQL server with character_set_server=utf8mb4, and leave characterEncoding out of the Connector/J connection string. Connector/J will then autodetect the UTF-8 setting. – [MySQL:Using Character Sets and Unicode][3]

后來科普了一下, 在每一次查詢請求的時候, 可以顯式的指定使用的字符集, 使用 set names utf8mb4 可以指定本次鏈接的字符集為utf8mb4, 但這個設(shè)置在每次連接被釋放后都會失效.

目前的解決辦法是, 在需要插入utf8mb4的時候, 顯示地調(diào)用執(zhí)行set names utf8mb4, 如:

jdbcTemplate.execute("set names utf8mb4");
jdbcTempalte.execute("...");

需要注意的是, 我們在使用一下ORM框架的時候, 因為性能優(yōu)化原因, 框架會延遲提交, 除非事務(wù)結(jié)束或者用戶主動調(diào)用強制提交, 負責(zé)執(zhí)行的set names utf8mb4仍然不會生效.

在這里我使用的是myBatis, 以MessageDao為例

// MessageDao
public interface MessageDao {
 @Update("set names utf8mb4")
 public void setCharsetToUtf8mb4();
 @Insert("insert into tb_message ......")
 public void insert(Message msg);
}
// test code
SqlSession sqlSession = sqlSessioFactory.openSession();
messageDao = sqlSession.getMapper(MessageDao.class);
messageDao.setCharsetToUtf8mb4();
// 強制提交
sqlSession.commit();
messageDao.insert(message);

至此, 問題便解決了..

哎, 如果世事能那么順利就好了, 在項目中, mybatis是實例是交由Spring去管理的, 也就是說我拿不到sqlSession, 也就是強制提交不了. 并且因為Spring事務(wù)框架的限制, 他并不允許用戶顯式調(diào)用強制提交. 目前還在糾結(jié)這個問題.

有兩個解決思路:

  • 使用AOP, 在可能插入4字節(jié)UTF8字符的時候, 前置方法執(zhí)行set names utf8mb4, 但該方案還不能確定AOP的方法會被Spring進行事務(wù)管理么, 并且在前置方法中,拿到的鏈接是否和接下來拿到的連接對象是同一個session.
  • 研究Spring JDBC的創(chuàng)建方法, 寫一個hook在每次創(chuàng)建新的數(shù)據(jù)庫連接的時候, 都執(zhí)行一次set names utf8mb4, 這樣就保證每一次拿到的鏈接都是設(shè)置過字符集的.

總結(jié)

以上就是這篇文章的全部內(nèi)容了,待有時間再實驗一下以上兩種方案。希望本文的內(nèi)容對大家的學(xué)習(xí)或者工作能帶來一定的幫助,如果有疑問大家可以留言交流,謝謝大家對腳本之家的支持。

您可能感興趣的文章:
  • mysql存儲emoji表情步驟詳解
  • mysql中插入emoji表情失敗的原因與解決
  • MySQL無法存儲emoji表情解決方案分析
  • mysql存儲emoji表情報錯的處理方法【更改編碼為utf8mb4】
  • MySQL無法存儲Emoji表情問題的解決方法分析
  • 讓Java后臺MySQL數(shù)據(jù)庫能夠支持emoji表情的方法
  • 使MySQL能夠存儲emoji表情字符的設(shè)置教程
  • MySQL如何插入Emoji表情

標簽:崇左 黃山 衡水 蘭州 銅川 湘潭 湖南 仙桃

巨人網(wǎng)絡(luò)通訊聲明:本文標題《MySQL插入emoji表情失敗問題的解決方法》,本文關(guān)鍵詞  ;如發(fā)現(xiàn)本文內(nèi)容存在版權(quán)問題,煩請?zhí)峁┫嚓P(guān)信息告之我們,我們將及時溝通與處理。本站內(nèi)容系統(tǒng)采集于網(wǎng)絡(luò),涉及言論、版權(quán)與本站無關(guān)。
  • 相關(guān)文章
  • 收縮
    • 微信客服
    • 微信二維碼
    • 電話咨詢

    • 400-1100-266
    丰都县| 沅陵县| 固阳县| 潜江市| 那曲县| 永胜县| 彭水| 基隆市| 定襄县| 叙永县| 兴山县| 山阳县| 紫云| 岳西县| 册亨县| 清水河县| 梁河县| 万全县| 广宗县| 呼和浩特市| 吉隆县| 隆化县| 克什克腾旗| 平远县| 丰顺县| 临清市| 南部县| 玉树县| 堆龙德庆县| 米林县| 石台县| 云林县| 奉节县| 建平县| 喜德县| 巨野县| 西丰县| 德州市| 莱阳市| 寿光市| 大丰市|