麒麟v10 上部署 TiDB v5.1.2 生产环境优化实践
1123
2023-07-07
mysql怎么设置字符集
一、字符集的概念
字符集规范了代码与字符之间的映射关系,指定了计算机字符的编码方式。不同数据库系统中的字符集设置可能不同,而不同字符集之间有独特的特点和优势。相较于Latin1/Latin7,GB2312/GBK/GB18030在处理汉字方面具有更大的优势。
在MySQL中,字符集指的是编码字符数据的方式,包括数据库、表和列。通俗地说,字符集就是指用来存储和处理字符、字符串的方式。
MySQL中支持的字符集主要有如下几种:ASCII、GBK、GB2312、UTF-8、UTF-16和ISO-8859等,其中UTF-8是MySQL最常用的字符集,因为它支持多语言、编码格式灵活、节省空间等好处。
二、MySQL字符集的设置方法
查询MySQL支持的字符集
在MySQL数据库中,可以通过命令查询数据库支持的字符集,方法如下:
SHOW CHARACTER SET;
该命令可以列出MySQL可用的各种字符集,例如:
Charset | Description | Default collation | Maxlen |
---|---|---|---|
big5 | Big5 Traditional Chinese | big5_chinese_ci | 2 |
dec8 | DEC West European | dec8_swedish_ci | 1 |
cp850 | DOS West European | cp850_general_ci | 1 |
hp8 | HP West European | hp8_english_ci | 1 |
koi8r | KOI8-R Relcom Russian | koi8r_general_ci | 1 |
latin1 | iso-8859-1 West European | latin1_swedish_ci | 1 |
latin2 | iso-8859-2 Central European | latin2_general_ci | 1 |
swe7 | 7bit Swedish | swe7_swedish_ci | 1 |
ascii | US ASCII | ascii_general_ci | 1 |
ujis | EUC-JP Japanese | ujis_japanese_ci | 3 |
sjis | Shift-JIS Japanese | sjis_japanese_ci | 2 |
hebrew | iso-8859-8 Hebrew | hebrew_general_ci | 1 |
tis620 | TIS620 Thai | tis620_thai_ci | 1 |
euckr | EUC-KR Korean | euckr_korean_ci | 2 |
koi8u | KOI8-U Ukrainian | koi8u_general_ci | 1 |
gb2312 | GB2312 Simplified Chinese | gb2312_chinese_ci | 2 |
greek | iso-8859-7 Greek | greek_general_ci | 1 |
cp1250 | Windows Central European | cp1250_general_ci | 1 |
gbk | GBK Simplified Chinese | gbk_chinese_ci | 2 |
latin5 | iso-8859-9 Turkish | latin5_turkish_ci | 1 |
armscii8 | ARMSCII-8 Armenian | armscii8_general_ci | 1 |
utf8 | UTF-8 Unicode | utf8_general_ci | 3 |
ucs2 | UCS-2 Unicode | ucs2_general_ci | 2 |
cp866 | DOS Russian | cp866_general_ci | 1 |
keybcs2 | DOS Kamenicky Czech-Slovak | keybcs2_general_ci | 1 |
macce | Mac Central European | macce_general_ci | 1 |
macroman | Mac West European | macroman_general_ci | 1 |
cp852 | DOS Central European | cp852_general_ci | 1 |
latin7 | iso-8859-13 Baltic | latin7_general_ci | 1 |
utf8mb4 | UTF-8 Unicode | utf8mb4_general_ci | 4 |
cp1251 | Windows Cyrillic | cp1251_general_ci | 1 |
utf16 | UTF-16 Unicode | utf16_general_ci | 4 |
utf16le | UTF-16LE Unicode | utf16le_general_ci | 4 |
cp1256 | Windows Arabic | cp1256_general_ci | 1 |
cp1257 | Windows Baltic | cp1257_general_ci | 1 |
utf32 | UTF-32 Unicode | utf32_general_ci | 4 |
binary | Binary pseudo charset | binary | 1 |
geostd8 | GEOSTD8 Georgian | geostd8_general_ci | 1 |
cp932 | SJIS for Windows Japanese | cp932_japanese_ci | 2 |
eucjpms | UJIS for Windows Japanese | eucjpms_japanese_ci | 3 |
设置数据库的字符集
当我们新建一个MySQL数据库时,可以设置该数据库的默认字符集,这样所有该数据库中的表的字符集都将使用该字符集。具体操作步骤如下:
2.1 首先查看MySQL支持的字符集
mysql> SHOW CHARACTER SET;
2.2 在创建新的数据库时,添加一个字符集设定
CREATE DATABASE new_db CHARACTER SET utf8;
或者
The following sentence is rewritten:"Create a new database called 'new_db' with a default character set of utf8."
其中utf8为常用字符集之一。
设置 MySQL 表的字符集
为了确保表格可以正确的存储和展示数据,我们需要为表格设置字符编码。在 MySQL 中,表的字符集可以通过在创建表时进行设置。可以使用 ALTER 命令对已创建的表进行修改。
3.1 在创建表时设置字符集
CREATE TABLE new_table ( id INT(11) NOT NULL AUTO_INCREMENT, name VARCHAR(50) NOT NULL DEFAULT '', PRIMARY KEY (id)) ENGINE=InnoDB DEFAULT CHARSET=utf8;
用于设置表的存储引擎的是ENGINE=InnoDB,而用于设置表的默认字符集的是CHARSET=utf8。
3.2 修改表的字符集
ALTER TABLE old_table CONVERT TO CHARACTER SET utf8;
或者
ALTER TABLE old_table MODIFY COLUMN name VARCHAR(50) CHARACTER SET utf8;
其中,CONVERT TO命令用于修改表的默认字符集,MODIFY COLUMN命令用于修改表中某一列的字符集。
设置 MySQL 连接的字符集
在连接 MySQL 服务器时,也可以设置操作的字符集。通常称为“客户端字符集”的字符集设定,指的是在客户端传输的数据所使用的字符集。
4.1 查看当前连接的字符集
mysql> SELECT @@character_set_connection;
4.2 修改连接的字符集
SET character_set_connection = utf8;
或者
mysql --default-character-set=utf8 -u root -p
其中,SET命令可以修改连接的默认字符集,--default-character-set命令可以指定客户端字符集。
其他的字符集设定
有些情况下,为了处理一些不太常见的数据存储和转换需求,可能需要启用 MySQL 的其他字符集设置。在这种情况下,可能需要以管理员权限修改MySQL的配置文件——my.cnf文件。修改方法如下:
5.1 找到 my.cnf 文件
在Linux中,my.cnf文件通常存储在 /etc/my.cnf 或 /etc/mysql/my.cnf 目录下。
在Windows中,my.cnf文件通常存储在 MySQL 数据库的安装目录下。
5.2 修改 my.cnf 文件
在 my.cnf 文件中添加如下语句:
[mysqld]character_set_server=utf8init_connect='SET NAMES utf8'
其中,character_set_server命令用于设置列出来的字符集,init_connect命令用于在创建连接时自动设定字符集。
版权声明:本文内容由网络用户投稿,版权归原作者所有,本站不拥有其著作权,亦不承担相应法律责任。如果您发现本站中有涉嫌抄袭或描述失实的内容,请联系我们jiasou666@gmail.com 处理,核实后本网站将在24小时内删除侵权内容。