MySQL-字符集(charset)和校对规则(collation)

avatar
作者
猴君
阅读量:0

1 需求


2 接口


3 collation

在 MySQL 中,如果你想在创建表之前统一设置 collation(字符集校对规则),你通常可以在创建表的时候为每个字段明确指定 collation,或者你可以在数据库级别或表级别设置默认的 collation。

1. 数据库级别设置默认 collation

当你创建一个新的数据库时,可以指定默认的字符集和 collation。这会影响在该数据库中创建的所有表(除非在表级别另行指定)。

CREATE DATABASE mydatabase CHARACTER SET utf8mb4 COLLATE utf8mb4_unicode_ci;

在这个例子中,utf8mb4 是字符集,而 utf8mb4_unicode_ci 是 collation。

2. 表级别设置默认 collation

在创建表时,你可以为整个表设置默认的字符集和 collation。然后,你可以为表中的每个字段单独指定 collation(如果需要的话),或者让字段继承表的默认 collation。

CREATE TABLE mytable ( id INT AUTO_INCREMENT PRIMARY KEY, name VARCHAR(255) NOT NULL ) ENGINE=InnoDB DEFAULT CHARSET=utf8mb4 COLLATE=utf8mb4_unicode_ci;

在这个例子中,mytable 表的默认字符集是 utf8mb4,默认 collation 是 utf8mb4_unicode_ciname 字段没有指定 collation,所以它会继承表的默认 collation。

3. 字段级别设置 collation

如果你需要在字段级别设置 collation,你可以在创建字段时明确指定它。

CREATE TABLE mytable ( id INT AUTO_INCREMENT PRIMARY KEY, name VARCHAR(255) CHARACTER SET utf8mb4 COLLATE utf8mb4_unicode_ci NOT NULL, description TEXT COLLATE utf8mb4_general_ci ) ENGINE=InnoDB DEFAULT CHARSET=utf8mb4;

在这个例子中,name 字段使用了 utf8mb4_unicode_ci collation,而 description 字段使用了 utf8mb4_general_ci collation。注意,尽管表的默认字符集是 utf8mb4,但每个字段都可以有自己的 collation。

4. 修改已存在数据库的 collation

如果你已经有一个存在的数据库,并想更改其默认的 collation,你需要为每个表(和每个表的字段,如果需要的话)单独设置 collation。这通常是一个复杂的过程,因为它可能涉及到大量的 ALTER TABLE 语句,并且可能会影响到数据的完整性(例如,如果你试图更改已经存储了数据的字段的 collation)。

注意:

  • 在选择 collation 时,请确保它与你的数据和应用程序的需求相匹配。不同的 collation 在处理字符比较和排序时可能会有不同的行为。
  • 使用 utf8mb4 字符集通常是一个好的选择,因为它可以支持所有 Unicode 字符,包括一些表情符号和其他特殊字符。但是,请注意,使用 utf8mb4 可能会增加存储空间的消耗。

要查询 MySQL 数据库中每个数据库的字符集(charset)和校对规则(collation),你可以查询 information_schema 数据库中的 SCHEMATA 表。以下是如何做到这一点的 SQL 查询:

SELECT SCHEMA_NAME AS `Database`, DEFAULT_CHARACTER_SET_NAME AS `Charset`, DEFAULT_COLLATION_NAME AS `Collation` FROM information_schema.SCHEMATA;

这个查询将返回所有数据库的列表,以及每个数据库的默认字符集和校对规则。

如果你只想查询特定数据库的字符集和校对规则,你可以在查询中添加一个 WHERE 子句来限制结果:

SELECT SCHEMA_NAME AS `Database`, DEFAULT_CHARACTER_SET_NAME AS `Charset`, DEFAULT_COLLATION_NAME AS `Collation` FROM information_schema.SCHEMATA WHERE SCHEMA_NAME = 'your_database_name';

将 'your_database_name' 替换为你想要查询的数据库名称。

请注意,这些查询将返回数据库的默认字符集和校对规则。但是,数据库中的每个表或每个表的每个列都可以有自己的字符集和校对规则。要查询这些更具体的设置,你需要查询 information_schema.TABLES 和 information_schema.COLUMNS 表。


4 参考资料

广告一刻

为您即时展示最新活动产品广告消息,让您随时掌握产品活动新动态!