[MySQL] MySQL中的数据类型

avatar
作者
猴君
阅读量:2

 

  在MySQL中,数据类型用于定义表中列的数据的类型。在前面的几篇文章中,我们也会看到有很多的数据类型,例如:char、varchar、date、int等等。本篇文章会对常见的数据类型进行详细讲解。希望会对你有所帮助!

文章目录

一、常见的数据类型及分类

二、数值类型

2、1 整型

2、1、1 tinyint

2、1、2 bit

2、2 浮点型

2、2、1 float

2、2、2 decimal

三、字符串类型

3、1 char

3、2 varchar

3、3 char 和 varchar 比较

四、日期与时间类型

五、枚举与集合类型

5、1 enum

5、2 set

5、3 查找


🙋‍♂️ 作者:@Ggggggtm 🙋‍♂️

👀 专栏:MySQL 👀

💥 标题:MySQL中的数据类型💥

 ❣️ 寄语:与其忙着诉苦,不如低头赶路,奋路前行,终将遇到一番好风景 ❣️

一、常见的数据类型及分类

  我们先来看一下MySQL中大体上都会有哪些数据类型。具体如下图:

  其中上述的是值类型包含了整型和浮点型,文本、二进制类型主要是字符串类型。下面我们在具体分类描述一下:

  1. 整数类型(Integer Types)

    • TINYINT:范围为-128到127或0到255(无符号),用于存储较小的整数值,如存储性别或状态信息。
    • SMALLINT:范围为-32768到32767或0到65535(无符号),用于存储较小的整数值,如存储年龄或计数值。
    • MEDIUMINT:范围为-8388608到8388607或0到16777215(无符号),适用于中等大小的整数值存储。
    • INT:范围为-2147483648到2147483647或0到4294967295(无符号),适用于一般整数值存储。
    • BIGINT:范围为-9223372036854775808到9223372036854775807或0到18446744073709551615(无符号),用于存储大整数值,如存储ID或计数值。
  2. 浮点数类型(Floating-Point Types):

    • FLOAT:用于存储单精度浮点数,约占用4个字节的空间。
    • DOUBLE:用于存储双精度浮点数,约占用8个字节的空间。
    • DECIMAL:用于精确的十进制数值存储,适用于货币或其他需要精确计算的场景。
  3. 日期与时间类型(Date and Time Types):

    • DATE:用于存储日期,格式为'YYYY-MM-DD',如'2023-11-13'。
    • TIME:用于存储时间,格式为'HH:MM:SS',如'12:30:00'。
    • DATETIME:用于存储日期和时间,格式为'YYYY-MM-DD HH:MM:SS',如'2023-11-13 12:30:00'。
  4. 字符串类型(String Types):

    • CHAR:用于存储固定长度的字符串,如CHAR(10)可以存储长度为10的字符串。
    • VARCHAR:用于存储可变长度的字符串,如VARCHAR(255)可以存储长度最大为255的字符串。
    • TEXT:用于存储较长的文本数据,例如文章内容或备注信息。
  5. 枚举和集合类型

    • 枚举(ENUM)类型: 枚举类型允许您从一组预定义的选项中选择一个单独的值。在创建表结构时,你可以指定枚举类型的字段允许的值列表
    • 集合(SET)类型: 集合类型允许您从一组预定义的选项中选择多个值,这些值之间使用逗号分隔。与枚举类型不同,集合类型允许您选择多个选项,而不仅限于一项。
  6. 其他类型

    • BOOLEAN:在MySQL中没有专门的BOOLEAN类型,通常使用TINYINT(1)来表示布尔值,0表示false,1表示true。

  下面我们看一些实际的例子来理解这些数据类型。

二、数值类型

2、1 整型

  整型包括如下几种:

  他们最根本的区别就是所占用空间大小不同,也因此导致了能够存储的数据范围不同。我们不妨来测试一下各个整型。

2、1、1 tinyint

  我们先来测试一下tinyint的取值范围。我们先来创建一个表:

  我们尝试着插入一些数据,如下图所示:

  再插入合法的范围内是能够正常进行插入的。但是一旦超过的tinyint的取值范围,就会不让你插入。并且当不是整型时,也会不让你插入。

  在C/C++中,int tmp = ‘a’最多会发出提醒,并不会报错,本质上发生了隐式类型转换。char a = 200也并不会报错,会发生截断。即使你存储的数据超出了指定类型的取值范围,也并不会报错,而是发出警告并且存储溢出后进行调整的值。

  在数据库中并不像C/C++那样,而是有着严格的要求。mysql的数据类型中,符合条件才会让你操作,不符合条件直接不让你操作。在mysql的数据类型中,除了能够满足各种应用场景,还有一个特别重要的用途:数据类型本质就是一种约束!怎么理解约束呢?约束的谁呢?约束就是强制你必须按照规则去做,约束的就是使用者倒逼使用者,必须遵守规则!

  我们再来简单测试一下无符号的tinyint。具体如下图:

  我们尝试着向表中的tmp1列中插入一些数据,如下图:

  我们在查看表t1的数据时,发现有NULL。那么NULL和空字符串' '是一样的吗?答案是不一样的。NULL和空字符串' '代表着不同的含义

  1. NULL:在数据库中表示缺少值或未知值。当一个字段的值未知或者不适用时,可以使用NULL来表示。NULL不等于任何其他值,包括空字符串。

  2. 空字符串' ':表示一个空的字符串值。当一个字段需要有值,但是没有具体数值或字符时,可以使用空字符串来表示。空字符串是一个有效的值。

  在mysql中,字符串可用单引号 ' '来引用,也可用双引号 " "来引用。例如 'It's a good day' 和 "It's a good day" 都是合法的字符串表示。一般情况下在mysql中都是用单引号 ' ' 的

  其他整型就不再过多解释,我们需要记住其所占用的大小和取值范围,同时也应该会使用即可。

2、1、2 bit

  bit类型也是一种数值类型。bit类型是用于存储二进制数字的数据类型。它可以用来表示位值为0或1的数值,比如开关状态、标志位等。我们先来看一下其使用方法。如下图:

  如上图,我们创建了一个t2表。其中包含了列a,数据类型为int;列b,数据类型为bit(10)。括号内的10的意思就是我们指定有几个比特位。那么b的大小是10个比特位。我们再来测试一下,如下图:

  确实能够插入成功。10个bit能够存储的数据范围是0~1023。确实正如上图所示。我们再来查看一下表中的数据。如下图:

  怎么表中存储的并不是我们所插入的数据呢?存储是按照我们所插入的数据进行存储的,但是bit类型在显示时,是按照ASCII码对应的值进行显示的。具体如下图:

  需要注意的是,虽然bit类型可以用于存储任意大小的二进制数,但是在实际应用中,bit通常只用于存储较小的数值。这是因为bit类型的空间效率相对较低,对于较大的数值,使用其他数据类型可能会更加合适。

2、2 浮点型

2、2、1 float

  float 用于存储近似值的浮点数,它表示单精度浮点数。由于浮点数是以二进制形式表示的,可能存在精度损失的情况。下面我们看具体实例来理解其用法。具体如下图:

  上图中我们创建了一个名字为t3的表。其中包含了一个字段a,其类型为float(4,2)。float的语法格式为 float(M, D),其中 M 表示总位数,D 表示小数点后的位数。例如,float(4, 2) 表示总共 4 位,其中 2 位为小数位。下面我们插入一些数据看一下,如下图:

  那要是插入长度大于4的数据呢?我们再看如下图:

  正如上图所示,当小数位数大于两位时,会进行四舍五入。四舍五入就会产生进位,但必须保证进位后的小数也能够满足两位,也就是整数部分不得超过两位。我们看到float(4,2)的取值范围是 -99.994 ~ 99.994。

  我们再来看一下无符号的float。如下图:

  我们再来插入一些数据,如下图:

  但是负数就不能在进行插入了,如下图:

  其实我们这里发现,float(M,D)中的M和D限制了我们的数据范围,其次就是有符号和无符号的区别。float可以表示最大值为3.402823e+38的正或负实数,所占用的字节为4字节。

  在MySQL中,如果不指定float类型的总位数和小数点数后的位数,默认情况下float类型的总位数为其最大取值范围。具体如下图:

  从上图中我们也能看到,float一旦数据较大,就会有精度损失。一般情况下提供约6位精度。这意味着float类型可以存储大约6位有效数字的数据,但实际精度可能受到存储数据时的舍入误差的影响。我们接下来再看decimal类型。

2、2、2 decimal

  decimal用于精确存储数字,它表示定点数,能够保证精度不会丢失。decimal的语法格式为 DECIMAL(M, D),其中 M 表示总位数,D 表示小数点后的位数。例如,DECIMAL(10, 2) 表示总共 10 位,其中 2 位为小数位。其用法用float一样的。如下图:

  通过上图我们也能看到,decimal类型精度并不会丢失。decimal与float都是用来存储浮点数的,用法也是相同。不同的是,decimal类型存储的数字是精确的,不会丢失精度decimal占用的空间为8字节。

三、字符串类型

3、1 char

  char类型在mysql中是一个经常使用的类型。具体使用如下图:

  上图中定义了一个名字为str的字段,其属性为char(5),也就是最多可存储5个字符。我们插入数据来看一下:

  我们也能看到,一旦插入的字符长度超过5,就不会让你插入。注意,在mysql中,char(5)中的5是指的5个字符,并不是5个字节。所以我们也可以最多插入5个汉字。如下图:

  在不同编码中,一个字符所占的字节个数是不同的。比如utf8中一个字符占3个字节,而gbk中一个字符占2个字节。char(5)就是指能够最多插入5个字符。这样用户在使用时就不用去关心字节数的问题了。

  char也是有字符长度上限的。char的字符长度上限是255。我们看如下图:

  当我们修改char的长度为256时就会报错,并不允许我们进行修改操作。

3、2 varchar

  varchar也是用来存储字符的数据类型。使用方法与char相同。我们先看一下其具体使用例子。如下图:

  

  那么varchar 和 char 有什么区别呢就char(10)和 varchar(10)来说明无论char中实际存储的字符串长度是多少,char始终占用10个字符长度的存储空间。但是varchar是一种可变长度的字符类型意味着它只占用实际存储数据所需的存储空间我们在varchar中只存储5个字符的话,那么varchar只占用5个字符长度的空间

  关于varchar(len),len到底是多大,这个len值,和表的编码密切相关:
  • varchar长度可以指定为065535之间的值,但是有1 - 3 个字节用于记录数据大小(varchar是变长的),所以说有效字节数是 65532。
  • 当我们的表的编码是utf8时,varchar(n)的参数n最大值是65532/3=21844(因为utf中,一个字符占用3个字节),如果编码是gbkvarchar(n)的参数n最大是65532/2=32766(因为gbk中,一个字符占用2字节)。

  我们看如下例子:

  我们看到当我们设置varchar的字符长度为21845时,就提示我们超过最大长度了。提示中给出的是65535个字节,并且包含了记录长度的字节数据。

3、3 char 和 varchar 比较

  我们不妨来对比一下 char 和 varchar的区别。

  1. CHAR数据类型:

    • CHAR是一种固定长度的字符类型,意味着它始终占用固定数量的存储空间。
    • 当定义一个CHAR列时,您需要指定该列的固定长度。例如,CHAR(10)表示该列将始终存储10个字符。
    • 无论实际存储的字符串长度是多少,CHAR始终占用指定长度的存储空间。
    • CHAR适合存储长度固定的字符串,例如邮政编码或固定长度的标识符。
  2. VARCHAR数据类型:

    • VARCHAR是一种可变长度的字符类型,意味着它只占用实际存储数据所需的存储空间。
    • 当定义一个VARCHAR列时,您需要指定该列可存储的最大长度。例如,VARCHAR(100)表示该列可以存储最多100个字符,但实际存储的字符串长度可以少于100个字符。
    • VARCHAR适合存储长度可变的字符串,例如用户输入的文本或变长的描述信息。

主要区别:

  1. 存储方式:CHAR是固定长度的,而VARCHAR是可变长度的。这意味着在使用CHAR时,数据将按固定长度存储;而使用VARCHAR时,额外的空间将被用来存储数据长度信息。
  2. 性能:CHAR由于固定长度和提前分配的空间,其性能通常比VARCHAR要快。特别是当已知要存储的字符串长度时。而VARCHAR因为其灵活性(读取时需要先读取存储字符串的长度,再访问指定长度的空间),可能稍慢一些。
  3. 空间使用:CHAR使用固定的空间来存储数据,因此可能会因为并没有使用全部空间而造成空间的浪费。但VARCHAR使用额外空间来存储数据长度信息,相对来说空间利用率较高。
  4. 可变字段:如果一个字段的数据长度可能会有所不同,使用VARCHAR可能会更好,因为它允许更大的数据长度。

  选择使用哪种类型取决于你的具体需求。如果你知道要存储的字符串的长度,并且长度是固定的,CHAR可能是一个好选择。然而,如果你不确定字符串的长度,或者需要更大的灵活性,使用VARCHAR可能更合适。

四、日期与时间类型

  我们在前面的文章使用过到data类型。该类型就是属于日期类型的。常见的日期类型有:

  • date:日期格式为 'YYYY-MM-DD',占用三字节。
  • datetime:时间日期格式为 'YYYY-MM-DD HH:MM:SS',占用八字节。
  • timestamp:时间戳,1970年开始的。格式为 'YYYY-MM-DD HH:MM:SS',占用四字节。

  下面我们通过一个实例来看一下其具体使用方法。如下图:

  通过上图可看出,timestamp时间戳是不允许为空的,并且他是有默认值的。默认值就是当前的时间戳。我们插入数据看一下:

  我们看到并没有插入时间戳时会自动插入和更新的。这里的更新是指的每当对表进行修改操作时,时间戳就会更新

  在使用这些数据类型时,需要根据实际需求选择合适的类型。如果只需要存储日期,选择DATE类型;如果需要存储日期和时间,选择DATETIME或TIMESTAMP类型,根据需要考虑是否需要自动更新功能。TIMESTAMP常用于的就是评论时记录时间或者发表内容时的时间。

五、枚举与集合类型

5、1 enum

  enum类型是一种字符串对象的类型,用于定义一个列可以包含的可能值的有限列表。语法:enum('value1', 'value2', ...)。其中,'value1', 'value2'等是列允许的枚举值。我们直接看一个实际的例子。如下图:

  当我们再插入数据时,插入hobby属性时,就可以从我们的枚举列表中进行选择其中一个进行插入。如下图:

  如上图所示,插入的数据并不是枚举中的属性值,就会报错。出于效率考虑,这些值实际

存储的是数字,因此这些选项的每个选项值依次对应如下数字:1,2,3,....最多65535个;当我们添加枚举值时,也可以添加对应的数字编号(枚举中仍然何以使用下标进行选择所要插入的数据)。如下图:

  但是需要注意的一点是:枚举中的第一个元素下标是从1开始的,并不是从0开始的

5、2 set

  通过对上述的枚举的理解后,我们发现在很多情况下一个人的爱好会有很多,并不是只有一个。但是枚举类型只能一次选一个。这时候我们就可以使用set类型。

  SET是一种字符串对象,用于定义一个列可以包含的可能值的多选列表。语法:SET('value1', 'value2', ...)。其中,'value1', 'value2'等是列允许的多选值。我们可以直接通过之前学的对表进行修改,把hobby的类型改成set。具体如下图:

  我们再来插入一些数据,具体如下图:

  通过上图可以看到,再插入数据时我们可以从set集合中一次选多个数据进行插入,也可一次只选一个数据。set集合设定只是提供了若干个选项的值,最终一个单元格中,设计可存储了其中任意多个值;而且出于效率考虑,这些值实际存储的也是“数字,因此这些选项的每个选项值依次对应如下数字:1,2,4,8,16,32.... 最多64个。我们再来通过数字进行插入,具体如下图:

  注意,3是1和2相加的结果,7是1和2和4相加的结果。我们可对应set集合进行查看。

  虽然可以用数字添加枚举,但是不建议在添加枚举值,集合值的时候采用数字的方式,因为不利于阅读,且后期维护成本较高。

5、3 查找

  如上图,我们想要选出喜欢打篮球的人该怎么做呢?看看下面这种方法是不是你所想到的,如下:

  但是发现一个问题:还有很多人也是喜欢篮球的,但是并没有将他们筛选出来。那要怎么做呢?这时候我们需要学习一下find_in_set()的使用了。

  find_in_set()是 MySQL 中的一个函数,用于在逗号分隔的字符串列表中查找指定的字符串。它的作用是在一个逗号分隔的字符串列表中查找指定的值,并返回该值在列表中的位置。使用方法:

FIND_IN_SET(search_string, string_list)

其中:

  • search_string是要查找的字符串。
  • ​​​​​​​string_list是逗号分隔的字符串列表,它包含要搜索的多个字符串。

返回值:

  • 如果search_string在string_list中找到,则返回它在列表中的位置(从 1 开始)。
  • 如果未找到,则返回 0。

  我们看如下例子:

  我们就使用find_in_set()进行查找喜欢篮球的,结果如下图:

  当然,我们也可以在后面跟任何你想筛选的条件。

  本篇文章讲解就到这里。本篇文章主要的内容就是对mysql中的数据类型进行了详解。同时也有一些问题并没有说明,比如int(10)中的10代表着什么含义。我们会在下篇文章表的约束中进行讲解。我们应该熟知这些数据类型,这也是我们后续所学的基础。

  感谢阅读ovo~ 

广告一刻

为您即时展示最新活动产品广告消息,让您随时掌握产品活动新动态!