Mysql 5.7 中推出了一个非常实用的功能
虚拟列 Generated (Virtual) Columns
对于它的用途,我们通过一个场景来说明
假设有一个表,其中包含一个 date 类型的列
SimpleDate
SimpleDate 是一个常用的查询字段,并需要对其执行日期函数,例如SELECT ... WHERE dayofweek(SimpleDate) = 3 ...
此时的问题是 即使对 SimpleDate 建立索引,这个查询语句也无法使用,因为日期函数阻止了索引
为了提高查询效率,通常要进行额外的操作,例如新建一个字段 SimpleDate_dayofweek,存放 dayofweek(SimpleDate) 的计算结果,然后对这列创建索引
SimpleDate_dayofweek 的值需要程序写入,例如使用触发器,在 SimpleDate 有变动时更新
这样查询就可以改为SELECT ... WHERE SimpleDate_dayofweek = 3 ...
这么做的好处是提高了查询性能,可以使用 SimpleDate_dayofweek 列的索引了,但又带来了其他麻烦,例如
- 降低了数据写入性能
- 增加冗余数据,占用了更多的存储空间
- 增加代码维护成本
虚拟列 Generated Columns 就是用来解决这个问题的,可以增加一个可被索引的列,但实际上并不存在于数据表中
对于上面的例子,可以对 SimpleDate 创建一个虚拟列,然后对虚拟列创建索引,如
1 | CREATE TABLE `test` ( |
这样就建好了虚拟列,此列的值不用我们计算SELECT ... WHERE SimpleDate_dayofweek = 3 ...
查询语句可以正常使用索引
通过虚拟列的方式,即满足了查询性能,也不会有之前那个解决方案的潜在麻烦
虚拟列不存储在数据行中,但虚拟列的元数据信息会存在于相关系统表中,对虚拟列的添加或者删除只会涉及这些系统表,不会导致数据表的重建,所以效率很高
需要注意,不能建立虚拟列和真实列的联合索引