当前位置:主页 > 数据库 > Mysql >

MySQL怎么给字符串字段加索引

时间:2022-07-04 14:06:10 | 栏目:Mysql | 点击:

假设,你现在维护一个支持邮箱登录的系统,用户表是这么定义的:

create table SUser(
 ID bigint unsigned primary key,
 email varchar(64), 
 ... 
 )engine=innodb;

由于要使用邮箱登录,所以业务代码中一定会出现类似于这样的语句:

select f1, f2 from SUser where email='xxx';

如果 email 这个字段上没有索引,那么这个语句就只能做全表扫描。

1)那我可以在邮箱地址这个字段上面建索引吗?

2)如果创建索引的语句不指定前缀长度,那么会怎么样?

3)能举例来说明一下吗?

alter table SUser add index index1(email);
 或
 alter table SUser add index index2(email(6));

4)这两种不同的定义在数据结构和存储上有什么区别呢?

明显看出email(6) 这个索引结构占用的空间会更小

5)email(6) 这个索引结构有什么缺点吗?

6)下面这个语句,在这两个索引定义下分别是怎么执行的?

select id,name,email from SUser where email='zhangssxyz@xxx.com';

index1(即 email 整个字符串的索引结构),执行顺序

这个过程中,只需要回主键索引取一次数据,所以系统认为只扫描了一行。

index2(即 email(6) 索引结构),执行顺序

在这个过程中,要回主键索引取 4 次数据,也就是扫描了 4 行。

7)通过上面的对比,能得出什么结论?

8)前缀索引真的一无是处吗?

9)那么使用前缀索引有哪些注意事项?

10)当要给字符串创建前缀索引时,我咋知道我该用多长的前缀索引呢?

11)怎样统计索引上有多少个不同的值?

select count(distinct email) as L from SUser;

12)拿到了索引对应的有多少个不同的值之后下一步该做什么?

13)前缀索引对覆盖索引的影响是什么?

下面这个 SQL 语句:

select id,email from SUser where email='zhangssxyz@xxx.com';

与前面例子中的 SQL 语句

select id,name,email from SUser where email='zhangssxyz@xxx.com';

相比,第一个语句只要求返回 id 和 email 字段。

14)那我把index2 的定义修改为 email(18) 的前缀索引不就行了?

总而言之:使用前缀索引就用不上覆盖索引对查询性能的优化了

15)对于类似于邮箱这样的字段来说,使用前缀索引的效果可能还不错。但是,遇到身份证这种前缀的区分度不够好的情况时,我们要怎么办呢?

16)如果我们能够确定业务需求里面只有按照身份证进行等值查询的需求,还有没有别的处理方法呢?

17)使用倒序存储和使用 hash 字段这两种方法有什么异同点?

案例:如果你在维护一个学校的学生信息数据库,学生登录名的统一格式是”学号 @gmail.com", 而学号的规则是:十五位的数字,其中前三位是所在城市编号、第四到第六位是学校编号、第七位到第十位是入学年份、最后五位是顺序编号。

18)系统登录的时候都需要学生输入登录名和密码,验证正确后才能继续使用系统。就只考虑登录验证这个行为的话,你会怎么设计这个登录名的索引呢?

您可能感兴趣的文章:

相关文章