# Redis的五种数据结构详解
Redis中会根据存储的数据类型不同,选择不同额编码方式,每种数据类型的使用编码方式如下
数据类型 | 编码方式 |
---|---|
OBJ_STRING | int、embstr、raw |
OBJ_LIST | LinkedList和ZipList(3.2以前)、QuickList(3.2以后) |
OBJ_SET | intset、HT |
OBJ_ZSET | ZipList、HT、SkipList |
OBJ_HASH | ZipList、HT |
# String
String是Redis中最常见的数据存储类型:
- 其基本编码方式是RAW,基于简单动态字符串SDS实现,存储上限是512mb
- 如果存储的SDS长度小于44字节,则会采用EMBSTR编码,此时object head与SDS是一段连续空间,申请内存时只需要调用一次内存分配函数,效率更高。
结构如下
如果存储的字符串是整数值,并且大小在LONG_MAX范围内,则会采用INT编码:直接将数据保存在RedisObject的ptr指针位置(刚好8字节),不再需要SDS了
# List
Redis的List结构是类似一个双端链表,可以从首尾操作列表中的元素
- 在3.2版本之前,Redis采用ZipList和LinkedList来实现list,当元素数量小于512并且元素大小小于64字节时采用Ziplist编码,超过则采用LinkedList编码
- 在3.2版本之后,Redis统一采用QuickList来实现List
元素存储结构如下
# Set
Set是Redis中的单列集合,满足下列特点:不保证有序、保证元素唯一,查询效率极高
- 为了查询效率和唯一性,set采用HT编码(Dict),Dict中的key用来存储元素,value统一为null
- 当存储的所有数据都是整数,并且元素数量不超过set-max-intset-entries时,Set会采用intSet编码,已节省内存
# ZetSet
Zet也就是SortedSet,其中每一个元素都需要指定一个score值和member值
- 可以根据score值排序
- member必须唯一
- 可以根据member查询分数
因此zset底层数据结构必须满足键值存储、键必须唯一、可排序这几个需求
因此Zset采用SkipList和HT(Dict) 组合方式。数据结构如下
数据值存储结构如下:
但是从上述描述可以看出来这样存储数据其实很浪费内存空间 因此Zset还有另外一种存储格式ZipList
不过需要同时满足俩个条件:
- 元素数量小于zset_max_ziplist_entries,默认值128
- 每个元素都小于zset_max_ziplist_value字节,默认值64
ziplist本身是没有排序功能,而且没有键值对的概念,因此需要有zset通过编码实现:
- ZipList是连续内存,因此score和element是紧挨在一起的俩个entry,element在前,score在后
- score越小越接近队首,越大越接近队尾,按照score值升序排列
# Hash
Hash结构与Redis中的Zset非常类似。都是键值存储、都需求根据键获取值、键必须唯一
区别如下:
- zset的键是member,值是score;hash的键和值都是任意值
- zset要根据score排序,hash无需排序
因此Hash底层采用的编码也与Zset基本一致,只需要把排序有关的SkipList去掉即可
- Hah结构默认采用ZipList编码,用以节省内存,ZipList中相邻的俩个entry分别保存field和value
- 当数据量较大时,Hash结构会转为HT编码,也就是Dict,重复条件有俩个
- ZipList的元素数量超过hash_max_ziplist_entrues(默认512)
- ZIPList中的任意entry大小超过了hash-max-ziplist-value(默认64字节)