设为首页收藏本站

ZMX - IT技术交流论坛 - 无限Perfect,追求梦想 - itzmx.com

 找回密码
 注册论坛

QQ登录

只需一步,快速开始

新浪微博账号登陆

只需一步,快速开始

用百度帐号登录

只需两步,快速登录

搜索
查看: 4970|回复: 4

Memcached源码解析--内存管理

[复制链接]
 成长值: 366

签到天数: 4747 天

[LV.Master]伴坛终老

发表于 2014/5/24 23:28 | 显示全部楼层 |阅读模式 | Google Chrome 34.0.1847.116| Windows 7
天涯海角搜一下: 百度 谷歌 360 搜狗 有道 雅虎 必应 即刻
        低版本的Memcached通过即时mallloc和free来实现内存分配和释放,这种方式会导致内存碎片,加重操作系统内存管理器的负担,最坏情况下会导致操作系统比Memcached进程本身还慢。为了解决该问题,Memcached采用Slab Allocator机制来管理内存。本系列文章以memcached-1.4.15为例,下载源码和查看相关信息可以点这里
一、原理
        Slab Allocator的基本原理是按照预先规定的大小,将分配的内存分割为特定长度的块,以完全解决内存碎片问题。
        Memcached将分配的内存分割成各种大小的块(chunk),并把大小相同的块分成组(chunk的集合),如下图:
        
22312037_1364652252HJU5.png
图1 Slab Allocator图

        Memcached分配的内存大小在启动时命令行参数指定,具体如下(Memcached安装见后面附注):

22312037_1364652309RFr5.png
图2 Slab Class数组定义信息图

        Memcached会重复利用已分配的内存,即分配的内存不释放而是重复利用。

二、流程
        在分析源码前,先对几个术语及关键数据结构进行介绍。
1、关键术语
        (1)Page
        向操作系统申请内存空间的最小单位,默认是1MB,Page分配给各个Slab Class之后根据规则被切分成特定尺寸的chunk。
        (2)Chunk
        用于缓存记录即item的内存空间,一个chunk存放一个item。
        (3)Slab Class
        特定大小的chunk的组,最大支持200组,且各slab class中,最大chunk尺寸默认为1MB(见图2中的slab class 42:chunk size 1048576)。一个slab class中是若干个slab(尺寸统一默认为1MB,除非用-I参数修改)。slabclass_t结构体的源码在slabs.c/26行:
        typedef struct {
    unsigned int size;      /* sizes of items */
    unsigned int perslab;   /* how many items per slab */

    void *slots;           /* list of item ptrs */
    unsigned int sl_curr;   /* total free items in list */

    unsigned int slabs;     /* how many slabs were allocated for this class */

    void **slab_list;       /* array of slab pointers */
    unsigned int list_size; /* size of prev array */

    unsigned int killing;  /* index+1 of dying slab, or zero if none */
    size_t requested; /* The number of requested bytes */
} slabclass_t;

        (4)Item
        一条数据在Memcached中就是一个item,存放在一个chunk内。一个item结构体包含一个key+value和链表指针以及过期时间等管理信息,该结构体的源码在Memcached.h/327:
        typedef struct _stritem {
    struct _stritem *next;
    struct _stritem *prev;
    struct _stritem *h_next;    /* hash chain next */
    rel_time_t      time;       /* least recent access */
    rel_time_t      exptime;    /* expire time */

    int             nbytes;     /* size of data */
    unsigned short  refcount;
    uint8_t         nsuffix;    /* length of flags-and-length string */
    uint8_t         it_flags;   /* ITEM_* above */
    uint8_t         slabs_clsid;/* which slab class we're in */

    uint8_t         nkey;       /* key length, w/terminating null and padding */
    /* this odd type prevents type-punning issues when we do
     * the little shuffle to save space when not using CAS. */
    union {
        uint64_t cas;
        char end;
    } data[];

    /* if it_flags & ITEM_CAS we have 8 bytes CAS */
    /* then null-terminated key */
    /* then " flags length
" (no terminating null) */
    /* then data with terminating
(no terminating null; it's binary!) */
} item;

2、内存分配
        slabclass_t结构体中的size字段保存了
        在slabs.c/42行定义了如下静态数组:
        static slabclass_t slabclass[MAX_NUMBER_OF_SLAB_CLASSES];
        该数组将所有slabclass_t串联起来,在slabs.c/slabs_init/115行会对所有slabclass_t进行初始化,图2中的信息正是这些初始化的信息。
        结构体slabclass_t中的size字段保存了每个slab所能保存的数据大小,而数组中每个slabclass_t的size字段都是递增的,递增的因子由slabs_init函数的第二个参数factor指定。比如:假设factor指定为2,那么如果第一个slabclass_t的size = sizeof(item) + settings.chunk_size;(slabs.c/slabs_init/115行),那么数组中下一个slabclass_t的size就是 size*factor(这里忽略对齐的因素)。即假设factor为2且第一个slab能保存8byte的数据,那么数组中slab的size依次为16byte、32byte...。实际上,默认factor为1.25(Memcached.c/214),可以在启动memcached时根据需求由参数-f指定来调优(Memcached.c/4851)。
        Memcached根据收到数据的大小,选择最合适数据大小的slab,即slabclass数组中slabclass_t中字段size大于数据大小的最小尺寸的slab,Memcached中保存着slab内空闲chunk的列表,根据该列表选择chunk,然后将数据缓存与其中。例如:以前面那个slab模型为例,如果现在收到30byte,查找数组得到大于30byte的最小slab尺寸是32byte,于是就从这个slab中查找item分配给它。具体如下图:
22312037_1364745238lzPA.png
图3 选择chunk存储item

        从上图可以看出,由于分配的是特定长度的内存,因此无法有效利用分配的内存,这里是将30byte的数据缓存到32字节的chunk中了,只是浪费了2byte,但是如果现在要分配的是16byte,那么就浪费了16byte,浪费了将近50%的内存,这是非常可耻的 2.gif 。这时候前面提到的factor就可以大显身手了,使用者可以根据需要指定不同的增长factor以降低资源的浪费,这跟具体业务相关也很能考验架构师的能力。
        用Memcached的stats命令可以查看包括资源利用率在内的各种信息,具体如下:
        #telnet 主机名 端口号
        stats
        另外,如果安装了libmemcached这个C/C++客户端库,则可以使用memstat命令获取与telnet相同的信息,还能一次性从多台服务器获得信息,具体如下:
        #memstat --servers=server1, server2, server3, ...
        查看libmemcached的源码及相关资料可以点这里
3、LRU机制
        Memcached采用LRU(即Least Recently Used)机制来淘汰最近最少使用的key。淘汰数据的规则是各层slab分别一个队列,刚放入的数据在对头,经常get的数据会移动到对头,从队尾淘汰,这样较老或者较少访问的数据会相对保留着队尾,淘汰/踢出数据时从队尾执行。所有最近使用的item保存在static item *tails[LARGEST_ID](Item.c/40行)中,已经分配的内存以链表形式保存在这个数组中,如果对应的slab已经分配不到足够的内存了,就从这个链表中查找,淘汰的依据是item结构体中的exptime字段(Memcached.h/332行),具体流程如下图:
22312037_1364802907h4VO.png
图4 LRU淘汰机制   

        Memcached过期采用Lazy Expiration技术,即Memcached内部不会监视记录是否过期,而是在get时查看记录的时间戳,检查记录是否过期,因此,Memcached不会在过期监视上耗费CPU时间。
        Memcached优先使用过期记录的内存,如果还是内存不够用,则会从最近未被使用的记录中搜索,并将其内存分配给新记录。但是如果通过参数-M关闭了LRU,则会在内存用尽时返回错误,具体如下:
        #memcached -M -m 1024
        如上则禁用LRU,并用-m限定最大内存大小,不指定时则默认是64M。
三、附注
        Memcached的安装非常简单,以Centos为例:
        #yum install libevent libevent-devel
        #yum install memcached
        这样Memcached的最新稳定版默认就会安装到/use/bin下。
        从终端执行如下命令即可启动Memcached:
        #memcached -u root -p 11211 -m 64m -vv
        Memcached有很多参数可以输入以完成一些特定功能,比如-d指定Memcached在后台启动。这些启动选项的详细帮助可以通过如下命令获取:
        #memcached -h

        需要注意的是:图2显示了slab class数组的全景信息,但未实际分配内存,也就是虽然在启动Memcached的时候使用参数-m指定了最大可用内存,但是默认情况下并不是启动就分配内存,而是按需分配即:
        (1)按需向操作系统申请内存,根据item长度在对应slab class分配page;
        (2)即使配置的内存用完,每个slab class也可以申请一个page。
        (3)Memcached启动时指定的内存是用于保存数据的量,不包括slab allocator本身占用的内存以及为保存数据而设置的管理空间,因此,Memcached实际占用内存要比指定的容量大。




[发帖际遇]: 小樱 乐于助人,奖励 9 贡献. 幸运榜 / 衰神榜
欢迎光临IT技术交流论坛:http://bbs.itzmx.com/
回复

使用道具 举报

掩饰的心伤 该用户已被删除
发表于 2014/5/24 23:28 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
欢迎光临IT技术交流论坛:http://bbs.itzmx.com/
回复 支持 反对

使用道具 举报

签到天数: 379 天

[LV.9]以坛为家II

发表于 2014/5/25 00:12 | 显示全部楼层 | Google Chrome 34.0.1847.116| Windows 7
不明觉厉
欢迎光临IT技术交流论坛:http://bbs.itzmx.com/
回复 支持 反对

使用道具 举报

 成长值: 366

签到天数: 4747 天

[LV.Master]伴坛终老

发表于 2014/5/25 12:19 | 显示全部楼层 | Google Chrome 34.0.1847.116| Windows 7

我会说是转来的么
欢迎光临IT技术交流论坛:http://bbs.itzmx.com/
回复 支持 反对

使用道具 举报

签到天数: 1221 天

[LV.10]以坛为家III

发表于 2014/5/25 14:50 | 显示全部楼层 | Google Chrome 31.0.1650.63| Windows 7
不明觉厉
欢迎光临IT技术交流论坛:http://bbs.itzmx.com/
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 注册论坛 新浪微博账号登陆用百度帐号登录

本版积分规则

手机版|Archiver|Mail me|网站地图|IT技术交流论坛 ( 闽ICP备13013206号-7 )

GMT+8, 2025/1/2 00:14 , Processed in 0.140050 second(s), 24 queries , MemCache On.

Powered by itzmx! X3.4

© 2011- sakura

快速回复 返回顶部 返回列表