jQuery的数据缓存模块以一种安全的方式为DOM元素附加任意类型的数据,避免了在JavaScript对象和DOM元素之间出现循环引用,以及由此而导致的内存泄漏。
数据缓存模块为DOM元素和JavaScript对象提供了统一的数据设置、读取和移除方法,在jQuery内部还为队列模块、动画模块、样式操作模块、事件系统提供基础功能,负责维护这些模块运行时的内部数据。
 writer by:大沙漠 QQ:22969969
对于DOM元素和JavaScript对象,数据的存储位置是不同的,如下:
- 对于DOM元素jQuery直接把数据存储在jQuery.cache中
- 对于JavaScript对象,垃圾回收机制能够自动发生,因此数据可以直接存储在JavaScript对象中。
另外为了避免jQuery内部使用的数据和用户自定义的数据发生冲突,分为内部数据缓存对象和自定义数据缓存对象
- 内部缓存对象      ;jQuery内部使用        ;DOM元素:存储在$.cache[elem[$.expando]]                 ;JavaScript对象:obj[$.expando]
- 自定义缓存对象     ;给用户使用的            ;DOM元素:存储在$.cache[elem[$.expando]].data        ;JavaScript对象:obj[$.expando].data
jQuery的静态方法含有如下API:
- $.cache              ;DOM元素的数据缓存对象,所有DOM元素存储的数据都会存储在该对象里
- $.uuid                 ;唯一id种子,初始值为0,当数据存储在DOM元素上时用到,元素的$.expando属性的值等于最新的$.uuid加1
- $.expando                ;页面中每个jQuery副本的唯一标识,只有刷新页面才会发生变化。格式:jQuery+版本号+随机数
- $.acceptData(elem)           ;判断DOM元素elem是否可以设置数据,elem是一个DOM节点
- $.hasData(elem)           ;判断elem是否有关联的数据
- $.data(elem, name, data,pvt)  ;设置或返回DOM或JavaScript对象的数据。
                  ·elem是DOM元素或JavaScript对象。
                  ·name是要设置或读取的数据名,也可以是包含键值对的对象。
                  ·data是要设置的数据值,可以是任意数据。
                  ·pvt表示操作的是否为内部数据,默认为false
- $._data(elem, name, data)   ;设置、读取内部数据,内部代码就一句return jQuery.data( elem, name, data, true )
- $.removeData(elem, name, pvt) ;移除通过$.data()设置的数据,pvt表示是否为内部数据
-  $.cleanData(elem)         ;移除多个DOM元素的全部数据和事件
jQuery/$ 实例方法(可以通过jQuery实例调用的):
- data(key,value)        ;设置/读取自定义数据
- removeData(key)        ;移除匹配元素的自定义数据,key可以是一个字符换或数组,表示属性或属性列表
为DOM元素存储数据时,比较特别,jQuery首先会在该DOM上添加一个名为$.expando的属性,值是一个唯一的id,等于++$.uuid(jQuery的一个内置属性),$.uuid是一个整型值,初始值为0。为该DOM添加属性之后还会把这个id作为属性添加到全局缓存对象jQuery.cache中,对应的属性值是一个JavaScript对象,该对象是DOM元素的数据缓存对象
例如:
- <!DOCTYPE html>
- <html lang="en">
- <head>
-     <meta charset="UTF-8">
-     <title>Document</title>
-     <script src="http://libs.baidu.com/jquery/1.7.1/jquery.min.js"></script>
- </head>
- <body>
-     <p>123</p>
-     <script>
-         var p = document.getElementsByTagName('p')[0];
-         $.data(p,'age',25,true);                                //设置内部数据age=25,这是直接定义在数据缓存对象上的。等价于$._data(p,'age',25);
-         $.data(p,'age',23);                                     //设置自定义数据age=23,等价于$.data(p,'age',23,false),这是定义在数据缓存对象的data属性对象上
-         console.log($.data(p,undefined,undefined,true));        //输出: Object { data={ age=23},  age=25}    ;获取数据缓存对象。    
-         console.log($.data(p));                                 //输出: Object { age=23}             ;获取自定义缓存对象,其实就是$.data(p,undefined,undefined,true)对象的data属性
-         console.log($.cache[p[$.expando]].data === $.data(p));  //输出true,从这里可以看出$.data(p)获取的就是自定义缓存对象,也就是数据缓存对象的data属性对象
-     </script>    
- </body>
- </html>
 
输出如下:

 
源码分析
对于数据缓存模块的静态方法来说,它是以jQuery.extend({})函数直接挂载到jQuery里的,如下:
- jQuery.extend({
-   cache: {},                                //DOM元素的数据缓存对象
-  
-   // Please use with caution
-   uuid: 0,
-   // Unique for each copy of jQuery on the page
-   // Non-digits removed to match rinlinejQuery
-   expando: "jQuery" + ( jQuery.fn.jquery + Math.random() ).replace( /\D/g, "" ),    //页面中每个jQuery副本的唯一标识
-  
-   // The following elements throw uncatchable exceptions if you
-   // attempt to add expando properties to them.
-   noData: {                                   //存放了不支持扩展属性的embed、object、applet元素的节点名称
-     "embed": true,
-     // Ban all objects except for Flash (which handle expandos)
-     "object": "clsid:D27CDB6E-AE6D-11cf-96B8-444553540000",
-     "applet": true
-   },
-   hasData: function( elem ) {                 //判断一个DOM元素或JavaScript对象是否有与之关联的数据
-     elem = elem.nodeType ? jQuery.cache[ elem[jQuery.expando] ] : elem[ jQuery.expando ];     //如果是元素节点(有nodeType属性)则判断在jQuery.cache中是否有jQuery.expando属性,否则认为是JavaScript对象,判断是否有jQuery.expando属性。
-     return !!elem && !isEmptyDataObject( elem );                                              //如果elem存在且含有数据缓存则返回true,isEmptyDataObject是个jQuery内部的工具函数
-   },
-   data: function( elem, name, data, pvt /* Internal Use Only */ ) {
-     /*略*/
-   },
-   removeData: function( elem, name, pvt /* Internal Use Only */ ) {
-     /*略*/
-   },
-   // For internal use only.
-   _data: function( elem, name, data ) {       //设置、读取内部数据,就是调用jQuery.data(),并设置第四个参数为true
-     return jQuery.data( elem, name, data, true );
-   },
-   // A method for determining if a DOM node can handle the data expando
-   acceptData: function( elem ) {              //判断参数elem是否可以设置数据,返回true则可以设置,返回false则不可以
-     if ( elem.nodeName ) {
-       var match = jQuery.noData[ elem.nodeName.toLowerCase() ];
-       if ( match ) {
-         return !(match === true || elem.getAttribute("classid") !== match);
-       }
-     }
-     return true;
-   }
- });
 
我们主要看一下$.data()是怎么设置数据的,懂了怎么设置数据,removeData也就懂了,如下:
- data: function( elem, name, data, pvt /* Internal Use Only */ ) {       //设置、读取自定义数据、内部数据
-   if ( !jQuery.acceptData( elem ) ) {               //检查elem元素是否支持设置数据,如果jQuery.acceptData()函数返回false表示不允许设置数据
-     return;                                           //则直接返回,不继续操作
-   }
-   var privateCache, thisCache, ret,                 //privateCache默认指向数据缓存对象(如果pvt参数未设置或者为false则指向自定义数据),thisCache表示自定义数据缓存对象,如果pvt是true,则privateCache和thisCache都指向数据缓存对象都指向数据缓存对象。ret是读取时的返回值
-     internalKey = jQuery.expando,                   //jQuery.expando页面中每个jQuery副本的唯一标识,把它赋值给internalKey是为了减少拼写字数和缩短作用域链查找。
-     getByName = typeof name === "string",           //getByName表示name是否为字符串
-  
-     // We have to handle DOM nodes and JS objects differently because IE6-7
-     // can't GC object references properly across the DOM-JS boundary
-     isNode = elem.nodeType,                         //isNode表示elem是否为DOM元素
-  
-     // Only DOM nodes need the global jQuery cache; JS object data is
-     // attached directly to the object so GC can occur automatically
-     cache = isNode ? jQuery.cache : elem,           //如果是DOM元素则存储在$.cache中,如果是JavaScript对象则存储在该对象本身 
-  
-     // Only defining an ID for JS objects if its cache already exists allows
-     // the code to shortcut on the same path as a DOM node with no cache
-     id = isNode ? elem[ internalKey ] : elem[ internalKey ] && internalKey,
-     isEvents = name === "events";
-   // Avoid doing any more work than we need to when trying to get data on an
-   // object that has no data at all
-   if ( (!id || !cache[id] || (!isEvents && !pvt && !cache[id].data)) && getByName && data === undefined ) {   //如果是读取数据但没有数据,则返回,避免做不必要的工作,if语句中的符合表达式可以分两个部分,后一部分是getByName && data === undefined,表示,如果name是字符串且data没有设置,则说明是在读数据。 前一部分(!id || !cache[id] || (!isEvents && !pvt && !cache[id].data)表示,如果id不存在说明没有该属性,如果cache[id]不存在则说明没有该数据
-     return;
-   }
-   /*执行到这里有两种情况:1.存储数据 2.读取数据且数据存在*/   
-   if ( !id ) {                                      //如果id不存在,则分配一个
-     // Only DOM nodes need a new unique ID for each element since their data
-     // ends up in the global cache
-     if ( isNode ) {                                   //如果是DOM元素
-       elem[ internalKey ] = id = ++jQuery.uuid;         //jQuery.uuid会自动加1,并附在DOM元素上
-     } else {
-       id = internalKey;                               //否则关联ID就是jQuery.expando
-     }
-   }
-   if ( !cache[ id ] ) {                           //如果DOM对象或JavaScript对象对应的数据缓存对象不存在则初始化为一个空对象
-     cache[ id ] = {};
-     // Avoids exposing jQuery metadata on plain JS objects when the object
-     // is serialized using JSON.stringify
-     if ( !isNode ) {
-       cache[ id ].toJSON = jQuery.noop;
-     }
-   }
-   // An object can be passed to jQuery.data instead of a key/value pair; this gets
-   // shallow copied over onto the existing cache
-   if ( typeof name === "object" || typeof name === "function" ) { //如果name是对象或者函数(函数好像不可以,只能是对象),则批量把参数name中的属性合并到已有的数据缓存对象上,即批量设置数据
-     if ( pvt ) {
-       cache[ id ] = jQuery.extend( cache[ id ], name );
-     } else {
-       cache[ id ].data = jQuery.extend( cache[ id ].data, name );
-     }
-   }
-   privateCache = thisCache = cache[ id ];                         //设置privateCache和thisCache都指向数据缓存对象cache[ id ]
-  
-   // jQuery data() is stored in a separate object inside the object's internal data
-   // cache in order to avoid key collisions between internal data and user-defined
-   // data.
-   if ( !pvt ) {                                                   //如果参数pvt是false或者未设置,则设置thisCache指向自定义数据,
-     if ( !thisCache.data ) {                                        //如果数据缓存对象thisCache.data不存在则先将其初始化为空对象。
-       thisCache.data = {};
-     }
-     thisCache = thisCache.data;
-   }
-   if ( data !== undefined ) {                                     //如果data不是undefined,则把参数data设置到属性name上,这里统一把参数name转换成了驼峰式,这样在读取的时候不管是连字符串还是驼峰式就都不会出错。
-     thisCache[ jQuery.camelCase( name ) ] = data;
-   }
-   // Users should not attempt to inspect the internal events object using jQuery.data,
-   // it is undocumented and subject to change. But does anyone listen? No.
-   if ( isEvents && !thisCache[ name ] ) {
-     return privateCache.events;
-   }
-   // Check for both converted-to-camel and non-converted data property names
-   // If a data property was specified
-   if ( getByName ) {                                            //如果参数name是字符串,则读取单个数据
-  
-     // First Try to find as-is property data
-     ret = thisCache[ name ];                                      //先尝试读取参数name对应的数据
-  
-     // Test for null|undefined property data  
-     if ( ret == null ) {                                          //如果没有读取到则把参数name转换为驼峰式再次尝试读取
-  
-       // Try to find the camelCased property
-       ret = thisCache[ jQuery.camelCase( name ) ];
-     }
-   } else {
-     ret = thisCache;                                          //如果参数2不是字符串,则返回数据缓存对象。
-   }
-   return ret;                                                 //最后返回ret
- },
 
这样就完成数据的设置的,对于jQuery实例上的方法如下:
- jQuery.fn.extend({
-   data: function( key, value ) {      //设置、读取自定义数据,解析html5属性data- key是要设置或读取的数据名,或者是含有键值对的对象,value是要设置的数据值,可以是任意类型
-     var parts, attr, name,
-       data = null;
-     if ( typeof key === "undefined" ) {       //如果未传入参数,即参数格式是.data(),则获取第一个匹配元素关联的数据缓存对象(即获得全部数据)
-       if ( this.length ) {                      //如果该jQuery对象有匹配的元素
-         data = jQuery.data( this[0] );            //获取第一个元素的数据缓存对象
-  
-         if ( this[0].nodeType === 1 && !jQuery._data( this[0], "parsedAttrs" ) ) {    //这里是解析html5里的data-属性的,可以先略过
-           attr = this[0].attributes;
-           for ( var i = 0, l = attr.length; i < l; i++ ) {
-             name = attr[i].name;
-             if ( name.indexOf( "data-" ) === 0 ) {
-               name = jQuery.camelCase( name.substring(5) );
-               dataAttr( this[0], name, data[ name ] );
-             }
-           }
-           jQuery._data( this[0], "parsedAttrs", true );   //返回第一个匹配元素关联的自定义数据缓存对象。如果没有匹配元素则会返回null
-         }
-       }
-       return data;
-     } else if ( typeof key === "object" ) {         //如果key是一个对象,则为每个元素对象调用方法$.data(this,key)批量设置数据
-       return this.each(function() {
-         jQuery.data( this, key );
-       });
-     }
-     parts = key.split(".");
-     parts[1] = parts[1] ? "." + parts[1] : "";      //取出命名空间,比如$(this).data('a.b',123);则parts[1]是.b
-  
-     if ( value === undefined ) {                    //如果传入的格式是.data(key),则认为是读取单个数据
-       data = this.triggerHandler("getData" + parts[1] + "!", [parts[0]]);     //触发自定义事件getData,并把事件监听函数的返回值赋值给变量data
-  
-       // Try to fetch any internally stored data first
-       if ( data === undefined && this.length ) {          //如果事件监听函数没有返回值,才会尝试从自定义数据缓存对象中读取
-         data = jQuery.data( this[0], key );
-         data = dataAttr( this[0], key, data );
-       }
-       return data === undefined && parts[1] ?             //如果从getData()事件监听函数或自定义数据缓存对象或HTML5属性data-中取到了数据,则返回数据;如果没有取到数据,但是指定了命名空间,则去掉命名空间再次尝试读取。
-         this.data( parts[0] ) :
-         data;
-     } else {                                          //如果传入了参数key和value,即参数格式是:.data(key,value),则为每个匹配元素设置任意类型的数据,并触发自定义事件setData()和changeData()。
-       return this.each(function() {
-         var self = jQuery( this ),
-           args = [ parts[0], value ];
-         self.triggerHandler( "setData" + parts[1] + "!", args );        //触发自定义事件setData,感叹号表示只执行没有命名控件的事件监听函数
-         jQuery.data( this, key, value );                                //调用$.data()方法为任意匹配元素设置任意类型的数据
-         self.triggerHandler( "changeData" + parts[1] + "!", args );     //触发自定义事件changeData
-       });
-     }
-   },
-   /*...*/
- })
 
设置数据缓存就是这样的,理解了设置数据缓存,移除就很好理解了。