jQuery选择器源码解读（四）：tokenize方法的Expr.preFilter

Expr.preFilter是tokenize方法中对ATTR、CHILD、PSEUDO三种选择器进行预处理的方法。具体如下：
Expr.preFilter : {
	"ATTR" : function(match) {
		/*
		 * 完成如下任务：
		 * 1、属性名称解码
		 * 2、属性值解码
		 * 3、若判断符为~=，则在属性值两边加上空格
		 * 4、返回最终的mtach对象
		 * 
		 * match[1]表示属性名称，
		 * match[1].replace(runescape, funescape)：将属性名称中的十六进制数解码成
		 *   单字节unicode字符或双字节unicode字符（中文或其它需要两个字节表达的文字）
		 * 正则表达式的详细说明，可以参看我的“详解jQuery选择器正则表达式”文章
		 */
		match[1] = match[1].replace(runescape, funescape);

		/*
		 * 将属性值解码
		 * match[4]：表示放在单引号或双引号内的属性值
		 * match[5]: 表示不用引号括起来的属性值
		 */
		match[3] = (match[4] || match[5] || "").replace(runescape,
				funescape);

		/*
		 * ~=的意思是单词匹配，在W3C中对单词的定义是以空白为不同单词的分隔符
		 * 故此处在match[3]两边加上空格后，可以利用indexOf，正确识别出该单词是否存在
		 */
		if (match[2] === "~=") {
			match[3] = " " + match[3] + " ";
		}

		/*
		 * 返回有用的前四个元素结果
		 */
		return match.slice(0, 4);
	},

	"CHILD" : function(match) {
		/*
		 * 完成如下几项任务：
		 * 1、把命令中child和of-type之前的字符变成小写字符
		 * 2、对于nth开头的选择器检查括号内的数据有效性
		 * 3、match[4]和match[5]分别存放xn+b中的x和b，x和b允许是负数
		 * 4、返回最终的match对象
		 * 
		 * match[1]：(only|first|last|nth|nth-last)中的一个
		 */
		match[1] = match[1].toLowerCase();

		/*
		 * 对于nth-child、nth-of-type、nth-last-child、nth-last-of-type四种类型括号内需设置有效数据
		 * 而其它则括号内不允许有任何数据
		 */
		if (match[1].slice(0, 3) === "nth") {
			/*
			 * 若选择器括号内没有有效参数，则抛出异常
			 * 举例：若选择器是nth或nth(abc)则属于非法选择器
			 */
			if (!match[3]) {
				Sizzle.error(match[0]);
			}
			/*
			 * 下面先以nth-child()为例介绍一下语法，以便更好的理解下面代码的作用
			 * nth-child允许的几种使用方式如下：
			 * 	 :nth-child(even)
			 * 	 :nth-child(odd)
			 * 	 :nth-child(3n)
			 * 	 :nth-child(+2n+1)
			 * 	 :nth-child(2n-1)
			 * 下面代码中赋值号左侧的match[4]、match[5]用于分别记录括号内n前及n后的数值，包括正负号
			 * 对于:nth-child(even)和:nth-child(odd)来说，match[4]为空，
			 *   所以返回 2 * (match[3] === "even" || match[3] === "odd")的计算结果
			 *   因为在js中true=1,false=0，所以(match[3] === "even" || match[3] === "odd")等于1
			 *   因此，2 * (match[3] === "even" || match[3] === "odd")的计算结果为2
			 * 
			 * 等号右侧的“+”的作用是强制类型转换，将之后的字符串转换成数值类型 
			 */
			match[4] = +(match[4] ? match[5] + (match[6] || 1)
					: 2 * (match[3] === "even" || match[3] === "odd"));
			match[5] = +((match[7] + match[8]) || match[3] === "odd");

		} else if (match[3]) {
			/*
			 * 若非nth起头的其它CHILD类型选择器带有括号说明，则抛出异常
			 * 这里jQuery并没有严格按照W3C的规则来判定，因为其允许:first-child()的这种形式存在
			 * 也就是对于jQuery来说:first-child()等同于:first-child，是合法选择器
			 */
			Sizzle.error(match[0]);
		}

		return match;
	},

	"PSEUDO" : function(match) {
		/*
		 * 完成如下任务：
		 * 1、获取伪类中用引号括起来的值
		 * 2、对于非引号括起来的值，若存在伪类嵌套，则进一步解析确定当前伪类实际结束位置，
		 *  获取当前伪类的完整字符串和值
		 * 3、返回match中的前三项的副本。
		 * 
		 * unquoted表示括号内非引号括起来的值，
		 * 以:eq(2)为例，unquoted=2
		 */
		var excess, unquoted = !match[5] && match[2];

		/*
		 * 因为pseudo与child的匹配正则表达式有交集，所以，需要把属于child的部分忽略掉
		 */
		if (matchExpr["CHILD"].test(match[0])) {
			return null;
		}
		/*
		 * 若括号内的值使用引号(match[3])括起来的，
		 * 则将除引号外的值(match[4])赋给match[2]。
		 * match[3]表示引号。
		 */
		if (match[3] && match[4] !== undefined) {
			match[2] = match[4];
		} else if (unquoted
				/*
				 * rpseudo.test(unquoted)：用来测试unquoted是否包含伪类，
				 * 若包含伪类，则说明有可能存在伪类嵌套的可能性，需要进一步对unquoted进行解析
				 * 例如： :not(:eq(3))
				 */
				&& rpseudo.test(unquoted)
				&&
				/*
				 * 获取unquoted中连续有效地选择器最后一个字符所在位置
				 */
				(excess = tokenize(unquoted, true))
				&&
				/*
				 * unquoted.indexOf(")", unquoted.length - excess)
				 *   从之前获得的连续有效地选择器最后一个字符所在位置之后找到")"所在位置，
				 *   通常就在当前位置之后。
				 * 再减去unquoted.length，用来获得match[0]中的有效完整的伪类字符串最后位置，
				 *   注意，此时excess是一个负值
				 * 
				 */
				(excess = unquoted.indexOf(")", unquoted.length
						- excess)
						- unquoted.length)) {

			// 获取有效的完整伪类match[0]和伪类括号内的数据match[2]
			match[0] = match[0].slice(0, excess);
			match[2] = unquoted.slice(0, excess);
		}

		// 返回match前三个元素的副本
		return match.slice(0, 3);
	}
}
频道导航

jQuery选择器源码解读（四）：tokenize方法的Expr.preFilter

您可能感兴趣的文章: