更好的 Unicode 支持
UTF-16 代码点
在 UTF-16 中的第一个 2 代码点表示单个 16 位码元,这个范围被称为多语言基本平面(Basic Multilingual Plane , BMP )。任何超出该范围的代码点都不能用单个 16 位码元表示,而是会落在扩展平面( supplementary planes )内。 UTF-16 引入了代理对(surrogate pairs )来解决这个问题,允许使用两个 16 位码元来表示单个代码点。这意味着字符串内的任意单个字符都可以用一个码元(共 16 位)或两个码元(共 32 位)来表示,前者对应基本平面字符,而后者对应扩展平面字符。
codePointAt() 方法:可以在给定字符串中按位置提取 Unicode 代码点。该方法接受的是码元位置而非字符位置,并返回一个整数值。( charCodeAt() )
String.fromCodePoint() 方法:可以使用codePointAt() 来提取字符串内中某个字符的代码点,也可以借助 String.fromCodePoint()用给定的代码点来产生包含单个字符的字符串。
normalize() 方法
正则表达式 u 标志
ES6 为正则表达式定义了用于处理Unicode 的 u 标志。
u 标志如何运作
当一个正则表达式设置了 u 标志时,它的工作模式将切换到针对字符,而不是针对码元。这意味着正则表达式将不会被字符串中的代理对所混淆,而是会如预期那样工作。
判断是否支持 u 标志
字符串的其他改动
识别子字符串的方法
includes() 方法:在给定文本存在于字符串中的任意位置时会返回 true ,否则返回false ;
startsWith() 方法:在给定文本出现在字符串起始处时返回 true ,否则返回 false ;
endsWith() 方法:在给定文本出现在字符串结尾处时返回 true ,否则返回 false。
repeat() 方法
它接受一个参数作为字符串的重复次数,返回一个将初始字符串重复指定次数的新字符串。
正则表达式的其他改动
正则表达式 y 标志
y 标志影响正则表达式搜索时的粘连( sticky )属性,它表示从正则表达式的 lastIndex 属性值的位置开始检索字符串中的匹配字符。如果在该位置没有匹配成功,那么正则表达式将停止检索。
复制正则表达式
flags属性
ES6 新增了 flags 属性用于配合 source 属性,让标志的获取变得更容易。这两个属性均为只有 getter 的原型访问器属性,因此都是只读的。
模板字面量
模板字面量是 ES6 针对 JS 直到 ES5 依然完全缺失的如下功能的回应:
1、多行字符串:针对多行字符串的形式概念;
2、基本的字符串格式化:将字符串部分替换为已存在的变量值的能力;
3、HTML 转义:能转换字符串以便将其安全插入到 HTML 中的能力。
基本语法
使用反引号( ` )来包裹普通字符串。在模板字面量中无需对双引号或单引号进行转义。
多行字符串
制造替换位
替换位允许你将任何有效的 JS 表达式嵌入到模板字面量中,并将其结果输出为字符串的一部分。
替换位由起始的 ${ 与结束的 } 来界定,之间允许放入任意的 JS 表达式。
标签化模板
一个模板标签( template tag )能对模板字面量进行转换并返回最终的字符串值,标签在模板的起始处被指定,即在第一个 ` 之前。
定义标签
一个名为 passthru() 的函数,该函数将会接收到三个参数。首先是一个literals 数组,包含如下元素:
在首个替换位之前的空字符串( "" );
首个替换位与第二个替换位之间的字符串( " items cost $" );
第二个替换位之后的字符串( "." )。
接下来的参数会是 10 ,也就是 count 变量的解释值,它也会成为 substitutions 数组的第一个元素。
最后一个参数则会是 "2.50" ,即 (count * price).toFixed(2) 的解释值,并且会是 substitutions 数组的第二个元素。
需要注意 literals 的第一个元素是空字符串,以确保 literals[0] 总是字符串的起始部分,正如 literals[literals.length - 1] 总是字符串的结尾部分。同时替换位的元素数量也总是比字面量元素少 1 ,意味着表达式 substitutions.length === literals.length - 1 的值总是 true。
使用模板字面量中的原始值
模板标签也能访问字符串的原始信息,主要指的是可以访问字符在转义之前的形式。获取原始字符串值的最简单方式是使用内置的 String.raw() 标签。