ES6加强了对Unicode的支持,并且扩展了字符串对象。
字符的Unicode表示法
JavaScript允许采用 \uxxxx 形式表示一个字符,其中“xxxx”表示字符的码点。
但是,这种表示法只限于 \u0000 —— \uFFFF 之间的字符。超出这个范围的字符,必须用两个双字节的形式表达。
"\uD842\uDFB7"
// " "
有了这种表示法之后,JavaScript共有6种方法可以表示一个字符。
'\z' === 'z' // true
'\172' === 'z' // true
'\x7A' === 'z' // true
'\u007A' === 'z' // true
'\u{7A}' === 'z' // true
codePointAt()
JavaScript内部,字符以UTF-16的格式储存,每个字符固定为2个字节。对于那些需要4个字节储存的字符(Unicode码点大于 0xFFFF的字符),JavaScript会认为它们是两个字符。
var s = " ";
s.length // 2
s.charAt(0) // ''
s.charAt(1) // ''
s.charCodeAt(0) // 55362
s.charCodeAt(1) // 57271
codePointAt 方法返回的是码点的十进制值,如果想要十六进制的值,可以使用 toString 方法转换一下。
codePointAt方法是测试一个字符由两个字节还是由四个字节组成的最简单方法。
String.fromCodePoint()
ES5提供 方法,用于从码点返回对应字符,但是这个方法不能识别32位的UTF-16字符(Unicode编号大 于 )。
String.fromCharCode
注意, fromCodePoint 方法定义在 String 对象上,而 codePointAt 方法定义在字符串的实例对象上。
字符串的遍历器接口
ES6为字符串添加了遍历器接口(详见《Iterator》一章),使得字符串可以被 for...of 循环遍历。
at()
ES5对字符串对象提供 charAt 方法,返回字符串给定位置的字符。该方法不能识别码点大于 0xFFFF 的字符。
'abc'.charAt(0) // "a"
'吉 '.charAt(0) // "\uD842"
上面代码中, charAt 方法返回的是UTF-16编码的第一个字节,实际上是无法显示的。 目前,有一个提案,提出字符串实例的 at 方法,可以识别Unicode编号大于 0xFFFF 的字符,返回正确的字符。
'abc'.at(0) // "a"
' 吉'.at(0) // " "
这个方法可以通过垫片库实现。
normalize()
为了表示语调和重音符号,Unicode提供了两种方法。一种是直接提供带重音符号的字符,比如 (\u01D1)。另一种是提供 合成符号(combiningcharacter),即原字符与重音符号的合成,两个字符合成一个字符,比如 (\u004F)和 ˇ (\u030C) 合成 Ǒ (\u004F\u030C)。
这两种表示方法,在视觉和语义上都等价,但是JavaScript不能识别。
ES6提供字符串实例的 normalize() 方法,用来将字符的不同表示方法统一为同样的形式,这称为Unicode正规化。
includes(), startsWith(), endsWith()
传统上,JavaScript只有 indexOf 方法,可以用来确定一个字符串是否包含在另一个字符串中。ES6又提供了三种新方法。
includes():返回布尔值,表示是否找到了参数字符串。 startsWith():返回布尔值,表示参数字符串是否在源字符串的头部。 endsWith():返回布尔值,表示参数字符串是否在源字符串的尾部。
repeat()
repeat 方法返回一个新字符串,表示将原字符串重复 n 次。
padStart(),padEnd()
ES7推出了字符串补全长度的功能。如果某个字符串不够指定长度,会在头部或尾部补全。 padStart 用于头部补 全, padEnd 用于尾部补全。
'x'.padStart(5, 'ab') // 'ababx' 'x'.padStart(4, 'ab') // 'abax'
'x'.padEnd(5, 'ab') // 'xabab' 'x'.padEnd(4, 'ab') // 'xaba'
如果原字符串的长度,等于或大于指定的最小长度,则返回原字符串。
如果省略第二个参数,则会用空格补全长度。
另一个用途是提示字符串格式。
'12'.padStart(10, 'YYYY-MM-DD') // "YYYY-MM-12" '09-12'.padStart(10, 'YYYY-MM-DD') // "YYYY-09-12"
模板字符串
模板字符串(template string)是增强版的字符串,用反引号(`)标识。它可以当作普通字符串使用,也可以用来定义多行字符 串,或者在字符串中嵌入变量。
// 普通字符串
`In JavaScript '\n' is a line-feed.`
// 多行字符串
`In JavaScript this is
not legal.` console.log(`string text line 1
string text line 2`);
// 字符串中嵌入变量
var name = "Bob", time = "today"; `Hello ${name}, how are you ${time}?`
上面代码中的字符串,都是用反引号表示。如果在模板字符串中需要使用反引号,则前面要用反斜杠转义。
由于模板字符串的大括号内部,就是执行JavaScript代码,因此如果大括号内部是一个字符串,将会原样输出。
实例:模板编译(难)
标签模板
模板字符串的功能,不仅仅是上面这些。它可以紧跟在一个函数名后面,该函数将被调用来处理这个模板字符串。这被称为“标 签模板”功能(tagged template)。
String.raw()
String.raw 方法,往往用来充当模板字符串的处理函数,返回一个斜杠都被转义(即斜杠前面再加一个斜杠)的字符串,对 应于替换变量后的模板字符串。
String.raw({ raw: 'test' }, 0, 1, 2); // 't0e1s2t'
// 等同于
String.raw({ raw: ['t','e','s','t'] }, 0, 1, 2);
作者开发经验总结的文章推荐,持续更新学习心得笔记
五星推荐 Runtime 10种用法(没有比这更全的了)
五星推荐 成为iOS顶尖高手,你必须来这里(这里有最好的开源项目和文章)
五星推荐 iOS逆向Reveal查看任意app 的界面
五星推荐手把手教你使用python自动打包上传应用分发
JSPatch (实时修复App Store bug)学习(一)
iOS 高级工程师是怎么进阶的(补充版20+点)
扩大按钮(UIButton)点击范围(随意方向扩展哦)
最简单的免证书真机调试(原创)
通过分析微信app,学学如何使用@2x,@3x图片
TableView之MVVM与MVC之对比
使用MVVM减少控制器代码实战(减少56%)
ReactiveCocoa添加cocoapods 配置图文教程及坑总结