深入理解ES6--2.字符串与正则表达式

原创文章&经验总结&从校招到A厂一路阳光一路沧桑

详情请戳www.codercc.com

image

主要知识点：新增的字符串处理方法、模板字面量以及正则表达式上的改动

字符串与正则表达式的知识点.png

1. 字符串处理方法

codePointAt()方法

ES6 为全面支持 UTF-16 而新增的方法之一是 codePointAt() ，它可以在给定字符串中按位
置提取 Unicode 代码点。该方法接受的是码元位置而非字符位置，并返回一个整数值。

String.fromCodePoint()方法

可以使用codePointAt() 来提取字符串内中某个字符的代码点，也可以借助 String.fromCodePoint()用给定的代码点来产生包含单个字符的字符串

normalize()方法

Unicode 另一个有趣之处是，不同的字符在排序或其它一些比较操作中可能会被认为是相同
的。有两种方式可以定义这种关联性：第一种是规范相等性（canonical equivalence ），
意味着两个代码点序列在所有方面都被认为是可互换的。例如，两个字符的组合可以按规范
等同于另一个字符。第二种关联性是兼容性（compatibility ），两个兼容的代码点序列看起
来有差别，但在特定条件下可互换使用。

ES6 给字符串提供了** normalize()** 方法，以支持 Unicode 标准形式。因此，在比较字符时，可以先将字符用同一种标准化方法，让它们标准化，再进行比较，例如，比较字符数组中的大小：

let compare = function(values=[]){
    values.sort((first,second)=>{
        let firstNormalized = first.normalize();
        let secondNormalized = second.normalize();

        if (firstNormalized < secondNormalized) {
            return -1;
        } else if (firstNormalized === secondNormalized) {
            return 0;
        } else {
            return 1;
        }
    })

}

let arr = ['a','z','c','g'];
compare(arr);
console.log(arr);//["a", "c", "g", "z"]

识别子字符串的方法

为了识别字符串是否存在于其他字符串中，ES6提供了相应的方法来满足这类需求：

includes()方法：在给定文本存在于字符串中的任意位置时会返回 true，否则会返回 false；
startsWith() 方法：在给定文本出现在字符串起始处时返回 true ，否则返回 false ；
endsWith() 方法：在给定文本出现在字符串结尾处时返回 true ，否则返回 false 。

每个方法都接受两个参数：需要搜索的文本，以及可选的搜索起始位置索引。当提供了第二
个参数时， includes() 与 startsWith()方法会从该索引位置开始尝试匹配；当第二个参数未提供时， includes() 与 startsWith() 方法会从字符串起始处开始查找，而 endsWith()方法则从尾部减去第二个参数后的位置作为起始位置。

repeat()方法

ES6 还为字符串添加了一个 repeat() 方法，它接受一个参数作为字符串的重复次数，返回一个将初始字符串重复指定次数的新字符串。例如：

//repeat()方法

console.log('x'.repeat(3)); //xxx
console.log('hello world'.repeat(2)); //hello worldhello world

2. 模板字面量

基本语法

模板字面量的最简单语法，是使用反引号（ ）` 来包裹普通字符串，而不是用双引号或单引号，例如：

//模板字面量

let  message = `hello world`;
console.log(message); //hello world
console.log(typeof message); //string
console.log(message.length); //1

若想字符串中包含反引号，可以使用反斜杠（\）进行转义即可：

let  message = `\`hello world\``;
console.log(message); //`hello world`

多行字符串

使用模板字面量可以轻松创建多行字符串，例如：

let message = `hello

world`;
console.log(message);
输出：
hello

        world

替换位

替换位可以嵌入到模板字面量中，替换位最终可以转换为字符串的一部分输出。替换位可以是任意的js表达式。替换位的语法采用 ${} 表示。

例如，替换位为变量：

let msg = 'hello';
let message = `${msg} world`;
console.log(message); //hello world

替换位不仅仅可以是简单的变量，还可以嵌入计算表达式、函数调用等，甚至还可以将模板字面量作为替换位嵌入到另一个模板字面量中。

3. 模板标签

一个模板标签（template tag ）能对模板字面量进行转换并返回最终的字符串值，标签在模板的起始处被指定，即在第一个 ` 之前。例如：

let message = tag`Hello world`;

tag 就是会被应用到 Hello world 模板字面量上的模板标签。

定义标签

一个标签（tag ）仅是一个函数，它被调用时接收需要处理的模板字面量数据。标签所接收的数据被划分为独立片段，并且必须将它们组合起来以创建结果。第一个参数是个数组，包含被 JS 解释过的字面量字符串，随后的参数是每个替换位的解释值。

标签函数的参数一般定义为剩余参数形式，以便更容易处理数据，如下：

function tag(literals, ...substitutions) {
// 返回一个字符串
}

使用模板字面量中的原始值

模板标签也能访问字符串的原始信息，主要指的是可以访问字符在转义之前的形式。获取原始字符串值的最简单方式是使用内置的 String.raw() 标签。例如：

let message1 = `Multiline\nstring`,
message2 = String.raw`Multiline\nstring`;
console.log(message1); // "Multiline
                       // string"
console.log(message2); // "Multiline\nstring"

4. 正则表达式的改动

正则表达式u标识：你可以使用正则表达式来完成字符串的很多通用操作。但要记住，正则表达式假定单个字符使用一个 16 位的码元来表示。为了解决这个问题， ES6 为正则表达式定义了用于处理Unicode 的 u 标志。当一个正则表达式设置了 u标志时，它的工作模式将切换到针对字符，而不是针对码元。
正则表达的y标志： y 标志影响正则表达式搜索时的粘连（ sticky ）属性，它表示从正则表达式的 lastIndex 属性值的位置开始检索字符串中的匹配字符。如果在该位置没有匹配成功，那么正则表达式将停止检索；
复制正则表达式：使用RegExp构造器时允许使用第二个参数，并且让它覆盖第一个参数中的标志；
flag属性：ES6 新增了 flags 属性用于配合 source 属性，让标志的获取变得更容易。例如：
```
 var re = /ab/g;
 console.log(re.source); // ab
 console.log(re.flags); // g
```
本例查找了 re 的所有标志并将其打印到控制台，所用的代码量要比 toString() 方式少得多。同时使用 source 和 flags 允许你直接提取正则表达式的组成部分，而不必将正则表达式转换为字符串。

最后编辑于：2020.05.31 13:23:21

人面猴
序言：七十年代末，一起剥皮案震惊了整个滨河市，随后出现的几起案子，更是在滨河造成了极大的恐慌，老刑警刘岩，带你破解...
沈念sama阅读 203,324评论 5赞 476
死咒
序言：滨河连续发生了三起死亡事件，死亡现场离奇诡异，居然都是意外死亡，警方通过查阅死者的电脑和手机，发现死者居然都...
沈念sama阅读 85,303评论 2赞 381
救了他两次的神仙让他今天三更去死
文/潘晓璐我一进店门，熙熙楼的掌柜王于贵愁眉苦脸地迎上来，“玉大人，你说我怎么就摊上这事。” “怎么了？”我有些...
开封第一讲书人阅读 150,192评论 0赞 337
道士缉凶录：失踪的卖姜人
文/不坏的土叔我叫张陵，是天一观的道长。经常有香客问我，道长，这世上最难降的妖魔是什么？我笑而不...
开封第一讲书人阅读 54,555评论 1赞 273
港岛之恋（遗憾婚礼）
正文为了忘掉前任，我火速办了婚礼，结果婚礼上，老公的妹妹穿的比我还像新娘。我一直安慰自己，他们只是感情好，可当我...
茶点故事阅读 63,569评论 5赞 365
恶毒庶女顶嫁案：这布局不是一般人想出来的
文/花漫我一把揭开白布。她就那样静静地躺着，像睡着了一般。火红的嫁衣衬着肌肤如雪。梳的纹丝不乱的头发上，一...
开封第一讲书人阅读 48,566评论 1赞 281
城市分裂传说
那天，我揣着相机与录音，去河边找鬼。笑死，一个胖子当着我的面吹牛，可吹牛的内容都是我干的。我是一名探鬼主播，决...
沈念sama阅读 37,927评论 3赞 395
双鸳鸯连环套：你想象不到人心有多黑
文/苍兰香墨我猛地睁开眼，长吁一口气：“原来是场噩梦啊……” “哼！你这毒妇竟也来了？” 一声冷哼从身侧响起，我...
开封第一讲书人阅读 36,583评论 0赞 257
万荣杀人案实录
序言：老挝万荣一对情侣失踪，失踪者是张志新（化名）和其女友刘颖，没想到半个月后，有当地人在树林里发现了一具尸体，经...
沈念sama阅读 40,827评论 1赞 297
护林员之死
正文独居荒郊野岭守林人离奇死亡，尸身上长有42处带血的脓包…… 初始之章·张勋以下内容为张勋视角年9月15日...
茶点故事阅读 35,590评论 2赞 320
白月光启示录
正文我和宋清朗相恋三年，在试婚纱的时候发现自己被绿了。大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
茶点故事阅读 37,669评论 1赞 329
活死人
序言：一个原本活蹦乱跳的男人离奇死亡，死状恐怖，灵堂内的尸体忽然破棺而出，到底是诈尸还是另有隐情，我是刑警宁泽，带...
沈念sama阅读 33,365评论 4赞 318
日本核电站爆炸内幕
正文年R本政府宣布，位于F岛的核电站，受9级特大地震影响，放射性物质发生泄漏。R本人自食恶果不足惜，却给世界环境...
茶点故事阅读 38,941评论 3赞 307
男人毒药：我在死后第九天来索命
文/蒙蒙一、第九天我趴在偏房一处隐蔽的房顶上张望。院中可真热闹，春花似锦、人声如沸。这庄子的主人今日做“春日...
开封第一讲书人阅读 29,928评论 0赞 19
一桩弑父案，背后竟有这般阴谋
文/苍兰香墨我抬头看了看天上的太阳。三九已至，却和暖如春，着一层夹袄步出监牢的瞬间，已是汗流浃背。一阵脚步声响...
开封第一讲书人阅读 31,159评论 1赞 259
情欲美人皮
我被黑心中介骗来泰国打工，没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留，地道东北人。一个月前我还...
沈念sama阅读 42,880评论 2赞 349
代替公主和亲
正文我出身青楼，却偏偏与公主长得像，于是被迫代替她去往敌国和亲。传闻我的和亲对象是个残疾皇子，可洞房花烛夜当晚...
茶点故事阅读 42,399评论 2赞 342

深入理解ES6--2.字符串与正则表达式

1. 字符串处理方法

2. 模板字面量

3. 模板标签

4. 正则表达式的改动

推荐阅读更多精彩内容