34 KiB
上卷
编译原理
尽管 JavaScript 经常被归类为“动态”或“解释执行”的语言,但实际上它是一门编译语言。JavaScript 引擎进行的编译步骤和传统编译语言非常相似,但有些地方可能比预想的要复杂。
传统编译流程:
-
分词/此法分析(Tokenizing/Lexing)
这个过程会将有字符组成的字符串分解成(对编程语言来说)有意义的代码块,这些代码块被称为词法单元(token)。例如:
var a = 2
;这段程序通常会被分解成词法单元:var
、a
、=
、2
;空格是否会被当成词法单元,取决于空格在这门语言种是否具有意义。 -
解析/语法分析(Parsing)
这个过程是将词法单元流(数组)转换成一个由元素逐级嵌套所组成的代表了程序语法的树。这个树被称为“抽象语法树”(Abstract Syntax Tree,AST)。
var a = 2
的 AST 为:VariableDeclaration --Identifier = a --AssignmentExpression ----NumericLiteral = 2
-
代码生成
将 AST 转换为可执行代码的过程被称为代码生成。这个过程与语言、目标平台等息息相关。简单来说就是将 AST 转换为一组机器指令,用来创建一个叫做 a 的变量(包括分配内存等),并将值 2 存储在 a 中。
JavaScript 的编译
JavaScript 的编译由 JavaScript 引擎来负责(包括执行)。编译通常由三个部分组成:
- 引擎:从头到尾负责整个 JavaScript 的编译以及执行;
- 编译器:负责语法分析以及代码生成;
- 作用域:负责收集并维护由所有声明的标识符(变量)组成的一系列查询,并实施一套非常严格的规则,确定当前执行的代码对这些标识符的访问权限。
在我们看来var a = 2
;这是一个普通的变量声明。而在 JavaScript 引擎看来这里有两个完全不同的声明:
var a
,编译器会寻找当前作用域中是否有同样的声明。如果有,则忽略该声明,并继续编译;否则它会在当前作用域(全局/函数作用域)的集合中声明一个新的变量,并命名为 a。- 接下来编译器会为引擎生成运行时所需的代码,这些代码用来处理赋值(
a = 2
)操作。引擎会在当前作用域中查找变量 a。如果能找到,则为其赋值;如果找不到,则继续向上查找(作用域链)。
由于编译的第一步操作会寻找所有的var
关键词声明,无论它在代码的什么位置,都会声明好。在代码真正运行时,所有声明都已经声明好了,哪怕它是在其他操作的下面,都可以直接进行。这就是var
关键词的声明提升。
a = 2;
console.log(a);
var a;
LHS 和 RHS
编译器在编译过程的第二步生成了代码,引擎执行它时,就会查找变量 a 来判断它是否已经声明过。但引擎如何进行查找,影响最终查找的结果。
LHS 和 RHS 分别对应的是左侧查找与右侧查找。左右两侧分别代表一个赋值操作的左侧和右侧。也就说,当变量出现在赋值操作的左侧时进行 LHS 查询,出现在右侧时进行 RHS 查询。
例如:a = 2
,这里进行的就是 LHS 查询。这里不关心 a 的当前值,只想找到 a 并为其赋一个值。
而:console.log(a)
,这里进行的是 RHS 查询。因为这里需要取到 a 的值,而不是为其赋值。
“赋值操作的左侧和右侧”并不一定代表就是=
的左右两侧,赋值操作还有其他多种形式。因此,可以在概念上理解为“查询被赋值的目标(LHS)”以及”查询目标的值(RHS)“。
小测验:
寻找 LHS 查询(3处)以及 RHS 查询(4处)。
function foo(a) {
var b = a;
return a + b;
}
var c = foo(2);
LHS:
var c = foo(...)
:为变量 c 赋值foo(2)
:传递参数时,为形参 a 赋值 2var b = a
:为变量 b 赋值
RHS:
var c = foo(...)
:查询foo()
var b = a
:(为变量 b 赋值时)取得 a 的值return a + b
:取得 a 与 b(两次)
异常
通过详细的了解异常可以准确的确定发生的问题所在。
在 LHS 查询时,如果到作用域顶部还没有查询到声明,则作用域会热心的帮我们(隐式)创建一个全局变量(非严格模式下)。
而在 RHS 查询时,如果在作用域顶部还没有查询到声明,就会抛出一个 ReferenceError 异常。
在严格模式下,LHS 如果没有找到声明,引擎会抛出一个和 RHS 类似的 ReferenceError 异常。
无论是 LHS 还是 RHS 都是查询一个引用,而没有查询到对应的引用时,就会得到(引用)ReferenceError 异常。
接下来,如果 RHS 查询到了一个变量,但是我们尝试对这个变量的值进行不合理的操作。例如对一个非函数进行函数调用,或者对对象中不存在的属性进行引用。那么引擎会抛出另外一个异常,叫做 TypeError。
闭包
闭包是基于词法作用域书写代码时所产生的自然结果。闭包的主要定义:
当函数可以记住并访问所在的词法作用域时,就产生了闭包,即使函数是在当前词法作用域之外执行。
JavaScript 使用的是词法作用域模型,另一种作用域模型是动态作用域。
仔细来看,闭包的主要定义有:
- 函数记住并可以访问所在的词法作用域
- 在当前词法作用域之外执行也能继续访问所在的词法作用域
来看一个例子:
function foo() {
const a = 123;
function bar() {
console.log(a);
}
bar();
}
foo();
这段代码看起来好像符合闭包的一部分定义,虽然bar()
函数并没有脱离当前的词法作用域执行。但是它依然记住了foo()
的词法作用域,并能访问。
它确实满足闭包定义的一部分(很重要的一部分),从技术上讲,也许是,但并不能完全断定这就是闭包。通常我们所见到的与认为闭包的情况就是满足所有定义的时候:
function foo() {
const a = 321;
function bar() {
console.log(a);
}
return bar;
}
// 同理
// foo()();
const baz = foo()
baz();
因为垃圾收集机制,当一个函数执行结束后,通常它的整个内部作用域会被销毁。当我们的foo()
函数执行结束后,看上去它的内容不会再被使用,所以很自然的考虑会被回收。
但闭包的神奇之处就在这里,它会阻止这一切的发生。当bar
被return
出去之后,在其词法作用域的外部依然能够访问foo()
的内部作用域。bar
依然持有对该作用域的引用,这个引用就叫作闭包。
这也是经常见到说闭包会影响性能的主要原因。某些情况下,它确实会影响到性能,例如过度多的返回本不需要的函数,甚至是嵌套。这会导致本不需要的作用域没有被回收。
常见的闭包
上述将一个函数return
出来的案例是最常见的闭包案例。但在我们的代码中,也有些其他非常常见的闭包。不过平时可能没有太过去注意它。
先来回顾一下定义:
无论通过何种手段将内部函数传递到词法作用域之外,它都会保留对改内部词法作用域的引用,无论在何处执行这个函数都会使其闭包。
function waitAMinute(msg: string) {
setTimeout(() => {
console.log(msg);
}, 1000);
}
waitAMinute('嘤嘤嘤');
function btnClick(selector: string, msg: string) {
$(selector).click(() => {
alert(msg);
});
}
btnClick('#btn_1', 'hah');
btnClick('#btn_2', 'got you');
this 全面解析
this 和动态作用域有些许类似,他们都是在执行时决定的。this 是在调用时被绑定的,完全取决于函数的调用位置。
确定调用位置
当一个函数被调用是,会创建一个活动记录(执行期上下文)。这个记录会包含函数在哪里被调用(调用栈)、函数的调用方式、传入的参数等信息。this 就是这个记录里的一个属性。
调用位置就是函数在代码中被调用的位置,而不是声明的位置。可以类似于这样来这个记录并分析出函数的真正调用位置。
function foo() {
// 当前调用栈:foo
console.log('foo');
bar();
}
function bar() {
// 当前调用栈:foo --> bar
console.log('bar');
baz();
}
function baz() {
// 当前调用栈:foo --> bar --> baz
console.log('baz');
}
foo();
绑定规则
this 是在运行时动态绑定的,所以在不同的情况下,this 可能会发生各种意料之外的情况。
默认绑定
当函数在全局环境下独立调用时,this 会指向为全局对象。
var a = 123;
function foo() {
console.log(this.a); // 123
}
而当函数处理严格模式下,则不能将全局对象用于默认绑定,因此 this 会绑定到undefined
var a = 123;
function foo() {
"use strict"
console.log(this.a); // TypeError: this is undefined
}
还有一个微妙的细节,虽然 this 的绑定完全取决于调用的位置,但是只有foo()
函数本身处于非严格模式才能绑定到全局对象。如果只是函数执行时所在严格模式下,而本身是非严格模式,则不影响默认绑定规则。
var a = 123;
function foo() {
console.log(this.a);
}
(() => {
'use strict';
foo();
})();
通常来说不推荐在代码中混用严格模式与非严格模式。
隐式绑定
另外一种规则是考虑调用位置是否有上下文对象,或者说某个对象是否包含这个函数。
function foo(this: typeof obj) {
console.log(this.name);
}
const obj = {
name: 'xfy',
foo: foo
};
obj.foo() // xfy
这种方法可以理解为将foo()
的函数体赋值给了对象 obj 的一个属性,而执行时是从 obj 作为上下文对象来执行的。所以 this 隐式的绑定到了 obj 对象。
对象属性引用链中只有上一层或者说最后一层在调用位置中起作用。
function foo(this: typeof obj) {
console.log(this.name);
}
const obj = {
name: 'xfy',
foo: foo,
};
obj.foo(); // xfy
const alotherObj = {
name: 'dfy',
obj: obj,
};
alotherObj.obj.foo(); // xfy
隐式丢失
既然会隐式的绑定,那也就会出现隐式的丢失问题。
function foo() {
console.log(this.name);
}
const obj = {
name: 'xfy',
age: 18,
foo,
};
const bar = obj.foo; // 函数别名
bar();
虽然 bar 是obj.foo
的一个引用,但是它引用的是函数体本身。可以理解为将函数体传递给了 bar 这个变量,这是调用bar()
是一个不带任何修饰的函数调用,因此使用了默认绑定。
另一种常见且出乎意料的情况就是在传递回调函数时:
function foo() {
console.log(this.name);
}
function doFoo(fn) {
fn();
}
const obj = {
name: 'xfy',
age: 18,
foo,
};
doFoo(obj.foo);
参数传递其实就是一种隐式赋值,因此我们传入函数是也会被隐式赋值。只要函数体被传递后,且调用时脱离了原有的对象,就会导致 this 的隐式丢失。
包括setTimeout()
方法丢失 this 也是同理。
显式绑定
因为原型的特性,JavaScript 中函数也自己的属性。大多数宿主环境都会提供call()
与apply()
来给我们显式的绑定 this。
function foo() {
console.log(this.name);
}
const obj = {
name: 'xfy',
age: 18,
foo,
};
foo.call(obj);
call 与 apply 只是传参不同。
使用显式的绑定可以很好的解决传递参数时隐式丢失 this 的问题
function foo() {
console.log(this.name);
}
const obj = {
name: 'xfy',
age: 18,
foo,
};
function bar() {
foo.call(obj);
}
setTimeout(bar, 1000);
// 同理
// setTimeout(() => {
// obj.foo();
// }, 1000);
这里在bar()
的内部直接手动显式的把foo()
绑定到了 obj,无论之后怎么调用,在何处调用。都会手动的将 obj 绑定在foo()
上。这种绑定称之为硬绑定。
不过这种绑定是特意的例子,这里手动为foo()
绑定到了 obj。在多数情况下,我们可能需要更灵活一点。
在 JavaScript 装饰器模式🎊 - 🍭Defectink (xfy.plus) 中介绍了这种工作模式。通过一个包装器配合显式绑定就能解决大部分情况下的问题。
function foo(msg) {
console.log(this.name);
console.log(msg);
}
function wrapper(fn, obj) {
return (...rest) => {
fn.apply(obj, rest);
};
}
const obj = {
name: 'xfy',
age: 18,
};
const bar = wrapper(foo, obj);
bar('嘤嘤嘤');
但包装器不仅仅只是用来解决 this 丢失的问题,但对 this 绑定的问题 ES5 提供了内置的方法Function.prototype.bind
。
function foo() {
console.log(this.name);
}
const obj = {
name: 'xfy',
age: 18,
};
const bar = foo.bind(obj);
bar();
new 绑定
在传统面向类的语言中,“构造函数”是类中的一些特殊的方法,使用类时会调用类中的构造函数。通常类似于这样:
myObj = new MyClass()
在 JavaScript 中,所有函数都可以被 new 操作符所调用。这种调用称为构造函数调用,实质上并不存在所谓的“构造函函数”,只有对于函数的“构造调用”。
使用 new 来发生构造函数调用时,会执行:
- 创建(构造)一个新对象。
- 对新对象执行
[[Prototype]]
连接。 - 对新对象绑定到函数调用的 this。
- 如果函数没有返回其他对象,那么在 new 调用后自动返回这个新对象。
function Foo(name) {
this.name = name;
}
const bar = new Foo('xfy');
console.log(bar.name);
使用 new 操作符来调用foo()
时,会构造一个新对象并把它绑定到foo()
中的 this 上。new 是最后一种可以影响函数调用时 this 绑定行为的方法,我们称之为 new 绑定。
ES6 的 class 只是一个语法糖,但是它也解决了一些问题。
优先级
上述描述的四条规则中,如果某处位置可以应用多条规则时,就要考虑到其优先级的问题。
毫无疑问,默认绑定肯定是优先级最低的绑定。所以先来考虑隐式绑定与显式绑定之间的优先级,用一个简单的方法就能测试出:
function foo() {
console.log(this.age);
}
const xfy = {
name: 'xfy',
age: 18,
foo,
};
const dfy = {
name: 'dfy',
age: 81,
foo,
};
xfy.foo(); // 18
dfy.foo(); // 81
xfy.foo.call(dfy); // 81
dfy.foo.call(xfy); // 18
很明显,显式绑定的优先级更高,也就是说在判断时应当先考虑是否存在显式绑定。
那么 new 绑定与隐式绑定呢?
function foo(msg) {
this.a = msg;
}
const xfy = {
name: 'xfy',
foo,
};
xfy.foo('test');
console.log(xfy);
const obj = new xfy.foo('this is obj');
console.log(obj);
可以看到这里对对象 xfy 中隐式绑定的函数进行了 new 操作,而最后的 this 被绑定到了新对象 obj 上,并没有修改 xfy 本身的值。所以 new 绑定的优先级比隐式绑定更高。
那 new 绑定与显式绑定呢?由于call/apply
无法与 new 一起使用,所以无法通过new xfy.foo.call(obj)
来测试优先级,但是我们可以通过硬绑定bind()
来测试。
function foo(msg) {
this.a = msg;
}
const xfy = {
name: 'xfy',
foo,
};
let obj = {};
const bar = xfy.foo.bind(obj);
bar('obj');
console.log(obj);
// bar was bind to obj
const baz = new bar('this is baz');
console.log(obj);
console.log(baz);
可以看到,在硬绑定之后,使用 new 操作对象 obj 的值并没有被改变,反而对 new 的新对象进行了修改。
但这真的说明 new 绑定比硬绑定优先级更高吗?实则不然,上述结果是因为 ES5 中内置的Function.prototype.bind()
方法比较复杂,他会对 new 绑定做判断,如果是的话就会使用新创建的 this 替换硬绑定的 this。
这是来自 [MDN](Function.prototype.bind() - JavaScript | MDN (mozilla.org))的 polyfill bind 的方法,
// Yes, it does work with `new (funcA.bind(thisArg, args))`
if (!Function.prototype.bind)
(function () {
var ArrayPrototypeSlice = Array.prototype.slice;
Function.prototype.bind = function (otherThis) {
if (typeof this !== 'function') {
// closest thing possible to the ECMAScript 5
// internal IsCallable function
throw new TypeError(
'Function.prototype.bind - what is trying to be bound is not callable'
);
}
var baseArgs = ArrayPrototypeSlice.call(arguments, 1),
baseArgsLength = baseArgs.length,
fToBind = this,
fNOP = function () {},
fBound = function () {
baseArgs.length = baseArgsLength; // reset to default base arguments
baseArgs.push.apply(baseArgs, arguments);
return fToBind.apply(
fNOP.prototype.isPrototypeOf(this) ? this : otherThis,
baseArgs
);
};
if (this.prototype) {
// Function.prototype doesn't have a prototype property
fNOP.prototype = this.prototype;
}
fBound.prototype = new fNOP();
return fBound;
};
})();
在这几段中:
fNOP.prototype.isPrototypeOf(this) ? this : otherThis,
// 以及
if (this.prototype) {
// Function.prototype doesn't have a prototype property
fNOP.prototype = this.prototype;
}
fBound.prototype = new fNOP();
该 polyfill 检测了是否是使用 new 绑定,并修改 this 为 new 绑定。
判断 this
根据上述优先级,可以得出一些判断 this 的结论(优先级从高到低):
-
函数是否在 new 中调用(new 绑定)?
如果是的话, this 绑定的是新创建的对象。
const bar = new Foo()
-
函数是否通过
call/apply
或者硬绑定调用(显式绑定)?如果是的话,this 绑定的是指定的对象。
const bar = foo.call(baz)
-
函数是否在某个上下文对象中调用(隐式绑定)?
如果是的话,this 绑定在那个上下文对象上。
const bar = obj.foo()
-
上述都不满足,那么就会使用默认绑定。
绑定例外
凡事都有例外,this 绑定也是同样。在某些情况下看上去可能是绑定某个规则,但实际上应用的可能是默认规则。
被忽略的 this
把 null 或者 undefined 作为 this 的绑定对象传入call/apply
与 bind 方法时,这些值会被忽略,从而应用默认绑定规则。
也就是说call/apply
传入 null 或者 undefined 时与之间执行函数本身没有区别。
function foo() {
console.log(this.name);
}
foo.call(null);
这样使用call/apply
的作用是利用他们的一些特性来解决一些小问题。
例如:展开数组
function bar(a, b) {
console.log(a, b);
}
bar.apply(null, [1, 2]);
当然,这在 ES6 中可以使用展开运算符来传递参数:
bar(...[1,2])
又或是利用 bind 实现柯里化
function bar(a, b) {
console.log(a, b);
}
const baz = bar.bind(null, 1);
baz(2);
这里都是利用忽略 this 产生的一些副作用,但在某些情况下可能不安全,例如函数可能真的使用到了 this ,这在非严格模式下可能会修改全局对象。
如果真的需要使用这种方法,可以创建一个 DMZ 对象来代替 null。
const ¤ = Object.create(null);
foo.call(¤, arg)
间接引用
另外需要注意的是,在某些情况下我们可能会无意的创建一个函数的间接引用。间接引用最容易在赋值期间发生:
function foo() {
console.log(this.name);
}
const o = {
foo,
};
const p = {};
(p.foo = o.foo)();
赋值表达式p.foo = o.foo
返回的是目标函数的引用,所以在这里调用实际上是在全局环境下直接调用foo()
。根据之前的规则,这里会应用默认绑定。
对象
将数组当作对象
数组和对象的差距貌似并不大,好像完全可以将一个数组当作对象使用,但这并不是一个好主意。数组和普通的对象都根据其对应的行为和用途进行了优化,所以最好只用对象来存储键/值对,只用数组来存储下标/值对。
如果试图给一个数组添加一个类似数字的属性,例如字符串'3'
,那么在数组进行存储之后会将其作为下标,并且转为数字。
let arr = []
arr.a = 123
arr.length // 0
arr['3'] = 333
arr.length // 4
arr // (4) [空 ×3, 333, a: 123]
Get
对象属性访问有些很微妙同时非常重要的细节,例如一次经典的属性访问:
const obj = {
name: 'xfy',
};
obj.name;
obj.name
是一次属性访问,但这不是简单的在对象 obj 中查找这个属性。
在语言规范中,obj.name
在 obj 上实现了[[Get]]
操作(这有点类似于函数调用:[[Get]]()
)。对象默认的[[Get]]
操作会先在该对象中查找是否具有名称相同的属性,如果有就返回。
如果没有找到名称相同的属性,则会继续遍历原型链,直到找到为止。如果原型链上也没有找到同名的属性,那么[[Get]]
操作就会返回 undefined。
obj.age; // undefined
这和访问变量时行为略微不同,如果引用了一个当前词法作用域中不存在的变量,则会抛出 ReferenceError。
所以仅通过返回值无法判断一个属性是否存在:
const myObj = {
a: undefined,
};
myObj.a; // undefined
myObj.b; // undefined
Put
有[[Get]]
操作就有对应的[[Put]]
操作。[[Put]]
被触发时,实际行为取决于很多因素,包括对象中是否已经存在这个属性。
如果已经存在这个属性,[[Put]]
算法大概会检查这些内容:
- 属性是否是访问描述符 Setter?如果是,则直接调用 Setter。
- 属性的数据描述符中 writable 是否是 false?如果是,非严格模式下静默失败,严格模式抛出 TypeError 异常。
- 如果都不是,将该值设置为属性的值。
Getter 和 Setter
对象有默认的[[Get]]
与[[Put]]
操作可以分别控制属性值的设置与获取。在 ES5 中可以是使用 getter 和 setter 来改写单个属性的默认操作。
目前只能改写对象的某个属性,未来可能能够修改整个对象的默认行为。
当给一个属性定义了一个 getter 或者 setter 时,这个属性会被定义为“访问描述符”(和“数据描述符”相对)。这会使其忽略他们的 value 和 writable 属性,取而代之的时 set 与 get(还有 configurable 和 enumerable)特性。
两种定义方式相同,都会在对象中创建一个不包含值的属性。
let obj = {
get a() {
return 123;
},
};
console.log(obj.a);
Object.defineProperty(obj, 'b', {
get: function () {
return this.a * 2;
},
});
console.log(obj.b);
getter 和 setter 通常成对出现
let myObj = {
get a() {
return this._a_;
},
set a(val) {
this._a_ = val * 3.14;
},
};
myObj.a = 15;
console.log(myObj.a);
存在性
前面介绍过一般情况下对象无法区分属性值不存在还是其值为 undefined。我们可以使用in
操作符与Object.hasOwnProperty()
方法来判断一个对象中是否有这个属性。
let obj = {
a: 123,
};
console.log('a' in obj);
console.log('b' in obj);
console.log(obj.hasOwnProperty('a'));
console.log(obj.hasOwnProperty('b'));
这两个方法不同的是:
in
会检查属性是否存在于对象以及原型链中;Object.hasOwnProperty()
只会检查属性是否在对象中。
let obj = {
a: 123,
};
let myObj = Object.create(obj);
console.log('a' in myObj);
另外,enumerable 属性描述符直接影响到for/in
的遍历,不可枚举的属性for/in
会直接忽略。
let obj = {
a: 123,
};
Object.defineProperty(obj, 'b', {
enumerable: false,
value: 456,
});
for (const i in obj) {
console.log(i);
}
还有另外几个方法也能区分属性是否可枚举:
let obj = {
a: 123,
};
Object.defineProperty(obj, 'b', {
enumerable: false,
value: 456,
});
console.log(obj.propertyIsEnumerable('a'));
console.log(obj.propertyIsEnumerable('b'));
console.log(Object.keys(obj));
console.log(Object.getOwnPropertyNames(obj));
他们的区别是:
propertyIsEnumerable()
当前对象中的属性是否可枚举,不检查原型链;Object.keys()
返回当前对象所有可枚举属性的数组;getOwnPropertyNames()
会返回对象的所有属性,无论是否可枚举;
遍历
这里记录下[Symbol.iterator]()
方法的一些使用习惯。一个可迭代对象需要拥有[Symbol.iterator]()
方法才是可迭代对象,而[Symbol.iterator]()
方法是这样组成的:
let obj = {
start: 0,
end: 10,
[Symbol.iterator]() { // Symbol.iterator是对象中的一个方法
return { // 它返回一个next方法
next: () => {
return { // next方法还需要返回一个包含 value 和 done 的对象
value: ++this.start,
done: this.start > this.end,
};
},
};
},
};
Symbol.iterator 是对象中的一个方法,它返回一个 next 方法(当然也可以不返回),而 next 方法还需要返回一个包含 value 和 done 的对象。这样才构成了一个可迭代的对象。
Symbol.iterator 方法可以直接通过 this 访问原对象,而 next 方法是 Symbol.iterator 方法返回的一个方法,它需要通过 this 来获取原本对象时就需要使用箭头函数,因为普通函数会有自己的 this 值。
let obj = {
start: 0,
end: 10,
[Symbol.iterator]() {
return {
next() {
return {
value: ++this.start, // undefined
done: this.start > this.end,
};
},
};
},
};
另外,Symbol.iterator 也可以不返回 next 方法,它通过返回 this,然后在原对象中定义一个 next 方法。这样迭代器就照样能找到 next 方法,且能够使用 this 了。
// 这样也是可以的
let obj = {
start: 0,
end: 10,
[Symbol.iterator]() {
return this;
},
next() {
return {
value: ++this.start,
done: this.start > this.end,
};
},
};
类
类是一种设计模式。许多语言提供了对于面向类软件设计的原生语法。JavaScript 也有类似的语法,但是和其他语言的类完全不同。
类意味着复制。
传统的类被实例化时,它的行为会被复制到实例中。类被继承时,行为也会被复制到子类中。
多态(在继承链的不同层次名称相同但是功能不同的函数)看起来似乎是从子类中引用父类,但是本质上引用的其实是复制的结果。
JavaScript 并不会(像类那样)自动创建对象的副本。
原型
考虑原型链之前先来看下什么是原型。我在《JavaScript 权威指南》中读到的最容易理解的一句话就是:对象不仅仅是简单的字符串(和 Symbol)到值的映射。除了维持自己的属性之外,JavaScript 对象也可以从其他对象继承属性,这个其他对象称其为“原型”。
JavaScript 与传统的 OOP 语言不同的是,它没有通常的类的概念。对象的方法通常是继承来的属性,而这种“原型式继承”也是 JavaScript 的主要特性。
JavaScript 的对象有个特殊的[[Prototype]]
内置属性,也就是原型,其实就是对于其他对象的引用。几乎所有对象在创建时[[Prototype]]
属性都会被赋予一个非空的值。一个对象的原型是其他的对象的引用,而其他的对象也会拥有原型,这样就形成了所谓的“原型链”。看上去和作用域链有点类似,虽然他们是两种东西,但是某些查找值的行为确实很类似。
[[Prototype]]
引用有什么用呢,上述介绍过[[Get]]
操作会在当前对象内寻找指定的属性,如果找不到,它就会继续上[[Prototype]]
上寻找。
这里对
[[Get]]
的讨论是不考虑 ES6 的 Proxy 的情况下的。
这样的代码在前面可能已经见过,Object.create
应该是用来描述原型最方便的方法了。先不考虑它的实现,它在这里的作用就是将 obj 设置为 otherObj 的原型。这样在对otherObj.name
实施[[Get]]
操作时,otherObj 本身并 name 这个属性,但是它会随着原型查找到 obj 上,并成功的访问到了值。
let obj = {
name: 'xfy',
};
const otherObj = Object.create(obj);
console.log(otherObj.name);
原型链的尽头
前面说过,一个对象的原型是其他的对象的引用,而其他的对象也会拥有原型,这样就形成了所谓的“原型链”。那么这样的原型链到哪里才是个头呢?
所有普通的对象原型最终都会指向Object.prototype
。这也就是为什么几乎所有对象都有toString()
和valueOf()
之类的方法了,因为他们是通过原型链访问到 Object 对应的方法的。
属性设置和屏蔽
在我刚学 JavaScript 的时候,有人曾告诉过我,如果给一个对象设置一个和其原型链上同名的方法,那么就会屏蔽它的方法,访问到的是该对象自己定义的同名方法。这种情况称之为重写。
重写方法这里就不多说了,但重写远比我们想象中的更复杂。它只是多种情况下的一种。如果为一个对象 obj 赋值一个 foo 属性,假设它的原型链已经有这个同名的属性了,那么它会出现三种情况:
- 如果在
[[Prototype]]
链上这个同名属性没有被设置为只读(writable:false
)属性,那么就会直接在 obj 添加一个 foo 属性,它是屏蔽属性。 - 如果
[[Prototype]]
链上这个同名属性为只读,那么无法修改已有属性或者在 obj 上创建屏蔽属性。在严格模式下会抛出一个错误,非严格模式下会静默失败。 - 如果
[[Prototype]]
链上这个同名属性是一个 setter,那就一定会调用这个 setter。不会创建屏蔽属性,也会重新定义这个 setter。
前面两种情况都好理解,来看下 setter 的情况:
let myObj = {
name: 'xfy',
set foo(val) {
this._a_ = val * 2;
},
get foo() {
return this._a_;
},
};
const obj = Object.create(myObj);
obj.foo = '110';
console.log(obj.foo); // 220
也就说属性屏蔽只是三种情况种的一种而已。
第二种令人意外的情况主要是为了模拟类属性的继承。更令人意外的是它只会发生在使用
=
赋值中,使用Object.defineProperty()
并不会受到影响。
原型式继承
本咸鱼曾经在读高程三的时候研究过 JavaScript 的原型式继承: JavaScript 面向对象的程序设计 - 🍭Defectink 。所以这里不再赘述关于构造函数还有模拟类的历史问题等,这里记录一些那篇文章没有提到的东西。
那篇文章里记录过 Douglas Crockford 所介绍的实现继承的方法。
function object(o) {
function F() {};
F.prototype = o;
return new F();
}
也就是Object.create()
。
但当时并没有讨论构造函数之间的继承为什么用这种方式。如果有两个构造函数 Foo 和 Bar,假设 Bar 需要继承自 Foo,那么这两种写法为何不行?
// 引用机制!
Bar.prototype = Foo.prototype;
// 可能会有副作用
Bar.prototype = new Foo();
第一种方法有很严重的问题,因为 JavaScript 中的对象并不是按值赋值的,而是而引用赋值的。直接将Bar.prototype = Foo.prototype
,那么二者就会关联起来,任何在子类原型上的修改都会翻译到父类原型上,因为他们本质上是一个 prototype。
第二种方法确实可能正常关联,但是如果父类 Foo 有一些副作用操作(例如修改状态、注册到其他对象,给 this 添加属性,等等),这样就会影响到子类创建的实例。
所以合适的方法就是使用Object.create()
。但这是在 ES6 之前的情况,ES6 添加了新的辅助函数Object.setPrototypeOf()
,可以用标准且可靠的方法来修改关联。
// ES6 之前需要抛弃默认的 Bar.prototype
Bar.prototype = Object.create(Foo.prototype);
// ES6 之后可以直接修改现有的 Bar.prototype
Object.setPrototypeOf(Bar.prototype, Foo.prototype);
检查“类”关联
在传统的面向类的环境中,检查一个实例(JavaScript 的对象)的继承祖先(JavaScript 的委托关联)通常被称之为内省(反射)。
在 JavaScript 中也有类似的操作:
function Foo() {}
const obj = new Foo();
obj instanceof Foo; // true
instanceof 操作符的左侧是一个对象,右侧是一个函数。它回答的问题是:在 obj 的整条原型链[[Prototype]]
上是否有Foo.prototype
指向的对象?
但这个方法只能用在对象和函数之间的关系,如果需要判断两个对象之间是否通过[[Prototype]]
关联,只用 instanceof 无法实现。
可以使用.isPrototypeOf()
来检查两个对象之间是否关联,当然,它也可以用来检查“实例”和“类”之间的关联。
因为 JavaScript 中的类本质上就是使用原型链模仿出的结果,所以判断 obj 与其构造函数 Foo 之间的关系也可以这样:
Foo.prototype.isPrototypeOf(obj);
由于类是虚假的,实际上我们并不需要 Foo,只需要它的原型对象 prototype。.isPrototypeOf()
回答的问题是:在 obj 的整个原型链中是否出现过Foo.prototype
?
在 ES5 中我们可以直接获取一个对象的原型:
class Foo {
constructor(name) {
this.name = name;
}
sayName() {
console.log(this.name);
}
}
const obj = new Foo('xfy');
Object.getPrototypeOf(obj)
// {constructor: ƒ, sayName: ƒ}
// constructor: class Foo
// sayName: ƒ sayName()
// __proto__: Object
如果经常和 Chrome 之类的浏览器打交道的话,可能还在对象中见到过.__proto__
属性。这个属性神奇的引用了[[Prototype]]
对象,并且在 ES6 成为了标准。