Files
DefectingCat.github.io/source/_md/你不知道的JavaScript-上.md
DefectingCat 062e3304ac 填坑
1. 挖坑
2. TypeScript编程
3. webpack静态网站开发
4. Nodejs多进程
5. TypeScript零碎笔记
2021-06-07 21:42:46 +08:00

34 KiB
Raw Blame History

上卷

编译原理

尽管 JavaScript 经常被归类为“动态”或“解释执行”的语言但实际上它是一门编译语言。JavaScript 引擎进行的编译步骤和传统编译语言非常相似,但有些地方可能比预想的要复杂。

传统编译流程:

  • 分词/此法分析Tokenizing/Lexing

    这个过程会将有字符组成的字符串分解成对编程语言来说有意义的代码块这些代码块被称为词法单元token。例如var a = 2;这段程序通常会被分解成词法单元:vara=2;空格是否会被当成词法单元,取决于空格在这门语言种是否具有意义。

  • 解析/语法分析Parsing

    这个过程是将词法单元流数组转换成一个由元素逐级嵌套所组成的代表了程序语法的树。这个树被称为“抽象语法树”Abstract Syntax TreeAST

    var a = 2的 AST 为:

    VariableDeclaration
    --Identifier = a
    --AssignmentExpression
    ----NumericLiteral = 2
    
  • 代码生成

    将 AST 转换为可执行代码的过程被称为代码生成。这个过程与语言、目标平台等息息相关。简单来说就是将 AST 转换为一组机器指令,用来创建一个叫做 a 的变量(包括分配内存等),并将值 2 存储在 a 中。

JavaScript 的编译

JavaScript 的编译由 JavaScript 引擎来负责(包括执行)。编译通常由三个部分组成:

  • 引擎:从头到尾负责整个 JavaScript 的编译以及执行;
  • 编译器:负责语法分析以及代码生成;
  • 作用域:负责收集并维护由所有声明的标识符(变量)组成的一系列查询,并实施一套非常严格的规则,确定当前执行的代码对这些标识符的访问权限。

在我们看来var a = 2;这是一个普通的变量声明。而在 JavaScript 引擎看来这里有两个完全不同的声明:

  1. var a,编译器会寻找当前作用域中是否有同样的声明。如果有,则忽略该声明,并继续编译;否则它会在当前作用域(全局/函数作用域)的集合中声明一个新的变量,并命名为 a。
  2. 接下来编译器会为引擎生成运行时所需的代码,这些代码用来处理赋值(a = 2)操作。引擎会在当前作用域中查找变量 a。如果能找到则为其赋值如果找不到则继续向上查找作用域链

由于编译的第一步操作会寻找所有的var关键词声明,无论它在代码的什么位置,都会声明好。在代码真正运行时,所有声明都已经声明好了,哪怕它是在其他操作的下面,都可以直接进行。这就是var关键词的声明提升。

a = 2;
console.log(a);
var a;

LHS 和 RHS

编译器在编译过程的第二步生成了代码,引擎执行它时,就会查找变量 a 来判断它是否已经声明过。但引擎如何进行查找,影响最终查找的结果。

LHS 和 RHS 分别对应的是左侧查找与右侧查找。左右两侧分别代表一个赋值操作的左侧和右侧。也就说,当变量出现在赋值操作的左侧时进行 LHS 查询,出现在右侧时进行 RHS 查询。

例如:a = 2,这里进行的就是 LHS 查询。这里不关心 a 的当前值,只想找到 a 并为其赋一个值。

而:console.log(a),这里进行的是 RHS 查询。因为这里需要取到 a 的值,而不是为其赋值。

“赋值操作的左侧和右侧”并不一定代表就是=的左右两侧赋值操作还有其他多种形式。因此可以在概念上理解为“查询被赋值的目标LHS”以及”查询目标的值RHS“。

小测验:

寻找 LHS 查询3处以及 RHS 查询4处

function foo(a) {
  var b = a;
  return a + b;
}
var c = foo(2);

LHS

  • var c = foo(...):为变量 c 赋值
  • foo(2):传递参数时,为形参 a 赋值 2
  • var b = a:为变量 b 赋值

RHS

  • var c = foo(...):查询foo()
  • var b = a:(为变量 b 赋值时)取得 a 的值
  • return a + b:取得 a 与 b两次

异常

通过详细的了解异常可以准确的确定发生的问题所在。

在 LHS 查询时,如果到作用域顶部还没有查询到声明,则作用域会热心的帮我们(隐式)创建一个全局变量(非严格模式下)。

而在 RHS 查询时,如果在作用域顶部还没有查询到声明,就会抛出一个 ReferenceError 异常。

在严格模式下LHS 如果没有找到声明,引擎会抛出一个和 RHS 类似的 ReferenceError 异常。

无论是 LHS 还是 RHS 都是查询一个引用而没有查询到对应的引用时就会得到引用ReferenceError 异常。

接下来,如果 RHS 查询到了一个变量,但是我们尝试对这个变量的值进行不合理的操作。例如对一个非函数进行函数调用,或者对对象中不存在的属性进行引用。那么引擎会抛出另外一个异常,叫做 TypeError。

闭包

闭包是基于词法作用域书写代码时所产生的自然结果。闭包的主要定义:

当函数可以记住并访问所在的词法作用域时,就产生了闭包,即使函数是在当前词法作用域之外执行。

JavaScript 使用的是词法作用域模型,另一种作用域模型是动态作用域。

仔细来看,闭包的主要定义有:

  • 函数记住并可以访问所在的词法作用域
  • 在当前词法作用域之外执行也能继续访问所在的词法作用域

来看一个例子:

function foo() {
  const a = 123;

  function bar() {
    console.log(a);
  }

  bar();
}
foo();

这段代码看起来好像符合闭包的一部分定义,虽然bar()函数并没有脱离当前的词法作用域执行。但是它依然记住了foo()的词法作用域,并能访问。

它确实满足闭包定义的一部分(很重要的一部分),从技术上讲,也许是,但并不能完全断定这就是闭包。通常我们所见到的与认为闭包的情况就是满足所有定义的时候:

function foo() {
  const a = 321;

  function bar() {
    console.log(a);
  }

  return bar;
}
// 同理
// foo()();
const baz = foo()
baz();

因为垃圾收集机制,当一个函数执行结束后,通常它的整个内部作用域会被销毁。当我们的foo()函数执行结束后,看上去它的内容不会再被使用,所以很自然的考虑会被回收。

但闭包的神奇之处就在这里,它会阻止这一切的发生。当barreturn出去之后,在其词法作用域的外部依然能够访问foo()的内部作用域。bar依然持有对该作用域的引用,这个引用就叫作闭包。

这也是经常见到说闭包会影响性能的主要原因。某些情况下,它确实会影响到性能,例如过度多的返回本不需要的函数,甚至是嵌套。这会导致本不需要的作用域没有被回收。

常见的闭包

上述将一个函数return出来的案例是最常见的闭包案例。但在我们的代码中,也有些其他非常常见的闭包。不过平时可能没有太过去注意它。

先来回顾一下定义:

无论通过何种手段将内部函数传递到词法作用域之外,它都会保留对改内部词法作用域的引用,无论在何处执行这个函数都会使其闭包。

function waitAMinute(msg: string) {
  setTimeout(() => {
    console.log(msg);
  }, 1000);
}
waitAMinute('嘤嘤嘤');
function btnClick(selector: string, msg: string) {
  $(selector).click(() => {
    alert(msg);
  });
}
btnClick('#btn_1', 'hah');
btnClick('#btn_2', 'got you');

this 全面解析

this 和动态作用域有些许类似他们都是在执行时决定的。this 是在调用时被绑定的,完全取决于函数的调用位置。

确定调用位置

当一个函数被调用是会创建一个活动记录执行期上下文。这个记录会包含函数在哪里被调用调用栈、函数的调用方式、传入的参数等信息。this 就是这个记录里的一个属性。

调用位置就是函数在代码中被调用的位置,而不是声明的位置。可以类似于这样来这个记录并分析出函数的真正调用位置。

function foo() {
  // 当前调用栈foo

  console.log('foo');
  bar();
}
function bar() {
  // 当前调用栈foo --> bar

  console.log('bar');
  baz();
}
function baz() {
  // 当前调用栈foo --> bar --> baz

  console.log('baz');
}
foo();

绑定规则

this 是在运行时动态绑定的所以在不同的情况下this 可能会发生各种意料之外的情况。

默认绑定

当函数在全局环境下独立调用时this 会指向为全局对象。

var a = 123;
function foo() {
  console.log(this.a); // 123
}

而当函数处理严格模式下,则不能将全局对象用于默认绑定,因此 this 会绑定到undefined

var a = 123;
function foo() {
  "use strict"
  console.log(this.a); // TypeError: this is undefined
}

还有一个微妙的细节,虽然 this 的绑定完全取决于调用的位置,但是只有foo()函数本身处于非严格模式才能绑定到全局对象。如果只是函数执行时所在严格模式下,而本身是非严格模式,则不影响默认绑定规则。

var a = 123;

function foo() {
  console.log(this.a);
}

(() => {
  'use strict';
  foo();
})();

通常来说不推荐在代码中混用严格模式与非严格模式。

隐式绑定

另外一种规则是考虑调用位置是否有上下文对象,或者说某个对象是否包含这个函数。

function foo(this: typeof obj) {
  console.log(this.name);
}
const obj = {
  name: 'xfy',
  foo: foo
};
obj.foo() // xfy

这种方法可以理解为将foo()的函数体赋值给了对象 obj 的一个属性,而执行时是从 obj 作为上下文对象来执行的。所以 this 隐式的绑定到了 obj 对象。

对象属性引用链中只有上一层或者说最后一层在调用位置中起作用。

function foo(this: typeof obj) {
  console.log(this.name);
}
const obj = {
  name: 'xfy',
  foo: foo,
};
obj.foo(); // xfy

const alotherObj = {
  name: 'dfy',
  obj: obj,
};
alotherObj.obj.foo(); // xfy

隐式丢失

既然会隐式的绑定,那也就会出现隐式的丢失问题。

function foo() {
  console.log(this.name);
}

const obj = {
  name: 'xfy',
  age: 18,
  foo,
};

const bar = obj.foo; // 函数别名
bar();

虽然 bar 是obj.foo的一个引用,但是它引用的是函数体本身。可以理解为将函数体传递给了 bar 这个变量,这是调用bar()是一个不带任何修饰的函数调用,因此使用了默认绑定。

另一种常见且出乎意料的情况就是在传递回调函数时:

  function foo() {
    console.log(this.name);
  }

  function doFoo(fn) {
    fn();
  }

  const obj = {
    name: 'xfy',
    age: 18,
    foo,
  };

  doFoo(obj.foo);

参数传递其实就是一种隐式赋值,因此我们传入函数是也会被隐式赋值。只要函数体被传递后,且调用时脱离了原有的对象,就会导致 this 的隐式丢失。

包括setTimeout()方法丢失 this 也是同理。

显式绑定

因为原型的特性JavaScript 中函数也自己的属性。大多数宿主环境都会提供call()apply()来给我们显式的绑定 this。

  function foo() {
    console.log(this.name);
  }
  const obj = {
    name: 'xfy',
    age: 18,
    foo,
  };
  foo.call(obj);

call 与 apply 只是传参不同。

使用显式的绑定可以很好的解决传递参数时隐式丢失 this 的问题

  function foo() {
    console.log(this.name);
  }
  const obj = {
    name: 'xfy',
    age: 18,
    foo,
  };
  function bar() {
    foo.call(obj);
  }
  setTimeout(bar, 1000);
  // 同理
  // setTimeout(() => {
  //   obj.foo();
  // }, 1000);

这里在bar()的内部直接手动显式的把foo()绑定到了 obj无论之后怎么调用在何处调用。都会手动的将 obj 绑定在foo()上。这种绑定称之为硬绑定

不过这种绑定是特意的例子,这里手动为foo()绑定到了 obj。在多数情况下我们可能需要更灵活一点。

JavaScript 装饰器模式🎊 - 🍭Defectink (xfy.plus) 中介绍了这种工作模式。通过一个包装器配合显式绑定就能解决大部分情况下的问题。

  function foo(msg) {
    console.log(this.name);
    console.log(msg);
  }
  function wrapper(fn, obj) {
    return (...rest) => {
      fn.apply(obj, rest);
    };
  }
  const obj = {
    name: 'xfy',
    age: 18,
  };
  const bar = wrapper(foo, obj);
  bar('嘤嘤嘤');

但包装器不仅仅只是用来解决 this 丢失的问题,但对 this 绑定的问题 ES5 提供了内置的方法Function.prototype.bind

  function foo() {
    console.log(this.name);
  }
  const obj = {
    name: 'xfy',
    age: 18,
  };
  const bar = foo.bind(obj);
  bar();

new 绑定

在传统面向类的语言中,“构造函数”是类中的一些特殊的方法,使用类时会调用类中的构造函数。通常类似于这样:

myObj = new MyClass()

在 JavaScript 中,所有函数都可以被 new 操作符所调用。这种调用称为构造函数调用,实质上并不存在所谓的“构造函函数”,只有对于函数的“构造调用”。

使用 new 来发生构造函数调用时,会执行:

  1. 创建(构造)一个新对象。
  2. 对新对象执行[[Prototype]]连接。
  3. 对新对象绑定到函数调用的 this。
  4. 如果函数没有返回其他对象,那么在 new 调用后自动返回这个新对象。
function Foo(name) {
  this.name = name;
}
const bar = new Foo('xfy');
console.log(bar.name);

使用 new 操作符来调用foo()时,会构造一个新对象并把它绑定到foo()中的 this 上。new 是最后一种可以影响函数调用时 this 绑定行为的方法,我们称之为 new 绑定。

ES6 的 class 只是一个语法糖,但是它也解决了一些问题。

优先级

上述描述的四条规则中,如果某处位置可以应用多条规则时,就要考虑到其优先级的问题。

毫无疑问,默认绑定肯定是优先级最低的绑定。所以先来考虑隐式绑定与显式绑定之间的优先级,用一个简单的方法就能测试出:

function foo() {
  console.log(this.age);
}

const xfy = {
  name: 'xfy',
  age: 18,
  foo,
};
const dfy = {
  name: 'dfy',
  age: 81,
  foo,
};

xfy.foo();  // 18
dfy.foo();	// 81

xfy.foo.call(dfy);	// 81
dfy.foo.call(xfy);	// 18

很明显,显式绑定的优先级更高,也就是说在判断时应当先考虑是否存在显式绑定。

那么 new 绑定与隐式绑定呢?

function foo(msg) {
  this.a = msg;
}

const xfy = {
  name: 'xfy',
  foo,
};
xfy.foo('test');
console.log(xfy);

const obj = new xfy.foo('this is obj');
console.log(obj);

可以看到这里对对象 xfy 中隐式绑定的函数进行了 new 操作,而最后的 this 被绑定到了新对象 obj 上,并没有修改 xfy 本身的值。所以 new 绑定的优先级比隐式绑定更高。

那 new 绑定与显式绑定呢?由于call/apply无法与 new 一起使用,所以无法通过new xfy.foo.call(obj)来测试优先级,但是我们可以通过硬绑定bind()来测试。

function foo(msg) {
  this.a = msg;
}

const xfy = {
  name: 'xfy',
  foo,
};

let obj = {};

const bar = xfy.foo.bind(obj);
bar('obj');
console.log(obj);

// bar was bind to obj
const baz = new bar('this is baz');
console.log(obj);
console.log(baz);

可以看到,在硬绑定之后,使用 new 操作对象 obj 的值并没有被改变,反而对 new 的新对象进行了修改。

但这真的说明 new 绑定比硬绑定优先级更高吗?实则不然,上述结果是因为 ES5 中内置的Function.prototype.bind()方法比较复杂,他会对 new 绑定做判断,如果是的话就会使用新创建的 this 替换硬绑定的 this。

这是来自 [MDN](Function.prototype.bind() - JavaScript | MDN (mozilla.org))的 polyfill bind 的方法,

//  Yes, it does work with `new (funcA.bind(thisArg, args))`
if (!Function.prototype.bind)
  (function () {
    var ArrayPrototypeSlice = Array.prototype.slice;
    Function.prototype.bind = function (otherThis) {
      if (typeof this !== 'function') {
        // closest thing possible to the ECMAScript 5
        // internal IsCallable function
        throw new TypeError(
          'Function.prototype.bind - what is trying to be bound is not callable'
        );
      }

      var baseArgs = ArrayPrototypeSlice.call(arguments, 1),
        baseArgsLength = baseArgs.length,
        fToBind = this,
        fNOP = function () {},
        fBound = function () {
          baseArgs.length = baseArgsLength; // reset to default base arguments
          baseArgs.push.apply(baseArgs, arguments);
          return fToBind.apply(
            fNOP.prototype.isPrototypeOf(this) ? this : otherThis,
            baseArgs
          );
        };

      if (this.prototype) {
        // Function.prototype doesn't have a prototype property
        fNOP.prototype = this.prototype;
      }
      fBound.prototype = new fNOP();

      return fBound;
    };
  })();

在这几段中:

fNOP.prototype.isPrototypeOf(this) ? this : otherThis,
// 以及
if (this.prototype) {
  // Function.prototype doesn't have a prototype property
  fNOP.prototype = this.prototype;
}
fBound.prototype = new fNOP();

该 polyfill 检测了是否是使用 new 绑定,并修改 this 为 new 绑定。

判断 this

根据上述优先级,可以得出一些判断 this 的结论(优先级从高到低):

  1. 函数是否在 new 中调用new 绑定)?

    如果是的话, this 绑定的是新创建的对象。const bar = new Foo()

  2. 函数是否通过call/apply或者硬绑定调用(显式绑定)?

    如果是的话this 绑定的是指定的对象。const bar = foo.call(baz)

  3. 函数是否在某个上下文对象中调用(隐式绑定)?

    如果是的话this 绑定在那个上下文对象上。const bar = obj.foo()

  4. 上述都不满足,那么就会使用默认绑定。

绑定例外

凡事都有例外this 绑定也是同样。在某些情况下看上去可能是绑定某个规则,但实际上应用的可能是默认规则。

被忽略的 this

把 null 或者 undefined 作为 this 的绑定对象传入call/apply与 bind 方法时,这些值会被忽略,从而应用默认绑定规则。

也就是说call/apply传入 null 或者 undefined 时与之间执行函数本身没有区别。

function foo() {
  console.log(this.name);
}
foo.call(null);

这样使用call/apply的作用是利用他们的一些特性来解决一些小问题。

例如:展开数组

function bar(a, b) {
  console.log(a, b);
}
bar.apply(null, [1, 2]);

当然,这在 ES6 中可以使用展开运算符来传递参数:

bar(...[1,2])

又或是利用 bind 实现柯里化

function bar(a, b) {
  console.log(a, b);
}

const baz = bar.bind(null, 1);
baz(2);

这里都是利用忽略 this 产生的一些副作用,但在某些情况下可能不安全,例如函数可能真的使用到了 this ,这在非严格模式下可能会修改全局对象。

如果真的需要使用这种方法,可以创建一个 DMZ 对象来代替 null。

const ¤ = Object.create(null);
foo.call(¤, arg)

间接引用

另外需要注意的是,在某些情况下我们可能会无意的创建一个函数的间接引用。间接引用最容易在赋值期间发生:

function foo() {
  console.log(this.name);
}
const o = {
  foo,
};
const p = {};
(p.foo = o.foo)();

赋值表达式p.foo = o.foo返回的是目标函数的引用,所以在这里调用实际上是在全局环境下直接调用foo()。根据之前的规则,这里会应用默认绑定。

对象

将数组当作对象

数组和对象的差距貌似并不大,好像完全可以将一个数组当作对象使用,但这并不是一个好主意。数组和普通的对象都根据其对应的行为和用途进行了优化,所以最好只用对象来存储键/值对,只用数组来存储下标/值对。

如果试图给一个数组添加一个类似数字的属性,例如字符串'3',那么在数组进行存储之后会将其作为下标,并且转为数字。

let arr = []
arr.a = 123
arr.length  // 0
arr['3'] = 333
arr.length  // 4
arr  // (4) [空 ×3, 333, a: 123]

Get

对象属性访问有些很微妙同时非常重要的细节,例如一次经典的属性访问:

const obj = {
  name: 'xfy',
};
obj.name;

obj.name是一次属性访问,但这不是简单的在对象 obj 中查找这个属性。

在语言规范中,obj.name在 obj 上实现了[[Get]]操作(这有点类似于函数调用:[[Get]]())。对象默认的[[Get]]操作会先在该对象中查找是否具有名称相同的属性,如果有就返回。

如果没有找到名称相同的属性,则会继续遍历原型链,直到找到为止。如果原型链上也没有找到同名的属性,那么[[Get]]操作就会返回 undefined。

obj.age; // undefined

这和访问变量时行为略微不同,如果引用了一个当前词法作用域中不存在的变量,则会抛出 ReferenceError。

所以仅通过返回值无法判断一个属性是否存在:

const myObj = {
  a: undefined,
};
myObj.a; // undefined
myObj.b; // undefined

Put

[[Get]]操作就有对应的[[Put]]操作。[[Put]]被触发时,实际行为取决于很多因素,包括对象中是否已经存在这个属性。

如果已经存在这个属性,[[Put]]算法大概会检查这些内容:

  1. 属性是否是访问描述符 Setter如果是则直接调用 Setter。
  2. 属性的数据描述符中 writable 是否是 false如果是非严格模式下静默失败严格模式抛出 TypeError 异常。
  3. 如果都不是,将该值设置为属性的值。

Getter 和 Setter

对象有默认的[[Get]][[Put]]操作可以分别控制属性值的设置与获取。在 ES5 中可以是使用 getter 和 setter 来改写单个属性的默认操作。

目前只能改写对象的某个属性,未来可能能够修改整个对象的默认行为。

当给一个属性定义了一个 getter 或者 setter 时,这个属性会被定义为“访问描述符”(和“数据描述符”相对)。这会使其忽略他们的 value 和 writable 属性,取而代之的时 set 与 get还有 configurable 和 enumerable特性。

两种定义方式相同,都会在对象中创建一个不包含值的属性。

let obj = {
  get a() {
    return 123;
  },
};
console.log(obj.a);

Object.defineProperty(obj, 'b', {
  get: function () {
    return this.a * 2;
  },
});
console.log(obj.b);

getter 和 setter 通常成对出现

let myObj = {
  get a() {
    return this._a_;
  },
  set a(val) {
    this._a_ = val * 3.14;
  },
};
myObj.a = 15;
console.log(myObj.a);

存在性

前面介绍过一般情况下对象无法区分属性值不存在还是其值为 undefined。我们可以使用in操作符与Object.hasOwnProperty()方法来判断一个对象中是否有这个属性。

let obj = {
  a: 123,
};
console.log('a' in obj);
console.log('b' in obj);

console.log(obj.hasOwnProperty('a'));
console.log(obj.hasOwnProperty('b'));

这两个方法不同的是:

  • in会检查属性是否存在于对象以及原型链中;
  • Object.hasOwnProperty()只会检查属性是否在对象中。
let obj = {
  a: 123,
};

let myObj = Object.create(obj);
console.log('a' in myObj);

另外enumerable 属性描述符直接影响到for/in的遍历,不可枚举的属性for/in会直接忽略。

let obj = {
  a: 123,
};

Object.defineProperty(obj, 'b', {
  enumerable: false,
  value: 456,
});

for (const i in obj) {
  console.log(i);
}

还有另外几个方法也能区分属性是否可枚举:

let obj = {
  a: 123,
};

Object.defineProperty(obj, 'b', {
  enumerable: false,
  value: 456,
});

console.log(obj.propertyIsEnumerable('a'));
console.log(obj.propertyIsEnumerable('b'));

console.log(Object.keys(obj));

console.log(Object.getOwnPropertyNames(obj));

他们的区别是:

  • propertyIsEnumerable()当前对象中的属性是否可枚举,不检查原型链;
  • Object.keys()返回当前对象所有可枚举属性的数组;
  • getOwnPropertyNames()会返回对象的所有属性,无论是否可枚举;

遍历

这里记录下[Symbol.iterator]()方法的一些使用习惯。一个可迭代对象需要拥有[Symbol.iterator]()方法才是可迭代对象,而[Symbol.iterator]()方法是这样组成的:

let obj = {
  start: 0,
  end: 10,
  [Symbol.iterator]() { // Symbol.iterator是对象中的一个方法
    return { // 它返回一个next方法
      next: () => {
        return { // next方法还需要返回一个包含 value 和 done 的对象
          value: ++this.start,
          done: this.start > this.end,
        };
      },
    };
  },
};

Symbol.iterator 是对象中的一个方法,它返回一个 next 方法(当然也可以不返回),而 next 方法还需要返回一个包含 value 和 done 的对象。这样才构成了一个可迭代的对象。

Symbol.iterator 方法可以直接通过 this 访问原对象,而 next 方法是 Symbol.iterator 方法返回的一个方法,它需要通过 this 来获取原本对象时就需要使用箭头函数,因为普通函数会有自己的 this 值。

let obj = {
  start: 0,
  end: 10,
  [Symbol.iterator]() {
    return {
      next() {
        return {
          value: ++this.start, // undefined
          done: this.start > this.end,
        };
      },
    };
  },
};

另外Symbol.iterator 也可以不返回 next 方法,它通过返回 this然后在原对象中定义一个 next 方法。这样迭代器就照样能找到 next 方法,且能够使用 this 了。

// 这样也是可以的
let obj = {
  start: 0,
  end: 10,
  [Symbol.iterator]() {
    return this;
  },
  next() {
    return {
      value: ++this.start,
      done: this.start > this.end,
    };
  },
};

类是一种设计模式。许多语言提供了对于面向类软件设计的原生语法。JavaScript 也有类似的语法,但是和其他语言的类完全不同。

类意味着复制。

传统的类被实例化时,它的行为会被复制到实例中。类被继承时,行为也会被复制到子类中。

多态(在继承链的不同层次名称相同但是功能不同的函数)看起来似乎是从子类中引用父类,但是本质上引用的其实是复制的结果。

JavaScript 并不会(像类那样)自动创建对象的副本。

原型

考虑原型链之前先来看下什么是原型。我在《JavaScript 权威指南》中读到的最容易理解的一句话就是:对象不仅仅是简单的字符串(和 Symbol到值的映射。除了维持自己的属性之外JavaScript 对象也可以从其他对象继承属性,这个其他对象称其为“原型”。

JavaScript 与传统的 OOP 语言不同的是,它没有通常的类的概念。对象的方法通常是继承来的属性,而这种“原型式继承”也是 JavaScript 的主要特性。

JavaScript 的对象有个特殊的[[Prototype]]内置属性,也就是原型,其实就是对于其他对象的引用。几乎所有对象在创建时[[Prototype]]属性都会被赋予一个非空的值。一个对象的原型是其他的对象的引用,而其他的对象也会拥有原型,这样就形成了所谓的“原型链”。看上去和作用域链有点类似,虽然他们是两种东西,但是某些查找值的行为确实很类似。

[[Prototype]]引用有什么用呢,上述介绍过[[Get]]操作会在当前对象内寻找指定的属性,如果找不到,它就会继续上[[Prototype]]上寻找。

这里对[[Get]]的讨论是不考虑 ES6 的 Proxy 的情况下的。

这样的代码在前面可能已经见过,Object.create应该是用来描述原型最方便的方法了。先不考虑它的实现,它在这里的作用就是将 obj 设置为 otherObj 的原型。这样在对otherObj.name实施[[Get]]操作时otherObj 本身并 name 这个属性,但是它会随着原型查找到 obj 上,并成功的访问到了值。

let obj = {
  name: 'xfy',
};
const otherObj = Object.create(obj);
console.log(otherObj.name);

原型链的尽头

前面说过,一个对象的原型是其他的对象的引用,而其他的对象也会拥有原型,这样就形成了所谓的“原型链”。那么这样的原型链到哪里才是个头呢?

所有普通的对象原型最终都会指向Object.prototype。这也就是为什么几乎所有对象都有toString()valueOf()之类的方法了,因为他们是通过原型链访问到 Object 对应的方法的。

属性设置和屏蔽

在我刚学 JavaScript 的时候,有人曾告诉过我,如果给一个对象设置一个和其原型链上同名的方法,那么就会屏蔽它的方法,访问到的是该对象自己定义的同名方法。这种情况称之为重写。

重写方法这里就不多说了,但重写远比我们想象中的更复杂。它只是多种情况下的一种。如果为一个对象 obj 赋值一个 foo 属性,假设它的原型链已经有这个同名的属性了,那么它会出现三种情况:

  1. 如果在[[Prototype]]链上这个同名属性没有被设置为只读(writable:false)属性,那么就会直接在 obj 添加一个 foo 属性,它是屏蔽属性。
  2. 如果[[Prototype]]链上这个同名属性为只读,那么无法修改已有属性或者在 obj 上创建屏蔽属性。在严格模式下会抛出一个错误,非严格模式下会静默失败。
  3. 如果[[Prototype]]链上这个同名属性是一个 setter那就一定会调用这个 setter。不会创建屏蔽属性也会重新定义这个 setter。

前面两种情况都好理解,来看下 setter 的情况:

let myObj = {
  name: 'xfy',
  set foo(val) {
    this._a_ = val * 2;
  },
  get foo() {
    return this._a_;
  },
};
const obj = Object.create(myObj);
obj.foo = '110';
console.log(obj.foo); // 220

也就说属性屏蔽只是三种情况种的一种而已。

第二种令人意外的情况主要是为了模拟类属性的继承。更令人意外的是它只会发生在使用=赋值中,使用Object.defineProperty()并不会受到影响。

原型式继承

本咸鱼曾经在读高程三的时候研究过 JavaScript 的原型式继承: JavaScript 面向对象的程序设计 - 🍭Defectink 。所以这里不再赘述关于构造函数还有模拟类的历史问题等,这里记录一些那篇文章没有提到的东西。

那篇文章里记录过 Douglas Crockford 所介绍的实现继承的方法。

function object(o) {
    function F() {};
    F.prototype = o;
    return new F();
}

也就是Object.create()

但当时并没有讨论构造函数之间的继承为什么用这种方式。如果有两个构造函数 Foo 和 Bar假设 Bar 需要继承自 Foo那么这两种写法为何不行

// 引用机制!
Bar.prototype = Foo.prototype;
// 可能会有副作用
Bar.prototype = new Foo();

第一种方法有很严重的问题,因为 JavaScript 中的对象并不是按值赋值的,而是而引用赋值的。直接将Bar.prototype = Foo.prototype,那么二者就会关联起来,任何在子类原型上的修改都会翻译到父类原型上,因为他们本质上是一个 prototype。

第二种方法确实可能正常关联,但是如果父类 Foo 有一些副作用操作(例如修改状态、注册到其他对象,给 this 添加属性,等等),这样就会影响到子类创建的实例。

所以合适的方法就是使用Object.create()。但这是在 ES6 之前的情况ES6 添加了新的辅助函数Object.setPrototypeOf(),可以用标准且可靠的方法来修改关联。

// ES6 之前需要抛弃默认的 Bar.prototype
Bar.prototype = Object.create(Foo.prototype);
// ES6 之后可以直接修改现有的 Bar.prototype
Object.setPrototypeOf(Bar.prototype, Foo.prototype);

检查“类”关联

在传统的面向类的环境中检查一个实例JavaScript 的对象的继承祖先JavaScript 的委托关联)通常被称之为内省(反射)。

在 JavaScript 中也有类似的操作:

function Foo() {}
const obj = new Foo();

obj instanceof Foo; // true

instanceof 操作符的左侧是一个对象,右侧是一个函数。它回答的问题是:在 obj 的整条原型链[[Prototype]]上是否有Foo.prototype指向的对象?

但这个方法只能用在对象和函数之间的关系,如果需要判断两个对象之间是否通过[[Prototype]]关联,只用 instanceof 无法实现。

可以使用.isPrototypeOf()来检查两个对象之间是否关联,当然,它也可以用来检查“实例”和“类”之间的关联。

因为 JavaScript 中的类本质上就是使用原型链模仿出的结果,所以判断 obj 与其构造函数 Foo 之间的关系也可以这样:

Foo.prototype.isPrototypeOf(obj);

由于类是虚假的,实际上我们并不需要 Foo只需要它的原型对象 prototype。.isPrototypeOf()回答的问题是:在 obj 的整个原型链中是否出现过Foo.prototype

在 ES5 中我们可以直接获取一个对象的原型:

class Foo {
  constructor(name) {
    this.name = name;
  }
  sayName() {
    console.log(this.name);
  }
}

const obj = new Foo('xfy');

Object.getPrototypeOf(obj)
// {constructor: ƒ, sayName: ƒ}
// constructor: class Foo
// sayName: ƒ sayName()
// __proto__: Object

如果经常和 Chrome 之类的浏览器打交道的话,可能还在对象中见到过.__proto__属性。这个属性神奇的引用了[[Prototype]]对象,并且在 ES6 成为了标准。