深入理解Node.js异步编程

十一月 4, 2018 编程语言

本文将深入解析node.js的异步世界（本文比较长，请准备好瓜子和可乐）。

准备工作

为了保证文章内所列代码能够正确运行，建议安装babel：

1	npm install babel-cli -g

写在阅读之前

开发者需要注意区分JavaScript和JavaScript运行时（宿主环境）这两个概念。严格来说，JavaScript单纯指这门编程语言，没有其他附加的含义。对于宿主环境，如果是Web前端开发，默认是浏览器，如果是Node.js，则指的是node.js运行时。不同的宿主环境有很大区别，比如浏览器和node.js的事件循环机制就有所区别。另外像console这个对象（没错，就是你经常用的console.log的那个console）也是由宿主环境提供的，它并不是JavaScript的一部分。

需要特别说明的是，本文的事件循环部分主要探讨的宿主环境是node.js，异步编程部分中的绝大多数内容都适用于目前常见的宿主环境，如浏览器、Node.js等。要注意的是虽然不同宿主环境有很多相似的地方，但是我们还是要注意区分他们的不同点。

并发模型和事件循环

由于JavaScript是单线程运行的，因此它天生是异步的。试想如果一个单线程的程序是同步执行的，一旦有调用阻塞线程，线程就挂起了。对应到现实中的会发现，浏览器因为一个HTTP请求而无法响应用户操作。在使用JavaScript时（不论在哪个宿主环境），都要牢记它是单线程运行的，这个概念非常重要。

大部分使用node.js的人都被它的“异步非阻塞”特性所吸引，一些I/O密集型的应用在使用异步非阻塞的实现后，性能可以有很大的提升，而且应用所占用的资源还比原来采用同步方式编程的低得多。在语言级别，由于是单线程运行，所以完全不存在线程间同步这种麻烦事。

Node.js的并发模型基于事件循环(Event Loop)。下面是一个最简单的事件循环模型：

1
2
3

while (queue.waitForMessage()) {
  queue.processNextMessage();
}

这是一个无限while循环，当事件队列中有未处理的消息时，就取出一个消息来处理，否则就一直等待直到有队列中有消息。

为了解释Node.js的事件循环，这里直接引用我翻译的Node.js官方文档中对其事件循环的描述(译)深入理解Node.js的事件循环、定时器和process.nextTick()。

JavaScript异步编程的几种常见模式

回调函数
Promise
Generation Function
async/await
Event

回调函数(callback)

回调函数是最基本的一种异步调用模式，回调函数会在异步操作完成之后被调用。下面试一个简单的Node.js中异步读取文件的例子：

// readFileCallback.js
const fs = require('fs');

fs.readFile('a.txt', (err, data) => {
  if (err) {
    throw err;
  }
  console.log(data.toString());
});

console.log('foo');

运行结果如下：

1
2
3

$ babel-node readFile.js
foo
file a content

foo被先打印出来，接着等文件读取完毕，打印出文件内容file a content，可以看到读取文件这个操作并不会阻塞当前进程。因为Node.js运行时直接从fs.readFile中返回，继续往下运行。

再看一个定时器的例子：

// timerCallback.js
const fn = () => {
  console.log(1);
};

setTimeout(fn, 3000);
console.log(2);

运行这段代码会发现运行后控制台立即打印出2，接着在大约3000毫秒后，控制台打印出1。这个例子再次体现了Node.js的异步特性。

我们再来看看在同步模式中写代码的场景。假设用户想要读取一个文件，由于读取文件（内部是一个系统调用，需要陷入内核）是一个耗时操作（文件比较大或者使用机械硬盘的时候的尤其耗时），因此在同步模式下，这个读取操作会阻塞当前进程（假设目前没有使用多线程），当前进程将被挂起。当前进程的其他代码在该读取操作完成之前无法被执行，如果这个文件的读取需要耗费1秒，则当前进程就要被阻塞1秒，也就是说宝贵的CPU资源在程序运行的时候要被白白浪费1秒。不要小看这1秒，1秒的CPU资源在程序在运行的时候是非常宝贵的。

如果我们想要使用回调函数的方式按顺序读取两个文件，再打印出它们的内容就要嵌套使用回调函数了：

// nestReadFileCallback.js
const fs = require('fs');

fs.readFile('a.txt', 'utf8', (err, data) => {
  console.log("a file content: " + data);
  fs.readFile('b.txt', 'utf8', (err, data) => {
    console.log("b file content: " + data);
  });
});

结果如下：

1
2
3

$ babel-node nestCallback.js
a file content: file a content
b file content: file b content

这里为了达到异步串行执行的目的，我们使用了嵌套回调。代码开始有点不清爽了，想象一下如果多个异步调用需要按一定顺序串行执行，例如后一次异步调用依赖前一次异步调用的数据，代码会是这个样子：

// callback hell
doSomethingAsync1((err1, data1) => {
  doSomethingAsync2(data1, (err2, data2) => {
    doSomethingAsync3(data2, (err3, data3) => {
    	doSomethingAsync4(data3, (err4, data4) => {
    		doSomethingAsync5(data4, (err5, data5) => {
    		});
    	});
    });
  });
});

如果业务逻辑比较复杂，维护这种代码简直是噩梦，开发者把这种代码叫做callback hell（回调地狱）。那怎么办呢？我们可以使用Promise。

Promise

ES 6中原生提供了Promise对象，Promise对象代表某个未来才会知道结果的事件(一般是一个异步操作)，换句话说，一个Pomise就是一个代表了异步操作最终完成或者失败的对象。Promise本质上是一个绑定了回调的对象，而不是像callback异步编程那样直接将回调传入函数内部。

Promise对外提供了统一的API，可供进一步处理。Promise的最终状态有两种：fulfilled和rejected，fulfilled表示Promise处于完成状态，rejected表示Promise处于被拒绝状态，这两种状态都是Promise的已决议状态，相反如果Promise还未被决议，它就处于未决议状态。

需要强调的一点是，Promise一经决议就无法改变其状态，这使得Promise和它的名字一样：君子一言驷马难追。

使用Promise对象可以用同步操作的流程写法来表达异步操作，避免了层层嵌套的异步回调，代码也更加清晰易懂，方便维护。用Promise重写读取文件的例子：

// promiseReadSingleFile.js
const fs = require('fs')

const read = filename => {
  return new Promise((resolve, reject) => {
    fs.readFile(filename, 'utf8', (err, data) => {
    	if (err){
    		reject(err);
    	}
    	resolve(data);
    });
  });
}
    
read('a.txt')
.then(data => {
  console.log(data);
}, err => {
  console.error("err: " + err);
});

如果有多个异步操作需要串行执行，且后一个操作需要拿到前一个操作的结果，我们可以在Promise上使用链式调用(Promise chain)，下面是顺序读取两个文件的例子：

// promiseReadMultiFiles.js
const fs = require('fs')

const read = filename => {
  return new Promise((resolve, reject) => {
    fs.readFile(filename, 'utf8', (err, data) => {
    	if (err){
    		reject(err);
    	}
    	resolve(data);
    });
  });
}

read('a.txt')
.then(data => {
  console.log(data);
  return read('b.txt'); // 注意这里：在then中返回一个Promise
}, err => {
  console.error("err: " + err);
})
.then(data => {
  console.log(data);
}, err => {
  console.error("err: " + err);
});

现在可以大致总结一下用Promise写串行异步程序的基本模式：


func1()
.then(result1 => {
  return func2(result1);
})
.then(result2 => {
  return func3(result2);
})
.then(result3 => {
  return func4(result3);
})
.catch(err => {
  // handle error
})

then里的参数是可选的，这里的.catch(errCallback)其实是then(null, errCallback)的缩写形式。需要注意的是，如果想要在then的fulfilled中获取上一个Promise中的结果，上一个Promise中必要显式返回结果。

catch之后还可以继续链式调用：

// catch1.js
new Promise((resolve, reject) => {
  console.log('Initial');
  resolve();
})
.then(() => {
  throw new Error('Something failed');
  console.log('Do something'); // never reach here!
})
.catch(() => {
  console.error('Catch error');
})
.then(() => {
  console.log('Do this whatever happened before');
});

运行结果如下：

$ babel-node catch1.js
Initial
Catch error
Do this whatever happened before

一个Promise链式调用在遇到错误时会立即停止，此时如果在该出错的then之后有catch（不管这个catch是否紧跟在出错then之后），这个catch里的errCallback都会被调用，出错then和catch中间的所有then都会被忽略：

// catch2.js
new Promise((resolve, reject) => {
  console.log('Initial');
  resolve();
})
.then(() => {
  throw new Error('Something failed');
  console.log('Do this'); // never reach here!
})
.then(() => {
  console.log('Skip this'); // never reach here!
})
.catch(() => {
  console.error('Catch error');
})
.then(() => {
  console.log('Final');
})

运行结果如下：

$ babel-node catch2.js
Initial
Catch error
Final

在实际编程中，如果我们将一系列异步操作使用Promise链串行执行，意味着这一串操作是一个整体。一旦整体操作中的某个步骤出错，都不应该继续执行下去了。此时我们可以把catch放在Promise链的最后：

// catch3.js
new Promise((resolve, reject) => {
  console.log('Initial');
  resolve();
})
.then(() => {
  console.log('Do something 1');
})
.then(() => {
  throw new Error('Do something 2 failed');
  console.log('Do something 2'); // never reach here!
})
.then(() => {
  console.log('Do something 3'); // never reach here!
})
.catch((err) => {
  console.error(`Catch error: ${err}`);
})

运行结果如下：

$ babel-node catche.js
Initial
Do something 1
Catch error: Error: Do something 2 failed

这么做的好处显而易见，这符合软件工程中的Fail Fast。

小练习

将setTimeout函数Promise化。

解析：

setTimeout是一个旧式的异步API，它接受一个回调和一个时间参数。在ES 6以后写异步代码，强烈不建议直接调用旧式的异步API，应该把这些API都包装成Promise，并且永远不要在业务代码中直接调用这些旧式异步API。为什么不建议这么做？一个很重要的原因对异常的捕获会有问题：

// setTimeoutError.js
const fn = () => {
  throw new Error('This is an error!');
};

try {
  setTimeout(fn, 1000);
} catch (err) {
  console.error(err); // never reach here!
}

这里try/catch块无法捕获到fn中的异常。

参考代码：

// timerPromise.js
const delay = time => {
  return new Promise((resolve, reject) => {
    setTimeout(resolve, time);
  });
};

delay(5000)
.then(() => {
  console.log('here');
})

console.log('hello');

运行这段代码，hello会被立即打印，here会在大约5000毫秒后被打印：

1
2
3

$ babel-node timerPromise.js
hello
here

回到刚才说到的异常捕获问题，将setTimeout包装成Promise后，我们就可以捕获到异常了：

// timerPromiseCatch.js
const delay = time => {
  return new Promise((resolve, reject) => {
    setTimeout(resolve, time);
  });
};

delay(5000)
.then(() => {
  throw new Error('This is an error!');
})
.catch(err => {
  console.error(err); // Error: This is an error!
})

Promise API

Promise.resolve() 和 Promise.reject()

使用Promise.resolve()可以立即得到一个已经resolve的Promise，这里有两种情况，如果入参本身就是一个Promise，则Promise.resolve()原样返回这个Promise，如果入参是一个立即值（比如一个整型），那么Promise.resolve()会将这个立即值包装成Promise然后返回：

// promiseResolve.js
const p1 = Promise.resolve(100);
console.log(p1); // Promise { 100 }

const p2 = new Promise((resolve, reject) => {
  resolve(200);
});
console.log(p2); // Promise { 200 }

const p3 = Promise.resolve(p2);
console.log(p3); // Promise { 200 }
console.log(p2 === p3); // true

使用Promise.reject()则是可以立即得到一个已经reject的Promise，其使用方式和Promise.resolve()类似。

Promise.all()

Promise.all()接受一个Promise的数组，而且会并行地处理数组中的所有Promise：

// promiseAll.js
const fs = require('fs')

const read = filename => {
  return new Promise((resolve, reject) => {
    fs.readFile(filename, 'utf8', (err, data) => {
    	if (err){
    		reject(err);
    	}
    	resolve(data);
    });
  });
};

const p1 = read('a.txt');
const p2 = read('b.txt');

const results = Promise.all([p1, p2]);
results
.then(data => {
  console.log(data); // [ 'file a content', 'file b content' ]
})

Promise.all()会返回一个promise，这个promise会收到一个完成消息，这是一个由所有传入的promise的完成消息组成的数组，该数组中元素的顺序与传入时的元素顺序一致，与每个promise的完成时间无关。从Promise.all()返回的这个promise只有在所有的成员promise完成后才会完成。如果这些成员promise中有一个被拒绝的话，Promise.all()返回的promise就会立即被拒绝，并丢弃所有其他promise的全部结果。

看一个例子，如果其中某个promise决议后为拒绝状态：

// promiseAllWithReject.js
const fs = require('fs')

const read = filename => {
  return new Promise((resolve, reject) => {
    fs.readFile(filename, 'utf8', (err, data) => {
    	if (err){
    		reject(err);
    	}
    	resolve(data);
    });
  });
};

const p1 = read('a.txt');
const p2 = read('b.txt');
const p3 = new Promise((resolve, reject) => {
  reject(new Error('This is an error!'));
});

const results = Promise.all([p1, p2, p3]);
results
.then(data => {
  console.log(data); // never reach here!
}, err => {
  console.error(err); // Error: This is an error!
});

请记住为每个promise都关联一个拒绝处理函数。

刚才提到只有Promise.all()中的所有成员promise都已完成，其返回的promise的状态返回是已完成。也就是说，Promise.all()调用的完成时间取决于最慢完成的那个promise。一个简单的例子：

// promiseAllTime.js
const delay = time => {
  return new Promise((resolve, reject) => {
    setTimeout(resolve, time);
  });
};

const p1 = delay(1000);
const p2 = delay(5000);

const start = new Date().getTime();
const p = Promise.all([p1, p2]);

p
.then(data => {
  const end = new Date().getTime();
  console.log(`Time consuming: ${end - start}ms`);
});

运行结果：

1 2	$ babel-node promiseAllTime.js Time consuming: 5002ms

简而言之，Promise.all()会协调所有promise的运行。

Promise.race()

Promise.race()接收一个promise数组，这些promise之间是竞争关系，哪个先完成就返回哪个：

// promiseRace.js
const delay = time => {
  return new Promise((resolve, reject) => {
    setTimeout(resolve, time);
  });
};

const p1 = new Promise((resolve, reject) => {
  delay(1000).then(data => {
    return resolve(100);
  })
});

const p2 = new Promise((resolve, reject) => {
  delay(5000).then(data => {
    return resolve(200);
  })
});

const start = new Date().getTime();
const p = Promise.race([p1, p2]);

p
.then(data => {
  console.log(data); // 100
  const end = new Date().getTime();
  console.log(`Time consuming: ${end - start}ms`);
});

这里p1和p2各延迟了1000ms和5000ms，分别返回100和200，使用Promise.race()只会得到先完成的p1的值，而p2会被丢弃。

Promise.race()的一种典型用法就是为一个可能耗时较长的异步操作设置一个超时，如果我们希望针对某个异步操作设置一个超时时间，如果超时了，就拒绝这个异步操作的状态，可以这么处理：

// promiseRaceTimeout.js
const delay = time => {
  return new Promise((resolve, reject) => {
    setTimeout(resolve, time);
  });
};

const timeout = time => {
  return new Promise((resolve, reject) => {
    const err = new Error('Time out!');
    setTimeout(() => {
      reject(err);
    }, time);
  });
};

const p1 = new Promise((resolve, reject) => {
  delay(1000).then(data => {
    return resolve(100);
  })
});

const p2 = new Promise((resolve, reject) => {
  delay(5000).then(data => {
    return resolve(200);
  })
});

const p = Promise.race([p1, timeout(3000)]);
p
.then(data => {
  console.log(data); // 100
}, err => {
  console.error(err);
});

const p_ = Promise.race([p2, timeout(3000)]);
p_
.then(data => {
  console.log(data);
}, err => {
  console.error(err); // Error: Time out!
});

这里p1需要1000ms才能完成，p2需要5000ms，超时定时器统一设置成了3000ms，因此Promise.race([p1, timeout(3000)])会得到已经完成的p1的值（100），Promise.race([p2, timeout(3000)])会得到一个超时的结果，在then的reject中可以拿到这个异常。当然，如果在超时定时器超时之前已经有promise被拒绝的话，Promise.race()会直接变成拒绝状态。

Promise API还有其他几个变体：

Promise.none() 和Promise.all()相反，要求所有promise都要被拒绝，然后将拒绝转化成完成值。
Promise.any() 会忽略拒绝，只要有一个promise完成，整体的状态即为完成。
Promise.first() 只要第一个promise完成，它就会忽略后续promise的任何完成和拒绝。
Promise.last() 类似于Promise.first()，但条件变为只有最后一个promise完成胜出。

对这个四个Promise API有兴趣的同学可以自己做做实验，这里不再深入讲解。

then()和catch()

刚才已经提到过，使用then()和catch()可以形成Promise调用链，这里快速总结一下它们的使用方法：

p.then(fulfilled);
p.then(fulfilled, rejected);
p.catch(rejected); // 等价于 p.then(null, rejected);

包装旧式异步API

可能项目中有一些遗留代码还在使用旧式异步API，如果我们要将这部分代码Promise化，最好是有比较好用的工具，下面的polyfill可以帮助你Promise化旧式异步API：

// promiseWrapper.js
const promiseWrapper = fn => {
  return function () {
    const args = [].slice.call(arguments); // convert arguments to a real array
    return new Promise((resolve, reject) => {
      const cb = (err, data) => {
        if (err) {
          reject(err);
        } else {
          resolve(data);
        }
      };
      fn.apply(null, args.concat(cb));
    });
  };
};

测试一下：

// promiseWrapper.js
const fs = require('fs');

const read = promiseWrapper(fs.readFile);

read('a.txt', 'utf8')
.then(data => {
  console.log(data);
}, err => {
  console.error(err);
})

read是经过Promise化的fs.readFile，调用read会返回一个Promise，一切和我们想象的一致。不过这样用有一个前提条件，原来的旧式异步API必须是error-first的，好消息是大多数Node.js核心API都是error-first的。

Promise的局限性

不可取消。
不可打断。
一经决议就不可变。

迭代器(Iterator)和生成器(Generator)

ES 6中引入了生成器函数(Generator Function)。生成器函数用function *定义。它和普通函数相比有一些有意思的特性。

用一个简单的例子来展示生成器函数的工作方式：

// generator.js
function *generator() {
  console.log('hello');
  const x = 10 * (yield 'world');
  return x;
};

const it = generator();
let res = it.next();
console.log(res); // { value: 'world', done: false }

console.log('pause here');

res = it.next(4);
console.log(res); // { value: 40, done: true }

运行结果：

$ babel-node generator.js
hello
{ value: 'world', done: false }
pause here
{ value: 40, done: true }

上面代码段定义了一个生成器函数，这里重要的是它的执行流程：

调用一个生成器函数（就像调用普通函数那样）并不会立即开始执行这个生成器内部的代码，而是返回一个它的迭代器。因此generator();实际上返回了一个迭代器。
接着let res = it.next();这行代码使生成器函数开始执行，打印hello。当遇到yield时，生成器会暂停，交出控制权。这里打印res会发现其内容为{ value: 'world', done: false }，value是生成器内部的yield出的值，如果yield后面没有东西，这个value就是undefined，done为false表示生成器还未执行完毕。
console.log('pause here');这行代码是我们在生成器暂停期间插入的一段执行逻辑。刚才提到，在生成器暂停期间会交出控制权，因此控制权又回到外部。
语句res = it.next(4);将使生成器继续运行，直到遇到下一个yield，而且这次传入了4，通过next()传入的值会使得yield获取这个值，所以在生成器内部x的值就是40（10*4）。再次观察res为{ value: 40, done: true }，由于生成最终返回x，所value就是40，done也变为true了，说明生成器执行完毕。

通过解析这段代码我们可以发现几个很有意思的事情：

生成器内部可以通过yield主动交出控制权，使控制权回到调用方。
yield后面可以有值，有值得yield会将这个值返回出来。
可以通过next()将值传入生成器中，该值将作为对应yield的值。
调用next()后，会获得一个结果，这个结果包含两个值，value表示当前yield的执行结果（或者return的结果）done表示生成器执行状态的信息：true/false分别表示执行完毕和还未执行完毕。
生成器通过yeild和next使得外部和生成器内部的通信称为可能。

看到这里可能有人要问了，这有什么用呢？和Promise相比有什么好处？请慢慢往下看。

还有一种场景，假设我们要获得一个无限的自然数序列，从小到大一次取出一个来用。由于自然数是无限的，我们不可能一次性用一个数组将它们都生成出来（时间上不允许，空间上也不允许），其实也没有必要。我们只需要在需要获取一个自然数的时候生成出一个就好了。这时使用生成器再合适不过：

// numberGenerator.js
function *numberGenerator() {
  let num = 0;
  while (true) {
    yield num++;
  }
};

const it = numberGenerator();
let res = it.next();
console.log(res); // { value: 0, done: false }

res = it.next();
console.log(res); // { value: 1, done: false }

res = it.next();
console.log(res); // { value: 2, done: false }

res = it.next();
console.log(res); // { value: 3, done: false }

由于生成器里面是一个无限while循环，所以done一直是false。

使用生成器函数需要注意一点，在获得生成器函数的迭代器后，第一次调用其next()方法时不需要传参数（尽管你可以这么做）。因为此时还没遇到yield，传了也没意义。

生成器函数的错误处理

可以直接在生成器函数中使用try/catch捕获异常：

// generatorCatchError.js
function *generator() {
  try {
    const x = (yield 'world')();
    return x;
  } catch (err) {
    console.error(err); // TypeError: (intermediate value) is not a function
  }
};

const it = generator();
it.next();
const res = it.next('bar');
console.log(res); // { value: undefined, done: true }

由于上面的代码段中有异常，被catch捕获，没有显式调用return语句，所以默认返回值是undefined。

想停止一个生成器函数只需要调用其迭代器的return方法：

// generatorStop.js
function *numberGenerator() {
  let num = 0;
  while (true) {
    yield num++;
  }
};

const it = numberGenerator();
let res = it.next();
console.log(res); // { value: 0, done: false }

res = it.next();
console.log(res); // { value: 1, done: false }

res = it.next();
console.log(res); // { value: 2, done: false }

res = it.next();
console.log(res); // { value: 3, done: false }

res = it.return(); // stop generator
console.log(res); // { value: undefined, done: true }

回想Promise部分介绍的链式Promise，虽然避免了嵌套回调问题，但是一连串.then()也让人挺烦的，如果能真正像写同步代码那样写串行异步代码那该多好。实际上使用生成器函数已经可以做到这点。但是为了更好地理解后面的内容，这里还有几个准备工作要做。我们知道在生成器函数中yield一个值的时候，外部可以通过next()拿到这个值，刚才的代码中yield后面都是立即值，如果把这个值换成一个异步函数会怎样？

很自然地，我们会想让代码变成这样：

// generatorReadFileBadExample.js
const fs = require('fs');

function *generator (){
	var file1 = yield fs.readFile('a.txt', 'utf8');
	console.log(file1); // undefined
};

const it = generator();
let res = it.next();
console.log(res); // { value: undefined, done: false }
res = it.next();
console.log(res); // { value: undefined, done: true }

但很可惜的是，这样做并不奏效，为什么？

小练习

思考一下为什么上面这段代码不能工作？

解析：

其实仔细思考yield的行为就会发现，fs.readFile是一个旧式的异步API，调用它会立即返回undefined，如果没有传入一个回调函数给它，我们无法获得任何信息。那么问题来了，如果还要在生成器函数里调用fs.readFile时传入回调函数，那不是又回到解放前了吗，我们可不想再直接去面对赤裸裸地回调函数。也就是说，将fs.readFile直接在生成器内部执行是不可能的了，那么只能将fs.readFile的执行放到生成器函数外部，换句话说，我们要将fs.readFile连同它的参数通过yield传递到外部去执行，我们需要包装一下fs.readFile。将一个函数和一堆参数绑定后塞入另一个新的函数里，叫函数的柯里化(currying)，换一种更通俗易懂的讲法：我们把一堆参数固定到一个函数上。

由于在JavaScript中函数是一等对象，所以借助高阶函数的抽象功能，可以写一个帮助方法来对任意在最后一个参数上为回调函数的异步API进行柯里化：

// thunkify.js
const fs = require('fs');

const thunkify = fn => {
  return function() {
    const args = [].slice.call(arguments);
    return (cb) => {
      fn.apply(null, args.concat(cb));
    };
  };
};

const readFile = thunkify(fs.readFile);

readFile('a.txt', 'utf8')((err, data) => {
  console.log(data); // file a content
});

我们来尝试一下将柯里化后的旧式异步API和生成器函数结合使用：

// generatorReadFile1.js
const fs = require('fs');

const thunkify = fn => {
  return function() {
    const args = [].slice.call(arguments);
    return (cb) => {
      fn.apply(null, args.concat(cb));
    };
  };
};

const readFile = thunkify(fs.readFile);

function *generator (){
  const file1 = yield readFile('a.txt', 'utf8');
  console.log(file1); // undefined
  const file2 = yield readFile('b.txt', 'utf8');
  console.log(file2); // undefined
};

const it = generator();
let res = it.next();
res.value((err, data) => {
  console.log(data); // file a content
});
res = it.next();
res.value((err, data) => {
  console.log(data); // file b content
});
res = it.next();
console.log(res); // { value: undefined, done: true }

第一次调用next()时，我们从其value中得到了柯里化后的fs.readFile，我们叫它readFile。readFile接受一个回调函数，因此只要传入回调我们就能获得异步调用的结果。很好，我们的第一步目的达到了。但是仔细一看，还是有问题：在生成器函数中我们打印file1和file2结果都是undefined，生成器函数在交出控制权后，控制权转移到外部，异步调用也在外部完成，异步调用的结果也在外面。没关系，我们可以通过next(value)将这个异步调用结果带回给生成器函数内部：

// generatorReadFile2.js
const fs = require('fs');

const thunkify = fn => {
  return function() {
    const args = [].slice.call(arguments);
    return (cb) => {
      fn.apply(null, args.concat(cb));
    };
  };
};

const readFile = thunkify(fs.readFile);

function *generator() {
  const file1 = yield readFile('a.txt', 'utf8');
  console.log('got ' + file1); // got file a content
  const file2 = yield readFile('b.txt', 'utf8');
  console.log('got ' + file2); // got file b content
};

const it = generator();
let res = it.next();
res.value((err, data) => {
  res = it.next(data);
  res.value((err, data) => {
    res = it.next(data);
    console.log(res); // { value: undefined, done: true }
  });
});

非常好，我们成功地将异步调用的结果又传回给生成器函数，问题到这一步应该说已经基本解决了。说基本解决是因为调用方式还没有自动化，还需要手动一步步调用res.value(cb)，再次发挥JavaScript高阶函数的强大威力，写一个自动执行生成器函数的工具吧：

// generatorAutoRunner.js
const fs = require('fs');

const thunkify = fn => {
  return function() {
    const args = [].slice.call(arguments);
    return (cb) => {
      fn.apply(null, args.concat(cb));
    };
  };
};

const readFile = thunkify(fs.readFile);

function *generator() {
  const file1 = yield readFile('a.txt', 'utf8');
  console.log('got ' + file1); // got file a content
  const file2 = yield readFile('b.txt', 'utf8');
  console.log('got ' + file2); // got file b content
};

const run = g => {
  const it = g();
  
  function next(err, data) {
    const res = it.next(data);
    if (res.done) {
      return res.value;
    }
    res.value(next);
  }

  next();
};

run(generator);

自动运行生成器函数的原理很简单，在生成器函数的迭代器上执行next时，返回的是一个柯里化后的异步函数，我们需要调用这个异步函数，同时传入一个参数，这个参数是一个回调函数，它是自动执行的关键，该回调函数内部在获取到结果值的时候，需要调用next方法将这个结果值带回给生成器函数内部，如此循环下去直到结束。

yield *语句

普通的yield语句后面跟一个异步操作，yield 语句后面可以跟另一个可迭代对象，在实际使用中yield 后面一般要跟另一个Generator函数：

var fs = require('fs');

const thunkify = fn => {
  return function() {
    const args = [].slice.call(arguments);
    return (cb) => {
      fn.apply(null, args.concat(cb));
    };
  };
};

const readFile = thunkify(fs.readFile);
    
function *generator() {
	const f1 = yield readFile('a.txt', 'utf8');
	console.log(f1); // file a content

  const f_ = yield *anotherGenerator(); //此处插入了另外一个异步流程
  console.log(f_); // file c content

	var f3 = yield readFile('b.txt', 'utf8');
	console.log(f3); // file b content
};
    
const anotherGenerator = function* (){
	const f = yield readFile('c.txt', 'utf8');
  return f;
}
    
function run(g) {
	const it = g();

	function next(err, data) {
		const result = it.next(data);
		if (result.done) return;
		result.value(next);
	}

	next();
}
    
run(generator);  //自动执行

在使用生成器函数作为异步控制流的时期，业界比较流行的自动执行的解决方案是co库：

// co1.js
const fs = require('fs');
const co = require('co');

const thunkify = fn => {
  return function() {
    const args = [].slice.call(arguments);
    return (cb) => {
      fn.apply(null, args.concat(cb));
    };
  };
};

const readFile = thunkify(fs.readFile);

co(function *generator() {
  const file1 = yield readFile('a.txt', 'utf8');
  console.log('got ' + file1); // got file a content
  const file2 = yield readFile('b.txt', 'utf8');
  console.log('got ' + file2); // got file b content
});

还可以直接利用co库并发地执行一系列操作：

// co2.js
const fs = require('fs');
const co = require('co');

const thunkify = fn => {
  return function() {
    const args = [].slice.call(arguments);
    return (cb) => {
      fn.apply(null, args.concat(cb));
    };
  };
};

const readFile = thunkify(fs.readFile);

co(function *generator() {
  const files = ['a.txt', 'b.txt'];
  const res = yield files.map(file => readFile(file, 'utf8'));
  console.log(res); // [ 'file a content', 'file b content' ]
});

还可以用yield并发地执行一个可迭代对象中的异步操作：

// coWithArray.js
const fs = require('fs');
const co = require('co');

const thunkify = fn => {
  return function() {
    const args = [].slice.call(arguments);
    return (cb) => {
      fn.apply(null, args.concat(cb));
    };
  };
};

const readFile = thunkify(fs.readFile);

co(function *generator() {
  const files = ['a.txt', 'b.txt'];
  const results = yield* files.map(file => {
    return readFile(file, 'utf8');
  });
  console.log(results); // [ 'file a content', 'file b content' ]
});

async/await

直到ES 7中出现async/await之前，业界普遍都是采用co库的方案。

async和await是ES 7中的新语法，新到连ES 6都不支持，但是可以通过Babel一类的预编译器处理成ES 5的代码。目前比较一致的看法是async和await是js对异步的终极解决方案。要注意的一个点是，await只能用在async函数中，但async函数中未必一定要有await。

立即尝试看看：

// async.js
const promiseWrapper = fn => {
  return function () {
    const args = [].slice.call(arguments); // convert arguments to a real array
    return new Promise((resolve, reject) => {
      const cb = (err, data) => {
        if (err) {
          reject(err);
        } else {
          resolve(data);
        }
      };
      fn.apply(null, args.concat(cb));
    });
  };
};

const fs = require('fs');

const readFile = promiseWrapper(fs.readFile);
    
const asyncReadFile = async function () {
	const f1 = await readFile('a.txt', 'utf8');
	const f2 = await readFile('b.txt', 'utf8');
	console.log(f1); // file a content
	console.log(f2); // file b content
};
    
asyncReadFile();

如果不加await调用async函数，该异步函数将像旧式异步函数那样直接返回，也就是说，后面的代码不会等待该异步函数执行完毕，看一个例子：

// async-without-await.js
const delay = time => {
  return new Promise((resolve, reject) => {
    setTimeout(resolve, time);
  });
};
    
const demo = async function () {
  const start = new Date().getTime();
  delay(5000);
  console.log(`${new Date().getTime() - start}ms --- a`);
  await delay(5000);
  console.log(`${new Date().getTime() - start}ms --- b`);
};
    
demo();

打印结果：

1 2	0ms --- a 5006ms --- b

使用事件进行异步编程

除了回调函数、Promise、Generator、async/await这些异步方案以外，还有一种常见的异步方案：事件。在Node.js中使用事件编程十分简单，下面是一个示例：

// event.js
var events = require('events');

var eventEmitter = new events.EventEmitter();

eventEmitter.on('news', payload => {
  console.log(payload.data);
});

eventEmitter.on('logout', payload => {
  console.log(`User logout: ${payload.data}`);
});

eventEmitter.emit('news', { data: 'Hello world!'});
eventEmitter.emit('logout', { data: 'Foo'});

事件的一大特定是它的解耦能力，事件相比方法调用的耦合度要低一些。在一些业务场景下，模块之间可以通过事件来解耦。

常用的异步编程库

async
bluebird
co

准备工作

写在阅读之前

并发模型和事件循环

JavaScript异步编程的几种常见模式

回调函数(callback)

Promise

小练习

Promise API

Promise.resolve() 和 Promise.reject()

Promise.all()

Promise.race()

then()和catch()

包装旧式异步API

Promise的局限性

迭代器(Iterator)和生成器(Generator)

生成器函数的错误处理

小练习

yield *语句

async/await

使用事件进行异步编程

常用的异步编程库

更多信息