@FunC 2018-01-02T16:31:51.000000Z 字数 7833 阅读 2673

Node.js Design Patterns | CH03～04

使用回调函数的异步流程控制模式

`Node.js`

CH03 使用callback

本章概要/总结
1. 通过一个爬虫应用介绍了如何用原生 JS 解决回调地狱的问题
2. 顺序执行、顺序遍历模式
3. 并发执行、限制并发数的模式
4. 介绍 async 库

异步编程的难点

在编写异步代码时，闭包和内联匿名函数确保了流畅的编码体验，符合KISS原则。
然而，这牺牲了部分的模块性、可复用性和可维护性。随着嵌套的回调函数越来越多，代码将越发容易失去控制。
很多时候我们创建的闭包是多余的，所以实际上这更多的是一个编码规范的问题。能否意识到代码即将变得笨重，是新手和专家的主要区别。

回调地狱

形如以下格式的代码被称为回调地狱：

asyncFoo( err => {
    asyncBar( err => {
        asyncFooBar( err => {
            // …
        });
    });
});

回调地狱会导致一系列的问题：
1. 代码可读性差
2. 代码难以组织
3. 很难追踪一个函数在哪里结束，下一个函数从何处开始
4. 变量名容易被覆盖

使用原生 JavaScript 编写异步代码

回调函数使用准则

尽快结束。使用return, continue, break来立即结束当前声明。
使用具名函数。让其远离闭包，并将中间结果作为其参数。另外，使用具名函数还有助于栈追踪。
尽可能模块化代码。尽可能地将代码分割成更小，可复用的函数。

实践

// before
if (err) {
    callback(err);
} else {
    // code to execute when there are no errors
}
// after
if (err) {
    return callback(err);
}
// code to execute when there are no errors

注意不用在意此处return的值，真正的结果是异步产生并传递给回调函数的。当然，为了语义更加清晰，可以进一步写成：

callback(…);
return;

顺序执行（Sequential execution）

顺序执行意味着每次只执行一个任务，一个接着下一个。其执行顺序必须确保，因为任务执行的结果可能会影响到下一个任务。
使用异步CPS模式书写顺序执行代码时，很容易会导致回调地狱。

顺序执行一系列已知任务

我们可以将代码组织成如下格式：

function task1(callback) {
    asyncOperation(() => {
        task2(callback);
    });
}
function task2(callback) {
    asyncOperation(result => {
        task3(callback);
    });
}
function task3(callback) {
    asyncOperation(() => {
        callback(); // finally execute the callback pass from task1;
    });
}
task1(() => {
    // callback to be executed when task1, task2 and task3 are completed
    console.log('task1,2 and 3 executed!');
});

这段代码的侧重点在于将任务模块化。同时为我们展示了在编写异步代码时不总是需要使用闭包。

顺序遍历

上述的模式适用于已知任务数量的情况，在不清楚任务数量的情况下，我们不能硬编码任务队列。
下面给出一种“顺序遍历模式”（sequential iterator pattern）来解决这种情况：

function iterateSeries(collection, iteratorCallback, finalCallback) {
    function iterate(index) {
        if (index === collection.length) {
            return finalCallback();
        }
        const task = collection[index];
        // iteratorCallback must execute after task finish
        task(iteratorCallback(iterate, index)); // seems too complex
    }
    iterate(0);
}
// example of iteratorCallback
function iteratorCallback(iterator, index) {
    iterator(index + 1);
}

通过这种方式，我们可以使用generator和promise模拟async/await：

function autorun(gen) {
    return new Promise((resolve, reject) => {
        var g = gen();
        function iterator(execute) {
            try {
                var yielded = execute();
            } catch (err) {
                return reject(err);
            }
            if (yielded.done) {
                return resolve(yielded.value);
            }
            return Promise.resolve(yielded.value)
                    .then((result) => iterator(() => g.next(result)),
                           (error) => iterator(() => g.throw(error)));
        }
        iterator(() => g.next())
    });
}

并发执行

当对结果的返回顺序没有要求，只关心任务全部完成的时刻时，可以让其并发（concurrency）执行。根据第一章的知识，单线程的 Node.j 通过 Event Loop 和异步 API 来处理并发

可以想到，实现这种模式只需通过一个计数器，来计算何时全部任务执行完毕即可。

const task = [/* ... */];
let completed = 0; // counter
tasks.forEach(task => {
    task(() => {
        if (++completed === tasks.length) {
            finish();
        }
    });
});
function finish() { /* execute when all the tasks completed */}

解决并发任务重的竞争情况

尽管 Node.js 时单线程，我们仍可能会遇到竞争的情况。问题源自于异步任务的触发与完成之间有时间差。
一个简单的例子是：根据 url 下载一个页面，当这个页面已经存在时就跳过不再下载。而检查页面是否已下载的方法是利用fs.readFile 尝试读取该文件。
细心的你可能已经发现，fs.readFile是一个异步 API ，当其执行时，main 函数可能又尝试启动了一次对同一个 url 的下载，此时上一次下载仍未完成，所以出现了重复下载。

解决的方法也很简答，只要在并发任务开始执行时同步的设置一个标记即可：

const spidering = new Map(); // flag
function spider(url, nesting, callback) {
    if (spidering.has(url)) {
        return process.nextTick(callback);
    }
    spidering.set(url, true); // set flag
    // ...
}

有节制地并发执行

无节制地执行大量并发任务，例如向一个网站发送大量请求。将有可能耗尽对方服务器资源（也被称作DDoS攻击）。所以，我们需要对并发任务设置一个上限：

const tasks = [ /* ... */ ];
let concurrency = 2, running = 0, completed = 0, index = 0;
function next() {
    while(running < concurrencu && completed < tasks.length) {
        task = tasks[index++];
        task(() => {
            if (completed === tasks.length) {
                finish();
            }
            completed++;
            running--;
            next();
        }
}
next();

全局性地限制并发数

使用上述方法，只适用于单个任务队列。如果每个任务还会递归地触发更多的任务队列，那么只能保证限制每个任务队列的并发数。于是，我们需要全局的限制并发数的手段。

使用队列

使用下面这种队列结构是其中一种解决方案：

Class TaskQueue {
    constructor(concurrency) {
        this.concurrency = concurrency;
        this.running = 0;
        this.queue = [];
    }
    pushTask(task) {
        this.queue.push(task);
        this.next();
    }
    next() {
        while(this.running < this.concurrency && this.queue.length) {
            const task = this.queue.shift();
            task(() => {
                this.running—;
                this.next();
            });
            this.running++;
        }
    }
};

带来的好处是：
1. 能够动态地添加任务到队列
2. 有一个集中控制并发数量的中心

async库

async库是处理异步 JavaScript 代码的优秀解决方案，主要原理与本文提及模式相似，并提供了大量不同功能的 API 任君选择。

CH04 使用ES2015及以后的语法

Promise

什么是Promise

Promise 是一个抽象的概念，它允许函数返回一个名为promise的对象，来代表异步操作的最终结果。在 promise 中，如果一个异步操作未完成，那么它处于pending状态；如果成功完成，则变为fulfilled状态；如果失败，则变为rejected状态。而fulfilled和rejected统称为settled状态。
其中 promise 的一个重要的特性，就是then()方法总会返回 promise，所以我们就能够链式调用 promises 了。
此外，promise 最棒的地方在于：如果在onFulfilled()或者onRejected()中抛出异常（使用 throw 抛出），将会自动将异常reject，交给遇到的第一个onRejected()。

此前有很多库都实现了自己的 promise，然而它们不通用。为了解决这个问题，社区提出了Promise/A+实现，规定了最基本的then()方法的行为。

将 Node.js 风格函数 Promise 化

将基于回调的函数转化成 promise，这一过程通常被称为promisification

function promisify(callbackBaseApi) {
    return function promisified() {
        const len = arguments.length;
        let args = [];
        for(let i = 0; i < len; i++) {
            args[i] = arguments[i];
        }
        return new Promise((resolve, reject) => {
            args.push((err, ...result) => {
                if (err) {
                    return reject(err);
                }
                if (result.length = 1) {
                    return resolve(result[0]);
                }
                return resolve(result);
            }
            callbackBaseApi.call(null, args);
        });
    }
};

顺序遍历

想使用 promise 进行任务数量不定的顺序遍历，关键在于要利用好 promise 的返回值总是 promise 这一特性：
通过形如tasks.forEach(task => promise = promise.then(() => task()))的遍历操作编可构造出链式 promise
考虑到每次循环都在使用上一轮的结果，我们可以通过reduce()函数来更好地表达这一模式：

let tasks = [ /* ... */ ];
let promise = tasks.reduce((prev, task) => {
    return prev.then(() => task());
}, Promise.resolve()); // Promise.resolve() is the first "prev"
promise.then(() => {
    // All tasks completed
});

并发执行

使用 promise 处理并发异常便捷，只需使用 Promise.all()即可：
Promise.all()接受一个数组并返回一个 promise。当数组中的全部成员都变成fulfilled状态时，这个 promise 才会被 fulfilled，且值为数组中每一个 promise fulfilled 的值。

限制并发数

很不幸，ES2015 的 Promise API 没有提供原生的限制并发任务的方法。但我们仍可以通过之前的TaskQueue类来实现，只需要稍微修改一下next()函数：

next() {
    while(this.running < this.concurrency && this.queue.length) {
        const task = this.queue.shift();
        // task should be a promise
        task().then(() => {
            this.running--;
            this.next();
        });
        this.running++;
    }
}

公共 API 该使用 callback 还是 promise？

有两种做法：
1. 坚持使用 callback，并提供 promising 的方法
2. 以传统的 callback API 形式提供，当缺少 callback 参数时，返回 promise

Genrator

Generator, 通常也被称为”半协程”。它能生成允许多个入口的子程序（有别于普通函数只能在调用时触发）

利用 generator 进行异步流程控制

思考以下代码：

function asyncFlow(generatorFunction) {
    function callback(err) {
        if (err) {
            return generator.throw(err);
        }
        var results = [].slice.call(arguments, 1);
        generator.next(results.length > 1 ? results : results[0]);
    }
    var generator = generatorFunction(callback)
    generator.next();
}

这样我们就能用同步的写法使用 callback 风格的异步 API 了：

asyncFlow(function* (callback) {
    const fileName = path.basename(__filename);
    const myself = yield fs.readFile(filename, 'utf-8', callback);
    yield fs.writeFile(`clone_of_${filename}`, 'utf-8', callback);
});

此处的 callback 参数容易让人感觉迷惑，我们可以通过 thunk 化来省略 callback 参数。（所谓 thunk 化就是把函数变为只剩下 callback 一个参数的函数）：

function asyncFlowWithThunk(generatorFunction) {
    function callback(err) {
        if (err) {
            return generator.throw(err);
        }
        const results = [].slice.call(arguments,1);
        const thunk = generator.next(results.length > 1 ? results : results[0]).value;
        // callback was invoke inside the asyncFlowWithThunk function
        thunk && thunk(callback);
    }
    const generator = generatorFunction();
    const thunk = generator.next().value;
    thunk && thunk(callback);
}

使用 co 库

co 库提供了一系列工具函数，来完成thunk, promisify等工作

使用生产-消费模式来限制并发数

class TaskQueue {
    constructor(concurrency) {
        this.concurrency = concurrency;
        this.taskQueue = [];
        this.comsumeQueue = [];
        this.running = 0;
        this.spawnWorkers(concurrency);
    }
    pushTask(task) {
        // length !== 0 means some worker is idle
        if (this.comsumeQueue.length !== 0) {
            this.comsumeQueue.shift()(null, task);
        } else {
            this.taskQueue.push(task);
        }
    }
    spawnWorkers(concurrency) {
        const self = this;
        // spawn workers
        for (let i = 0; i < concurrency; i++) {
            co(function* () {
                while (true) {
                    // get task and run
                    const task = yield self.nextTask();
                    yield task;
                }
            });
        }
    }
    nextTask() {
        return callback => {
            if (this.taskQueue.length !== 0) {
                return callback(null, this.taskQueue.shift());
            }
            // if no task in queue, push callback into comsumeQueue indicate that some workers are idle
            this.comsumeQueue.push(callback);
        }
    }
}

通过 Babel 提前使用 async/await

尽管巧妙利用 generator 来书写异步代码很方便，但是毕竟 generator 还是主要用来遍历的。用来写异步代码有时容易让人疑惑，这时我们可以寄望于ES2017的 async/await:

async function main() {
    const html = await getPageHtml("www.baidu.com");
    console.log(html);
}

比较

以上介绍了使用ES2015语法来处理异步流程的多种方法，下面简要列出各种方法的优缺点，以供参考：
1. 原生JS
优点：不依赖库，兼容性好，通常情况下性能最好，允许使用更高级的算法。
缺点：需要书写更多代码，需要书写相对复杂的代码

Async 库
优点：简化了常用的异步流程控制函数，callback 风格，性能好
缺点：引入额外的依赖，不适用于部分复杂流程
Promise
优点：大幅简化常见异步流程，错误处理机制健壮
缺点：对于 callback 风格的 API 需要进行 promisify，耗费部分性能
Generator
优点：可以以同步风格书写异步代码，简化错误处理
缺点：需要配合相应的库使用，仍需要使用 callback 和 promise，对于非generator的 API 需要进行 thunk 化或 promisify
Async/await
优点：同步书写异步代码，语法简洁清晰
缺点：仍未被原生支持（Node 8已支持），需要配合Babel才能使用

Node.js Design Patterns | CH03～04

使用回调函数的异步流程控制模式

Node.js

CH03 使用callback

异步编程的难点

回调地狱

使用原生 JavaScript 编写异步代码

回调函数使用准则

实践

顺序执行（Sequential execution）

顺序执行一系列已知任务

顺序遍历

并发执行

解决并发任务重的竞争情况

有节制地并发执行

全局性地限制并发数

使用队列

async库

CH04 使用ES2015及以后的语法

Promise

什么是Promise

将 Node.js 风格函数 Promise 化

顺序遍历

并发执行

限制并发数

公共 API 该使用 callback 还是 promise？

Genrator

利用 generator 进行异步流程控制

使用 co 库

使用生产-消费模式来限制并发数

通过 Babel 提前使用 async/await

比较

内容目录

`Node.js`