原文:https://mp.weixin.qq.com/s/yTvZQGyoWQ4taJwNvFLiJQ
已知,JavaScript 是单线程的,天生异步,适合 IO 密集型,不适合 CPU 密集型,但是,为什么是异步的喃,异步由何而来的喃,我们将在这里逐渐讨论实现。

一、进程与线程

1. 浏览器是多进程的

它主要包括以下进程:

  • Browser 进程:浏览器的主进程,唯一,负责创建和销毁其它进程、网络资源的下载与管理、浏览器界面的展示、前进后退等。

  • GPU 进程:用于 3D 绘制等,最多一个。

  • 第三方插件进程:每种类型的插件对应一个进程,仅当使用该插件时才创建。

  • 浏览器渲染进程(浏览器内核):内部是多线程的,每打开一个新网页就会创建一个进程,主要用于页面渲染,脚本执行,事件处理等。

2. 渲染进程(浏览器内核)

浏览器的渲染进程是多线程的,页面的渲染,JavaScript 的执行,事件的循环,都在这个进程内进行:

  • GUI 渲染线程:负责渲染浏览器界面,当界面需要重绘(Repaint)或由于某种操作引发回流(Reflow)时,该线程就会执行。

  • JavaScript 引擎线程:也称为 JavaScript 内核,负责处理 Javascript 脚本程序、解析 Javascript 脚本、运行代码等。(例如 V8 引擎)

  • 事件触发线程:用来控制浏览器事件循环,注意这不归 JavaScript 引擎线程管,当事件被触发时,该线程会把事件添加到待处理队列的队尾,等待 JavaScript 引擎的处理。

  • 定时触发器线程:传说中的 setIntervalsetTimeout 所在线程,注意,W3C 在 HTML 标准中规定,规定要求 setTimeout 中低于 4ms 的时间间隔算为 4ms 。

  • 异步 http 请求线程:在 XMLHttpRequest 连接后通过浏览器新开一个线程请求,将检测到状态变更时,如果设置有回调函数,异步线程就产生状态变更事件,将这个回调再放入事件队列中。再由 JavaScript 引擎执行。

注意,GUI 渲染线程与 JavaScript 引擎线程是互斥的,当 JavaScript 引擎执行时 GUI 线程会被挂起(相当于被冻结了),GUI 更新会被保存在一个队列中等到 JavaScript 引擎空闲时立即被执行。所以如果 JavaScript 执行的时间过长,这样就会造成页面的渲染不连贯,导致页面渲染加载阻塞。

二、单线程的 JavaScript

所谓单线程,是指在 JavaScript 引擎中负责解释和执行 JavaScript 代码的线程唯一,同一时间上只能执行一件任务。

问题:首先为什么要引入单线程喃?

我们知道:

  • 浏览器需要渲染 DOM

  • JavaScript 可以修改 DOM 结构

  • JavaScript 执行时,浏览器 DOM 渲染停止

如果 JavaScript 引擎线程不是单线程的,那么可以同时执行多段 JavaScript,如果这多段 JavaScript 都修改 DOM,那么就会出现 DOM 冲突。

你可能会说,web worker 就支持多线程,但是 web worker 不能访问 window 对象,document 对象等。

原因:避免 DOM 渲染的冲突

当然,我们可以为浏览器引入 的机制来解决这些冲突,但其大大提高了复杂性,所以 JavaScript从诞生开始就选择了单线程执行。

引入单线程就意味着,所有任务需要排队,前一个任务结束,才会执行后一个任务。这同时又导致了一个问题:如果前一个任务耗时很长,后一个任务就不得不一直等着。

// 实例1
let i, sum = 0
for(i = 0; i < 1000000000; i ++) {
    sum += i
}
console.log(sum)

在实例1中,sum 并不能立刻打印出来,必须在 for 循环执行完成之后才能执行 console.log(sum)

// 实例2
console.log(1)
alert('hello')
console.log(2)

在实例2中,浏览器先打印 1 ,然后弹出弹框,点击确定后才执行 console.log(2)

总结:

  • 优点:实现比较简单,执行环境相对单纯

  • 缺点:只要有一个任务耗时很长,后面的任务都必须排队等着,会拖延整个程序的执行。常见的浏览器无响应(假死),往往就是因为某一段 Javascript 代码长时间运行(比如死循环),导致整个页面卡在这个地方,其他任务无法执行。

为了解决这个问题,JavaScript 语言将任务的执行模式分为两种:同步和异步

三、同步与异步

1. 同步

func(args...)

如果在函数 func 返回的时候,调用者就能够得到预期结果(即拿到了预期的返回值或者看到了预期的效果),那么这个函数就是同步的。

let a = 1
Math.floor(a)
console.log(a) // 1

2. 异步

如果在函数 func 返回的时候,调用者还不能够得到预期结果,而是需要在将来通过一定的手段得到,那么这个函数就是异步的。

fs.readFile('foo.txt', 'utf8', function(err, data) {
    console.log(data);
});

总结:

JavaScript 采用异步编程原因有两点,

  • 一是 JavaScript 是单线程;

  • 二是为了提高 CPU 的利用率。

四、异步过程

fs.readFile('data.json', 'utf8', function(err, data) {
    console.log(data)
})

在执行这段代码时,fs.readFile 函数返回时,并不会立刻打印 data ,只有 data.json 读取完成时才打印。也就是异步函数 fs.readFile 执行很快,但后面还有工作线程执行异步任务、通知主线程、主线程回调等操作,这个过程就叫做异步过程。

主线程发起一个异步操作,相应的工作线程接受请求并告知主线程已收到(异步函数返回);主线程继续执行后面的任务,同时工作线程执行异步任务;工作线程完成任务后,通知主线程;主线程收到通知后,执行一定的动作(调用回调函数)。

工作线程在异步操作完成后通知主线程,那么这个通知机制又是如何显现喃?答案就是就是消息队列与事件循环。

五、消息队列与事件循环

工作线程将消息放在消息队列,主线程通过事件循环过程去取消息。

  • 消息队列:消息队列是一个先进先出的队列,它里面存放着各种消息。

  • 事件循环:事件循环是指主线程重复从消息队列中取消息、执行的过程。

1. 事件循环(eventloop)

主线程不断的从消息队列中取消息,执行消息,这个过程称为事件循环,这种机制叫事件循环机制,取一次消息并执行的过程叫一次循环。

大致实现过程如下:

while(true) {
    var message = queue.get()
    execute(message)
}

例如:

$.ajax({
    url: 'xxxx',
    success: function(result) {
        console.log(1)
    }
})
setTimeout(function() {
    console.log(2)
}, 100)
setTimeout(function() {
    console.log(3)
})
console.log(4)
// output:4321 或 4312

其中,主线程:

// 主线程
console.log(4)

异步队列:

// 异步队列
function () {
    console.log(3)
}
function () { // 100ms后
    console.log(2)
}
function() { // ajax加载完成之后
    console.log(1)
}

事件循环是JavaScript实现异步的具体解决方案,其中同步代码,直接执行;异步函数先放在异步队列中,待同步函数执行完毕后,轮询执行 异步队列 的回调函数。

2. 消息队列

其中,消息就是注册异步任务时添加的回调函数。

$.ajax('XXX', function(res) {
    console.log(res)
})
...

主线程在发起 AJAX 请求后,会继续执行其他代码,AJAX 线程负责请求 XXX,拿到请求后,会封装成 JavaScript 对象,然后构造一条消息:

// 消息队列里的消息
var message = function () {
    callback(response)
}

其中 callback 是 AJAX 网络请求成功响应时的回调函数。

主线程在执行完当前循环中的所有代码后,就会到消息队列取出这条消息(也就是 message 函数),并执行它。到此为止,就完成了工作线程对主线程的 通知 ,回调函数也就得到了执行。如果一开始主线程就没有提供回调函数,AJAX 线程在收到 HTTP 响应后,也就没必要通知主线程,从而也没必要往消息队列放消息。
xuehuayu.cn
异步过程中的回调函数,一定不在当前这一轮事件循环中执行。

六、异步与事件

消息队列中的每条消息实际上都对应着一个事件。

其中一个重要的异步过程就是:DOM事件

var button = document.getElementById('button')
button.addEventLister('click', function(e) {
    console.log('事件')
})

从异步的角度看,addEventLister 函数就是异步过程的发起函数,事件监听器函数就是异步过程的回调函数。事件触发时,表示异步任务完成,会将事件监听器函数封装成一条消息放在消息队列中,等待主线程执行。

事件的概念实际上并不是必须的,事件机制实际上就是异步过程的通知机制。

另外,所有的异步过程也都可以用事件来描述。例如:

setTimeout(func, 1000)
// 可以看成:
timer.addEventLister('timeout', 1000, func)

其中关于事件的详细描述,可以看这篇文章:事件绑定、事件监听、事件委托,这里不再深入介绍。

七、生产者与消费者

生产者和消费者问题是线程模型中的经典问题:生产者和消费者在同一时间段内共用同一个存储空间,生产者往存储空间中添加数据,消费者从存储空间中取走数据,当存储空间为空时,消费者阻塞,当存储空间满时,生产者阻塞。
xuehuayu.cn
从生产者与消费者的角度看,异步过程是这样的:

工作线程是生产者,主线程是消费者(只有一个消费者)。工作线程执行异步任务,执行完成后把对应的回调函数封装成一条消息放到消息队列中;主线程不断地从消息队列中取消息并执行,当消息队列空时主线程阻塞,直到消息队列再次非空。

那么异步的实现方式有哪些喃?

  • ES6之前:callback、eventloop、Promise

  • ES6:Generator

  • ES7:Async/Await