图解 Javascript 上下文与作用域

2015-07-05 23:24:59 +08:00
 irainy

>> 原文 <<

本文尝试阐述Javascript中的上下文与作用域背后的机制,主要涉及到执行上下文(execution context)、作用域链(scope chain)、闭包(closure)、this等概念。

Execution context

执行上下文(简称上下文)决定了Js执行过程中可以获取哪些变量、函数、数据,一段程序可能被分割成许多不同的上下文,每一个上下文都会绑定一个变量对象(variable object),它就像一个容器,用来存储当前上下文中所有已定义或可获取的变量、函数等。位于最顶端或最外层的上下文称为全局上下文(global context),全局上下文取决于执行环境,如Node中的global和Browser中的window

需要注意的是,上下文与作用域(scope)是不同的概念。Js本身是单进程的,每当有function被执行时,就会产生一个新的上下文,这一上下文会被压入Js的上下文堆栈(context stack)中,function执行结束后则被弹出,因此Js解释器总是在栈顶上下文中执行。在生成新的上下文时,首先会绑定该上下文的变量对象,其中包括arguments和该函数中定义的变量;之后会创建属于该上下文的作用域链(scope chain),最后将this赋予这一function所属的Object,这一过程可以通过下图表示:

this

上文提到this被赋予function所属的Object,具体来说,当function是定义在global对中时,this指向global;当function作为Object的方法时,this指向该Object:

var x = 1;
var f = function(){
  console.log(this.x);
}
f();  // -> 1

var ff = function(){
  this.x = 2;
  console.log(this.x);
}
ff(); // -> 2
x     // -> 2

var o = {x: "o's x", f: f};
o.f(); // "o's x"

Scope chain

上文提到,在function被执行时生成新的上下文时会先绑定当前上下文的变量对象,再创建作用域链。我们知道function的定义是可以嵌套在其他function所创建的上下文中,也可以并列地定义在同一个上下文中(如global)。作用域链实际上就是自下而上地将所有嵌套定义的上下文所绑定的变量对象串接到一起,使嵌套的function可以“继承”上层上下文的变量,而并列的function之间互不干扰:

var x = 'global';
function a(){
  var x = "a's x";
  function b(){
    var y = "b's y";
    console.log(x);
  };
  b();
}
function c(){
  var x = "c's x";
  function d(){
    console.log(y);
  };
  d();
}
a();  // -> "a's x"
c();  // -> ReferenceError: y is not defined
x     // -> "global"
y     // -> ReferenceError: y is not defined

Closure

如果理解了上文中提到的上下文与作用域链的机制,再来看闭包的概念就很清楚了。每个function在调用时会创建新的上下文及作用域链,而作用域链就是将外层(上层)上下文所绑定的变量对象逐一串连起来,使当前function可以获取外层上下文的变量、数据等。如果我们在function中定义新的function,同时将内层function作为值返回,那么内层function所包含的作用域链将会一起返回,即使内层function在其他上下文中执行,其内部的作用域链仍然保持着原有的数据,而当前的上下文可能无法获取原先外层function中的数据,使得function内部的作用域链被保护起来,从而形成“闭包”。看下面的例子:

var x = 100;
var inc = function(){
  var x = 0;
  return function(){
    console.log(x++);
  };
};

var inc1 = inc();
var inc2 = inc();

inc1();  // -> 0
inc1();  // -> 1
inc2();  // -> 0
inc1();  // -> 2
inc2();  // -> 1
x;       // -> 100

执行过程如下图所示,inc内部返回的匿名function在创建时生成的作用域链包括了inc中的x,即使后来赋值给inc1inc2之后,直接在global context下调用,它们的作用域链仍然是由定义中所处的上下文环境决定,而且由于x是在function inc中定义的,无法被外层的global context所改变,从而实现了闭包的效果:

this in closure

我们已经反复提到执行上下文和作用域实际上是通过function创建、分割的,而function中的this与作用域链不同,它是由执行该function时当前所处的Object环境所决定的,这也是this最容易被混淆用错的一点。一般情况下的例子如下:

var name = "global";
var o = {
  name: "o",
  getName: function(){
    return this.name
  }
};
o.getName();  // -> "o"

由于执行o.getName()getName所绑定的this是调用它的o,所以此时this == o;更容易搞混的是在closure条件下:

var name = "global";
var oo = {
  name: "oo",
  getNameFunc: function(){
    return function(){
      return this.name;
    };
  }
}
oo.getNameFunc()();  // -> "global"

此时闭包函数被return后调用相当于:

getName = oo.getNameFunc();
getName();  // -> "global"

换一个更明显的例子:

var ooo = {
  name: "ooo",
  getName: oo.getNameFunc() // 此时闭包函数的this被绑定到新的Object
};
ooo.getName();  // -> "ooo"

当然,有时候为了避免闭包中的this在执行时被替换,可以采取下面的方法:

var name = "global";
var oooo = {
  name: "ox4",
  getNameFunc: function(){
    var self = this;
    return function(){
       return self.name;
    };
  }
};
oooo.getNameFunc()(); // -> "ox4"

或者是在调用时强行定义执行的Object:

var name = "global";
var oo = {
  name: "oo",
  getNameFunc: function(){
    return function(){
      return this.name;
    };
  }
}
oo.getNameFunc()();  // -> "global"
oo.getNameFunc().bind(oo)(); // -> "oo"

总结

Js是一门很有趣的语言,由于它的很多特性是针对HTML中DOM的操作,因而显得随意而略失严谨,但随着前端的不断繁荣发展和Node的兴起,Js已经不再是"toy language"或是jQuery时代的"CSS扩展",本文提到的这些概念无论是对新手还是从传统Web开发中过度过来的Js开发人员来说,都很容易被混淆或误解,希望本文可以有所帮助。

写这篇总结的原因是我在Github上分享的Learn javascript in one picture,刚开始有人质疑这只能算是一张语法表(syntax cheat sheet),根本不会涉及更深层的闭包、作用域等内容,但是出乎意料的是这个项目竟然获得3000多个star,所以不能虎头蛇尾,以上。

References

  1. Understanding Scope and Context in JavaScript
  2. this - JavaScript | MDN
  3. 闭包 - JavaScript | MDN
2694 次点击
所在节点    JavaScript
9 条回复
lsmgeb89
2015-07-05 23:39:46 +08:00
Mark,以前看虚拟机代码的时候,这些其实也看不太明白。
limbo0
2015-07-05 23:51:03 +08:00
发现javascript的作用域和上下文与python是一样的,总结的挺好
an168bang521
2015-07-06 00:13:12 +08:00
额,先顶一下!!我好像没有太划分上下文和作用域(上下文这个词也蛮坑的,我一直不理解为啥这么翻译过来);;我理解的是;在JavaScript中,顶级作用域是Global的代理人window;这个是浏览器的顶级;里面的js代码;在预解释阶段。带var 和function的;var是先声明;function是开辟一个堆内存把function内的代码以字符串的方式储存起来,并且函数储存的是这个堆内存的内存地址(相当于引用一个内存地址;如果很多变量ABCD同时引用一个内存地址,只要其中任意一个变量修改了内存里面的内容,其它所有变量都会变的,因为函数是属于引用数据类型,储存的不是值而是内存地址);预解释阶段过后,就是JS代码从上到下执行阶段;在执行的时候;如果遇到function的代码块会直接跳过;遇到函数执行的代码;会直接调用引用堆内存的地址;这个时候会重新开辟一个栈内存;这个栈内存还会再次进行预解释;套路和上面一样,(如果函数执行的这个小栈内存中需要用到某个变量,首先会看有没有声明和定义过,如果没有,则会到他的上一级作用域查找,一直查到window下); 如果函数执行中return一个函数,并且这个小栈内存外面有变量接受;那么这个栈内存是没办法销毁的;如果没有变量接受,小的栈内存会在浏览器空闲的时候销毁;;;;我的拙见,请鞭策。
an168bang521
2015-07-06 00:16:33 +08:00
补充一句: 如果函数执行中return一个函数或值,只要返回值外面有东西接收;作用域都没办法销毁;还有就是函数的执行位置和函数定义位置没有关系;
LancerComet
2015-07-06 00:35:22 +08:00
“循环 + 立即执行匿名函数 + 计时器” 这样的搭配已经成考验本文知识的经典测试类型了

PS:ES6 中的 let 能缓解这个坑
irainy
2015-07-06 00:37:52 +08:00
@an168bang521 看得有点晕。。我没有研究过Js引擎的实现,也许 @lsmgeb89 可以帮上忙,但是看你的描述感觉你关注的更多是GC的问题。关于上下文和作用域的划分,执行上下文可以粗暴的分为global和function两种,在具体的function中的,执行上下文就是包含当前可调用的所有合法的identifier的容器,这个容器由三部分组成,arguments+this、当前function定义的变量以及scope chain中所能查询到的合法identifier。这些其实并不难区分,最容易混淆的应该是决定this的(也有叫context的,我都不知道该怎么形容它了。。)。
coolicer
2015-07-06 09:59:45 +08:00
手工加精
br00k
2015-07-06 10:12:42 +08:00
学习了。已star。
mingyun
2015-07-12 20:39:24 +08:00
star+ 微信捐赠

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/203548

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX