V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
iKcamp
V2EX  ›  前端开发

翻译 | 一行 JavaScript 代码的逆向工程

  •  
  •   iKcamp ·
    ikcamp · 2017-09-18 11:18:40 +08:00 · 1763 次点击
    这是一个创建于 2668 天前的主题,其中的信息可能已经有所发展或是发生改变。

    几个月前,我看到一个邮件问:有没有人可以解析这一行 JavaScript 代码

    <pre id=p><script>n=setInterval("for(n+=7,i=k,P='p.\\n';i-=1/k;P+=P[i%2?(i%2*j-j+n/k^j)&1:2])j=k/i;p.innerHTML=P",k=64)</script>
    

    这一行代码会被渲染成下图的效果。你可以在这里用浏览器打开来观看。这是 Mathieu ‘ p01 ’ Henri 写的,你还可以在作者的网站www.p01.org里看到更多很酷的例子。

    好的!我决定接受挑战

    第一步:让代码变得可读

    第一件事,让 HTML 文件里只有 HTML 代码,然后把 JavaScript 代码放到 code.js 文件里。我还用 id="p" 来包装 pre 标签。

    index.html

    <script src="code.js"></script>
    <pre id="p"></pre>
    

    我注意到变量 k 只是一个常量,所以把它移出来,然后重命名为 delay

    code.js

    var delay = 64;
    var draw = "for(n+=7,i=delay,P='p.\\n';i-=1/delay;P+=P[i%2?(i%2*j-j+n/delay^j)&1:2])j=delay/i;p.innerHTML=P";
    var n = setInterval(draw, delay);
    

    接下来,因为 setInterval 可以接收一个函数或者字符串来执行,字符串 var draw 会被 setInterval 用 eval 来解析并执行。所以我把它移到一个新建的函数体内。 然后保留旧的那行代码,以供参考。

    我注意到的另一个点,变量 p 指向了存在于 HTML 的 DOM 结构里 id 为 p 的标签,就是那个之前我包装过的 pre 标签。事实上,元素标签可以通过他们的 id 用 JavaScript 来获取,只要 id 仅由字母数字组成。这里,我通过 document.getElementById("p") 来让它更加直观。

    var delay = 64;
    var p = document.getElementById("p"); // < --------------
    // var draw = "for(n+=7,i=delay,P='p.\\n';i-=1/delay;P+=P[i%2?(i%2*j-j+n/delay^j)&1:2])j=delay/i;p.innerHTML=P";
    var draw = function() {
        for (n += 7, i = delay, P = 'p.\n'; i -= 1 / delay; P += P[i % 2 ? (i % 2 * j - j + n / delay ^ j) & 1 : 2]) {
            j = delay / i; p.innerHTML = P;
        }
    };
    var n = setInterval(draw, delay);
    

    下一步,我声明了变量 ipj,然后把他们放在函数的顶部。

    var delay = 64;
    var p = document.getElementById("p");
    // var draw = "for(n+=7,i=delay,P='p.\\n';i-=1/delay;P+=P[i%2?(i%2*j-j+n/delay^j)&1:2])j=delay/i;p.innerHTML=P";
    var draw = function() {
        var i = delay; // < ---------------
        var P ='p.\n';
        var j;
        for (n += 7; i > 0 ;P += P[i % 2 ? (i % 2 * j - j + n / delay ^ j) & 1 : 2]) {
            j = delay / i; p.innerHTML = P;
            i -= 1 / delay;
        }
    };
    var n = setInterval(draw, delay);
    

    我把 for 循环分解成 while 循环。只保留了 for 的 CHECK_EVERY_LOOP 部分( for 的三个部分分别是 RUNS_ONCE_ON_INIT; CHECK_EVERY_LOOP; DO_EVERY_LOOP ),然后分别把其他的代码移到循环的内外部。

    var delay = 64;
    var p = document.getElementById("p");
    // var draw = "for(n+=7,i=delay,P='p.\\n';i-=1/delay;P+=P[i%2?(i%2*j-j+n/delay^j)&1:2])j=delay/i;p.innerHTML=P";
    var draw = function() {
        var i = delay;
        var P ='p.\n';
        var j;
        n += 7;
        while (i > 0) { // <----------------------
            //Update HTML
            p.innerHTML = P;
    
            j = delay / i;
            i -= 1 / delay;
            P += P[i % 2 ? (i % 2 * j - j + n / delay ^ j) & 1 : 2];
        }
    };
    var n = setInterval(draw, delay);
    

    接着我将会展开 P += P[i % 2 ? (i % 2 * j - j + n / delay ^ j) & 1 : 2] 中的三元操作(判断条件 ? true 时运行 :false 时运行

    i % 2 是用来检测 i 是奇数还是偶数,如果 i 是偶数,则返回 2。如果是奇数,则返回 (i % 2 * j - j + n / delay ^ j) & 1 的计算结果(更多的是这种情况)。

    最终,这个返回值被当作索引,被用于获取字符串 P 的某个字符,因此它可以写成 P += P[index]

    var delay = 64;
    var p = document.getElementById("p");
    // var draw = "for(n+=7,i=delay,P='p.\\n';i-=1/delay;P+=P[i%2?(i%2*j-j+n/delay^j)&1:2])j=delay/i;p.innerHTML=P";
    var draw = function() {
        var i = delay;
        var P ='p.\n';
        var j;
        n += 7;
        while (i > 0) {
            //Update HTML
            p.innerHTML = P;
    
            j = delay / i;
            i -= 1 / delay;
    
            let index;
            let iIsOdd = (i % 2 != 0); // <---------------
    
            if (iIsOdd) { // <---------------
                index = (i % 2 * j - j + n / delay ^ j) & 1;
            } else {
                index = 2;
            }
    
            P += P[index];
        }
    };
    var n = setInterval(draw, delay);
    

    下一步,我会把 index = (i % 2 * j - j + n / delay ^ j) & 1 里的 & 1 分解到另外的 if 表达式里。

    这是一种聪明的方法来检测括号内的值是奇数还是偶数,如果是偶数则返回 0,反之返回 1.& 是与的位运算符。与的逻辑如下:

    • 1 & 1 = 1
    • 0 & 1 = 0

    因此 something & 1 则可以看成把“ something ”转化成二进制,接着在 1 的前面填充对应数量的 0,从而保持和 something 的长度一致,然后仅仅返回与运算的最后一位。例如,5 的二进制是 101。如果我们和 1 进行与运算,将会得到如下结果:

        101
    AND 001
        001
    

    或者说,5 是一个奇数,5 & 1 的结果是 1。用 JavaScript 的控制台很容易可以证明下面这个逻辑。

    0 & 1 // 0 - even return 0
    1 & 1 // 1 - odd return 1
    2 & 1 // 0 - even return 0
    3 & 1 // 1 - odd return 1
    4 & 1 // 0 - even return 0
    5 & 1 // 1 - odd return 1
    

    注意,我将上述 index 的剩余部分重命名为 magic。因此这些代码加上展开 & 1 后的代码看起来是下面这样的。

    var delay = 64;
    var p = document.getElementById("p");
    // var draw = "for(n+=7,i=delay,P='p.\\n';i-=1/delay;P+=P[i%2?(i%2*j-j+n/delay^j)&1:2])j=delay/i;p.innerHTML=P";
    var draw = function() {
        var i = delay;
        var P ='p.\n';
        var j;
        n += 7;
        while (i > 0) {
            //Update HTML
            p.innerHTML = P;
    
            j = delay / i;
            i -= 1 / delay;
    
            let index;
            let iIsOdd = (i % 2 != 0);
    
            if (iIsOdd) {
                let magic = (i % 2 * j - j + n / delay ^ j);
                let magicIsOdd = (magic % 2 != 0); // &1 < --------------------------
                if (magicIsOdd) { // &1 <--------------------------
                    index = 1;
                } else {
                    index = 0;
                }
            } else {
                index = 2;
            }
    
            P += P[index];
        }
    };
    var n = setInterval(draw, delay);
    

    接下来,我将会分解 P += P[index] 到一个 switch 表达式里。现在我们可以很清晰的知道 index 的值只可能为 0、1 和 2 中的一个。也可以知道 P 的初始化总是 var P ='p.\n',index 为 0 时指向 p,为 1 时指向 .,为 2 时指向 \n —— 新的一行字符串。

    var delay = 64;
    var p = document.getElementById("p");
    // var draw = "for(n+=7,i=delay,P='p.\\n';i-=1/delay;P+=P[i%2?(i%2*j-j+n/delay^j)&1:2])j=delay/i;p.innerHTML=P";
    var draw = function() {
        var i = delay;
        var P ='p.\n';
        var j;
        n += 7;
        while (i > 0) {
            //Update HTML
            p.innerHTML = P;
    
            j = delay / i;
            i -= 1 / delay;
    
            let index;
            let iIsOdd = (i % 2 != 0);
    
            if (iIsOdd) {
                let magic = (i % 2 * j - j + n / delay ^ j);
                let magicIsOdd = (magic % 2 != 0); // &1
                if (magicIsOdd) { // &1
                    index = 1;
                } else {
                    index = 0;
                }
            } else {
                index = 2;
            }
    
            switch (index) { // P += P[index]; <-----------------------
                case 0:
                    P += "p"; // aka P[0]
                    break;
                case 1:
                    P += "."; // aka P[1]
                    break;
                case 2:
                    P += "\n"; // aka P[2]
            }
        }
    };
    
    var n = setInterval(draw, delay);
    

    我将简化 var n = setInterval(draw, delay)setInterval 会返回一个从 1 开始的整数,并且每次执行完 setInterval 之后返回值都会递增。这个整数可以在 clearInterval 方法里面用到(用来取消定时器)。在我们的代码里, setInterval 仅仅只会执行一次,所以 n 可以简单的设置为 1.

    我还把 delay 重命名为 DELAY 让它看起来是一个常量。

    最后但并非不重要的一点,我用括号把 i % 2 * j - j + n / DELAY 包起来,指明 ^ 异或运算的执行优先度低于 %,*,-,+/操作。或者说,所有的运算操作都会比 ^ 先执行。包装后的代码应该是这样的 ((i % 2 * j - j + n / DELAY) ^ j)

    
    // 之前我把 `p.innerHTML = P;` 放错地方了,更新后,把它移出了 while 循环
    
    const DELAY = 64; // approximately 15 frames per second 15 frames per second * 64 seconds = 960 frames
    var n = 1;
    var p = document.getElementById("p");
    // var draw = "for(n+=7,i=delay,P='p.\\n';i-=1/delay;P+=P[i%2?(i%2*j-j+n/delay^j)&1:2])j=delay/i;p.innerHTML=P";
    
    /**
     * Draws a picture
     * 128 chars by 32 chars = total 4096 chars
     */
    var draw = function() {
        var i = DELAY; // 64
        var P ='p.\n'; // First line, reference for chars to use
        var j;
    
        n += 7;
    
        while (i > 0) {
    
            j = DELAY / i;
            i -= 1 / DELAY;
    
            let index;
            let iIsOdd = (i % 2 != 0);
    
            if (iIsOdd) {
                let magic = ((i % 2 * j - j + n / DELAY) ^ j); // < ------------------
                let magicIsOdd = (magic % 2 != 0); // &1
                if (magicIsOdd) { // &1
                    index = 1;
                } else {
                    index = 0;
                }
            } else {
                index = 2;
            }
    
            switch (index) { // P += P[index];
                case 0:
                    P += "p"; // aka P[0]
                    break;
                case 1:
                    P += "."; // aka P[1]
                    break;
                case 2:
                    P += "\n"; // aka P[2]
            }
        }
        //Update HTML
        p.innerHTML = P;
    };
    
    setInterval(draw, 64);
    

    你可以在这里看到最后的结果。

    第二步:理解代码

    这部分将会介绍什么内容呢?不要心急,让我们一步一步来解析。

    i 通过 var i = DELAY,被初始化为 64,然后每次循环递减 1/64,等于 0.015625 ( i -= 1 / DELAY )。循环持续到 i 小于 0 时(while (i > 0) {)。每次执行循环,i 将会减少 1/64,所以每执行 64 次循环,i 就会减 1 ( 64 / 64 = 1 ),总得来说, i 需要执行 64 x 64 = 4096 次,之后小于 0.

    之前的图片中,一共有 32 行,每行包含了 128 个字符。恰巧的是 64 x 64 = 32 x 128 = 4096。我们触发 32 次 i 为严谨的偶数的情况,i 是绝对的偶数时,i 才为偶数(非奇数 let iIsOdd = (i % 2 != 0); 译者提示:偶数是整数,所以 2.2 是奇数),例如 i 为 64,62,60 等。在这 32 次里,index 通过 index = 2 赋值为 2,意味着字符串将添加 P += "\n"; // aka P[2] 从而换行,开始一行新的字符串。剩余的 127 个字符则都是 p.

    那么我们根据什么来判断何时用 p 或者 . ?

    当然,之前我们就已经知道了,当 let magic = ((i % 2 * j - j + n / DELAY) ^ j) 中的 magic 是奇数的时候用 . ,如果是偶数则用 p

    var P ='p.\n';
    
    ...
    
    if (magicIsOdd) { // &1
        index = 1; // second char in P - .
    } else {
        index = 0; // first char in P - p
    }
    

    但我们很难知道 magic 是奇数还是偶数,这是一个很有分量的问题。在此之前,让我们证实一些事情。

    如果我们把 + n/DELAYlet magic = ((i % 2 * j - j + n / DELAY) ^ j) 当中移除掉,我们最终将会看到一个静态的布局,如下图

    现在,让我们来看看移除了 + n/DELAYmagic。如何能得到上面漂亮的图片。

    (i % 2 * j - j) ^ j

    注意到每次循环里,我们都会执行:

    j = DELAY / i;
    i -= 1 / DELAY;
    

    换句话说,我们可以将上述表达式中的 ji 表示,变成 j = DELAY/ (i + 1/DELAY),但因为 1/DELAY 是一个非常小的数值,所以我们暂时去掉 + 1/DELAY 并简化成 j = DELAY/i = 64/i

    // 译者注

    为何这里不是 j = DELAY/ (i - 1/DELAY)呢?

    原因:

    i -= 1 / DELAY 转化成 i = i - 1 / DELAY

    这里有 2 个 i 可以代入消元,但是因为 j 的表达式在 i 前面,所以 j 取得 i 应 该是自减前的 i,故 i = i + 1/ DELAY

    因此我们可以重写 (i % 2 * j - j) ^ j(i % 2 * 64/i - 64/i) ^ 64/i

    让我们用在线的图形计算器来绘制那些函数

    首先,我们来绘制下 i%2 的图

    从下面的图形可以看出,y 的值区间在 0 到 2 之间。

    如果我们绘制 64 / i 则会得到如下图形

    如果我们绘制 (i % 2 * 64/i - 64/i) 表达式,我们将得到一个混合了上面两张图的一个图形,如下

    最后,如果我们把 2 个函数同时绘制出来,将会是如下的图(红线为 j 的关系图)

    我们能从图形里知道些什么?

    让我们回忆下我们要去解答的问题:如何得到如下静止图像:

    好的,我们知道如果 (i % 2 * j - j) ^ j 的值是一个偶数,那么我们将添加 p,如果是一个奇数则添加 .

    让我们专注在图形的前面 16 行,i 的值在 64 到 32 之间。

    异或运算在 JavaScript 里会把小数点右边的值忽略掉,所以它看起来和执行 Math.floor 的效果一样。

    其实当 2 个对比位都是 1 或者 0 的时候, 异或操作会返回 0。

    这里我们的 j 初始值为 1,且慢慢的递增趋向于 2,但始终小于 2,所以我们可以把它当成 1 来处理(Math.floor(1.9999) === 1),为了得到结果为 0 (意味着是偶数),我们还需要异或表达式的左边也是 1,使得返回一个 p 给我们。

    换句话说,每条藏青色的倾斜线都相当于我们图像中的一行,因为前面 16 行的 j 值总是介于 1 和 2 之间,而唯一能得到奇数值的方法是让 (i % 2 * j - j) ^ j(也可以说i % 2 * i/64 - i/64 或者藏青色的倾斜线)大于 1 或小于 -1。

    为了将这个地方讲清楚,这里有一些 Javascript 控制台的输出,0 或者 -2 意味着结果是偶数,1 则是奇数。

    1 ^ 1 // 0 - even p
    1.1 ^ 1.1 // 0 - even p
    0.9 ^ 1 // 1 - odd .
    0 ^ 1 // 1 - odd .
    -1 ^ 1 // -2 - even p
    -1.1 ^ 1.1 // -2 - even p
    

    如果我们观察下我们的图形,可以看出原点右边的斜线大部分都是大于 1 或者小于 -1 (几乎没有偶数,或者说几乎没有 p ),且越靠后(靠近原点)越如此。第 16 行几乎介于 2 和 -2 之间。第 16 行之后,我们可以看到图形是另外一种模式。

    16 行之后 j 超过了 2,使得结果发生了变化。现在当藏青色的斜线大于 2,小于 -2,或者在 1 和-1 之间且不等于的时候,我们将会得到一个偶数。这也是为什么在 17 行之后我们会在一行内看到两组和两组以上的 p

    如果你仔细看动图的最底部几行,你会发现这几行不符合上面的规则,图表曲线看起来起伏非常大。

    现在让我们把 + n/DELAY 加回来。在代码里我们可以看到 n 的初始值是 8 (初始是 1,但是每次定时器被调用时就加 7 ),它会在每次执行定时器时增加 7。

    n 变成 64,图形会变成如下样子。

    可以注意到,j 总是 ~1 (这里的 ~ 是近似的意思),但是现在红斜线的左半边位于 62-63 区间的值无限趋近于 0,红斜线的右半边位于 63-64 则无限趋近与 1。因为我们的字符按 64 到 62 的顺序排列,那么我们可以猜测斜线的 63-64 部分( 1^1=0 是偶数)添加的是一段 p,左边 62-63 部分( 1^0=1 是奇数)添加的是一段 .。就像普通的英语单词一样,从左到右的添加上。

    用 HTML 渲染出来的话,将会看到下图(你可以自己在 codepen 改变 n 来观看效果)。这和我们的预期一致。

    这一时刻 p 的数量已经增长了一定的数量。例如第一行里面就有一半的值是偶数,从现在起,一大段的ps 将移动他们的位置。

    为了说明这一点,我们可以看到当 n 在下一个定时器里增加了 7 时,图形就会有稍微的变化

    注意,第一行的斜线(在 64 附近)已经稍微移动了 1 小格,假设 4 个方格代表 128 个字符,1 个方格 相当于 32 个字符,那么 1 个小格则相当于 32/5=6.4 个字符(大约)。正如下图所示,我们可以看到第一行实际上向右移动了 7 个字符。

    最后一个例子。就是当定时器被调用超过 7 次时( n 等于 64+9x7 )会发生什么。

    对于第一行,j 还等于 1。现在红斜线的上部分在 64 左右的值趋向于 2,下部分趋向于 1。这个图片将会翻转,因为现在 1^2 = 3 是奇数-输出.1^1 = 0 是偶数- 输出 p。所以我们预期在一大段 p 之后会是一大段 .

    他会这么渲染。

    自此,图形将会以这种形式无限循环下去。

    我希望我解释清楚了。我不认为自己有能力写出这样的代码,但是我很享受理解它的过程。

    iKcamp 原创新书《移动 Web 前端高效开发实战》已在亚马逊、京东、当当开售。

    沪江 Web 前端上海团队招聘 [ Web 前端架构师] ,有意者简历至: [email protected]

    目前尚无回复
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   1085 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 26ms · UTC 19:08 · PVG 03:08 · LAX 11:08 · JFK 14:08
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.