V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
Micropaper
V2EX  ›  程序员

一分钟读论文:《通过 JS 分类即时加速移动网页》

  •  
  •   Micropaper ·
    unbug · 2023-02-05 09:18:27 +08:00 · 1484 次点击
    这是一个创建于 439 天前的主题,其中的信息可能已经有所发展或是发生改变。

    诺基亚⻉尔实验室和美国纽约大学、美国兰卡斯特大学管理学院合著的论文《 To Block or Not to Block: Accelerating Mobile Web Pages On-The-Fly Through JavaScript Classification 》设计了一个服务 - SlimWeb 通过识别并删除网页的⾮关键 JS 以优化性能。

    • ML 驱动的 JS 分类器,以 90% 的准确率对 JS 元素进行分类;
    • 一个易于安装的浏览器插件,为移动用户提供较轻版本的网页;
    • 与原始页面相比,页面加载时间减少了 50%,与最先进的解决方案( JSCleaner )相比减少了 30% 以上;
    • 用户体验提高 60%以上,同时保持与原始页面 90%以上的相似度;

    SlimWeb 包含三大部分:

    • ML Classifier:机器学习创建的 JS 分类器。服务爬取流⾏的⽹⻚,识别这些⻚⾯中使⽤的 JS 元素,然后使⽤分类器标记这些元素并将它们的类别存储在数据库中
    • SlimWeb Service:JS 标签服务。它会定期更新标签并与终端的浏览器插件同步。
    • SlimWeb plugin: 浏览器插件,负责拦截⾮关键的 JS 元素。这些元素是根据从服务收到的标签。当⽤⼾请求⽹⻚时,插件⾸先检查每个 JS 元素是否在本地可⽤的标签,以便⽴即阻⽌⾮关键元素。在没有标签的情况下,插件认为相应的 JS 元素是关键的,并从 Web 请求它。

    阅读全文:一分钟读论文:《通过 JS 分类即时加速移动网页》

    3 条回复    2023-02-05 20:09:49 +08:00
    sanebow
        1
    sanebow  
       2023-02-05 10:05:40 +08:00 via iPhone
    主意不错,训练标签怎么打的
    hanbing135
        2
    hanbing135  
       2023-02-05 13:41:38 +08:00
    感觉思路很牛啊
    Contextualist
        3
    Contextualist  
       2023-02-05 20:09:49 +08:00   ❤️ 1
    @sanebow
    本着对他们 ML 模型的好奇扫了一眼原文:模型的输入是应该是各个 <script src="..."> 元素里 src ,输出对应的功能类别(如广告、统计、社交)。训练数据集用的是 https://github.com/patrickhulce/third-party-web 整理的来自 https://httparchive.org/ 的标签
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   我们的愿景   ·   实用小工具   ·   910 人在线   最高记录 6543   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 25ms · UTC 21:07 · PVG 05:07 · LAX 14:07 · JFK 17:07
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.