• 请不要在回答技术问题时复制粘贴 AI 生成的内容
Micropaper
V2EX  ›  程序员

一分钟读论文:《通过 JS 分类即时加速移动网页》

  •  
  •   Micropaper ·
    unbug · Feb 5, 2023 · 2114 views
    This topic created in 1194 days ago, the information mentioned may be changed or developed.

    诺基亚⻉尔实验室和美国纽约大学、美国兰卡斯特大学管理学院合著的论文《 To Block or Not to Block: Accelerating Mobile Web Pages On-The-Fly Through JavaScript Classification 》设计了一个服务 - SlimWeb 通过识别并删除网页的⾮关键 JS 以优化性能。

    • ML 驱动的 JS 分类器,以 90% 的准确率对 JS 元素进行分类;
    • 一个易于安装的浏览器插件,为移动用户提供较轻版本的网页;
    • 与原始页面相比,页面加载时间减少了 50%,与最先进的解决方案( JSCleaner )相比减少了 30% 以上;
    • 用户体验提高 60%以上,同时保持与原始页面 90%以上的相似度;

    SlimWeb 包含三大部分:

    • ML Classifier:机器学习创建的 JS 分类器。服务爬取流⾏的⽹⻚,识别这些⻚⾯中使⽤的 JS 元素,然后使⽤分类器标记这些元素并将它们的类别存储在数据库中
    • SlimWeb Service:JS 标签服务。它会定期更新标签并与终端的浏览器插件同步。
    • SlimWeb plugin: 浏览器插件,负责拦截⾮关键的 JS 元素。这些元素是根据从服务收到的标签。当⽤⼾请求⽹⻚时,插件⾸先检查每个 JS 元素是否在本地可⽤的标签,以便⽴即阻⽌⾮关键元素。在没有标签的情况下,插件认为相应的 JS 元素是关键的,并从 Web 请求它。

    阅读全文:一分钟读论文:《通过 JS 分类即时加速移动网页》

    3 replies    2023-02-05 20:09:49 +08:00
    sanebow
        1
    sanebow  
       Feb 5, 2023 via iPhone
    主意不错,训练标签怎么打的
    hanbing135
        2
    hanbing135  
       Feb 5, 2023
    感觉思路很牛啊
    Contextualist
        3
    Contextualist  
       Feb 5, 2023   ❤️ 1
    @sanebow
    本着对他们 ML 模型的好奇扫了一眼原文:模型的输入是应该是各个 <script src="..."> 元素里 src ,输出对应的功能类别(如广告、统计、社交)。训练数据集用的是 https://github.com/patrickhulce/third-party-web 整理的来自 https://httparchive.org/ 的标签
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   945 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 190ms · UTC 20:07 · PVG 04:07 · LAX 13:07 · JFK 16:07
    ♥ Do have faith in what you're doing.