诺基亚⻉尔实验室和美国纽约大学、美国兰卡斯特大学管理学院合著的论文《 To Block or Not to Block: Accelerating Mobile Web Pages On-The-Fly Through JavaScript Classification 》设计了一个服务 - SlimWeb 通过识别并删除网页的⾮关键 JS 以优化性能。
ML 驱动的 JS 分类器
,以 90% 的准确率对 JS 元素进行分类;页面加载时间减少了 50%
,与最先进的解决方案( JSCleaner )相比减少了 30% 以上;用户体验提高 60%以上
,同时保持与原始页面 90%以上的相似度;SlimWeb 包含三大部分:
ML Classifier:
机器学习创建的 JS 分类器。服务爬取流⾏的⽹⻚,识别这些⻚⾯中使⽤的 JS 元素,然后使⽤分类器标记这些元素并将它们的类别存储在数据库中SlimWeb Service:
JS 标签服务。它会定期更新标签并与终端的浏览器插件同步。SlimWeb plugin:
浏览器插件,负责拦截⾮关键的 JS 元素。这些元素是根据从服务收到的标签。当⽤⼾请求⽹⻚时,插件⾸先检查每个 JS 元素是否在本地可⽤的标签,以便⽴即阻⽌⾮关键元素。在没有标签的情况下,插件认为相应的 JS 元素是关键的,并从 Web 请求它。 1
sanebow 2023-02-05 10:05:40 +08:00 via iPhone
主意不错,训练标签怎么打的
|
2
hanbing135 2023-02-05 13:41:38 +08:00
感觉思路很牛啊
|
3
Contextualist 2023-02-05 20:09:49 +08:00 1
@sanebow
本着对他们 ML 模型的好奇扫了一眼原文:模型的输入是应该是各个 <script src="..."> 元素里 src ,输出对应的功能类别(如广告、统计、社交)。训练数据集用的是 https://github.com/patrickhulce/third-party-web 整理的来自 https://httparchive.org/ 的标签 |