ShowMeBug 中如何科学的识别用户浏览器?

2021-08-19 18:31:08 +08:00
 ShowMeBug2020

经常有用户在 ShowMeBug 在线面试过程中,使用一些奇怪的浏览器来打开链接进行视频面试,然后出现一些音视频卡顿等问题。

多次排查后发现产品的音视频功能一但使用了浏览器的 WebRTC 特性,就会对浏览器的要求特别高,如不在正常的浏览器支持范围内,就容易出现问题。所以我们在检测这个问题时,通常有两种方法识别出浏览器的型号和版本。

第一种方法:使用 modernizr 来进行 feature detection, 通过探测这些 API 是否存在,来判读是否可以使用 WebRTC,毕竟 WebRTC 是有浏览器 API 组成。

不过,这种方法不够严谨,WebRTC 是一项很新的技术,今年 1 月份才正式成为官方标准,但目前只支持部份浏览器,稳定性也还需要进一步加强。

The World Wide Web Consortium (W3C) and the Internet Engineering Task Force (IETF) announced today that Web Real-Time Communications (WebRTC), which powers myriad services, is now an official standard, bringing audio and video communications anywhere on the Web.

今年 1 月,W3C 和 IETF 宣布,为无数服务提供支持的 WebRTC 现已成为官方标准。

———— 2021.01.26

网络实时通信 (WebRTC) 改变了通信格局;成为万维网联盟 (W3C) 建议书和多个互联网工程任务组 (IETF) 标准

显然,feature detection 不符合我们的应用场景,目前不满足我们的需求,所以此方法 pass 。

第二种方法,也是我们目前采用的,业内比较通用的办法就是检测 User-Agent 。

curl http://202.38.95.46:12001/ -H "User-Agent: Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) HEICORE/49.1.2623.213 Safari/537.36"

User-Agent 是什么

用户不能直接去互联网上获取信息,需要一个软件作为载体去代表用户的行为,这个软件就是 User-Agent (用户代理),浏览器就是一种典型的 User-Agent 。

用户使用不同的软件去用统一的协议去做相同的事情。这也是定义在 http 请求里的,每一条 http 请求一定会携带 User-Agent 头 。

网站的服务者可以通过 User-Agent 头来判断用户使用了什么浏览器,当然也可以根据 User-Agent 的内容来提供差异化的服务。

标准语法和历史

原本 User-Agent 浏览器的语法是很清晰的

User-Agent: <product> / <product-version> <comment>

User-Agent - HTTP | MDN

因为可以根据 User-Agent 的内容来提供差异化的服务,所以当年在浏览器大战时期,浏览器的实现各不相同。当年 Mozilla ( Firefox 的前身)浏览器最强的,很多网站都只对 Mozilla 提供高质量的服务,后来有人把自己伪装成了 Mozilla (没错,就是 IE 先开始的)。从此 Mozilla/5.0 就变成了 User-Agent 的第一段。

History of the browser user-agent string

后来的浏览就在这上面不断扩充,就像今天这样:

Linux / Firefox

Mozilla/5.0 (X11; Linux x86_64; rv:89.0) Gecko/20100101 Firefox/89.0

Mac OS / Safari

Mozilla/5.0 (Macintosh; Intel Mac OS X 11_3) AppleWebKit/605.1.15 (KHTML, like Gecko) Version/14.1 Safari/605.1.15

Chromium OS / Chrome

Mozilla/5.0 (X11; CrOS x86_64 13904.16.0) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/91.0.4472.25 Safari/537.36

Windows / Edge

Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/92.0.4482.0 Safari/537.36 Edg/92.0.874.0

这就变成了去识别 User-Agent 变得很困难,目前的识别基本上都是使用正则表达式,配合自己的 User-Agent 库来判断。

这方面的库有很多,对比很多后,这个库是比较全的 ua-parser-js

目前几乎所有的网站识别浏览器都是 User-Agent 来判断,有两个接口:

前端有浏览器接口:

window.navigator.userAgent

后端可以通过浏览器的 http request header 来拿到 User-Agent

user-agent: Mozilla/5.0 (Macintosh; Intel Mac OS X 10_15_7) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/92.0.4515.107 Safari/537.36

如何使用 User-Agent

在移动端因为算力的问题,在有些老旧的处理器上也会出现卡顿的情况,不过,我们可以在浏览器里跑一下 Benchmark 来判断算力是否够用,移动端的 User-Agent 会携带处理器信息(可以去查数据库来判断)

所以说,目前所进行的操作是:检测用户浏览器 ——> 给予提示,并在文档页显示支持性列表

最后,要通过定义的规则生成这样一个表格:

为了降低未来的维护成本要使用一套数据源,既可以检测,又可以在文档页生成列表

ua-parser-js 的返回结果的数据结构比较科学,直接复用这一数据结构

interface Result {
  ua: string;
  browser: {
    name: string | undefined;
    version: string | undefined;
  };
  device: {
    model: string | undefined;
    type: string | undefined;
    vendor: string | undefined;
  };
  engine: {
    name: string | undefined;
    version: string | undefined;
  };
  os: {
    name: string | undefined;
    version: string | undefined;
  };
  cpu: {
    architecture: string | undefined;
  };
}

这样我们可以定义三条规则:

// 存在优先级关系: daily_list > white_list > black_list
//
// https://www.npmjs.com/package/ua-parser-js
// @params: ua-parser-js.result
// @params: { <list_name>: <whiteList | blackList>}
// @return: string(list_name)
function browserDetect(ua, list) {
  const { daily_list, white_list, black_list } = list
  if (checkList(ua, daily_list)) return 'daily_list'
  if (checkList(ua, white_list)) return 'white_list'
  if (checkList(ua, black_list)) return 'black_list'
  return ''
}

基于这种数据结构,加入一种简单的语法。支持版本号判断,加入这个几种符号的支持:>, , =, <,

由于没有现成可以用的,所以要自己写一段判断

compare-versions

这样的话配置文件就可以这样写:config/browser.yml

# https://www.npmjs.com/package/ua-parser-js
#
# 本文件的语法是在这个库之上做的修改

# 白名单,完全没有问题的版本
white_list:
  - browser:
      name: "Chrome"
      version: ">= 85.0.0.0"
  - browser:
      name: "Firefox"
      version: ">= 85.0.0.0"
  - browser:
      name: "Edge"
      version: ">= 45.0.0.0"
    device:
      type: "mobile"
    os:
      name: "Android"
      version: ">= 10.0"

black_list:
  # 老版本的 Edge 不支持
  - browser:
      name: "Edge"
      version: "< 80.0.0.0"
    os:
      name: "Windows"

  # 手机微信内置浏览器
  - browser:
      name: "WeChat"
    device:
      type: "mobile"

使用我们产品的用户,上至自己编译浏览器自己用的极客,下至用微信内置浏览器的小白, 所以要在 beta 版、dev 版、canary 开发版、nightly 版等各种版本中给予提示,检测 WebRTC 不稳定,就可能会有问题。

曾经有人用了开发版的浏览器,面试中出现音视频不稳定,直到他更新了的版本之后才恢复正常。

由于开发版浏览器并不会在 ua 里面携带 dev 的标识,只能通过版本号来判断。可以使用 caniuse-lite 的数据库,取出最新稳定版的的版本号,然后进行版本号比对。

但是 caniuse-lite 的数据库有 1.3M 如果直接使用,会打包整个数据库。这个体积的增加了太多,需要优化一下,所以采用把查询结果打包成文件的办法,实际上真正有用的数据非常的少。

创建一个生成器,可以动态创建这个文件 latest_browser_list_generator.js

#!/usr/bin/env node

const browserslist = require('browserslist')
const fs = require('fs')

const list = {
  'firefox': true,
  'chrome': true,
  'edge': true,
}

const latest = browserslist("last 1 version").filter(i => list[i.split(' ')[0]])
fs.writeFileSync('latest_browser_list.js', `export default ${JSON.stringify(latest)}`)

之后定期执行这两个就可以了

当然,这个可以用 GitHub action 或 GitLab CI 来每周执行一次

除此之外,360 浏览器的检测方法

360 浏览器隐藏了自己的 UA 。360 浏览器只有在访问自己的网站(比如:360.cn)是才会在 UA 里携带 QIHU 360SE ( 360 安全浏览器)或 QIHU 360EE ( 360 极速浏览器)字段

360 安全浏览器和 360 极速浏览器的判断 - V2EX

对待国内浏览器(这个可以检测到 360 )

GitHub - mumuy/browser: Useragent analysis tool.浏览器分析判断工具 - 用户代理、操作系统信息

不过这个库的作者并没有提供可以直接使用包,只能把核心代码提取出来。

  // https://github.com/mumuy/browser/blob/4a50ee18cc76a5013dea3596bb33fbab9ed584c3/Browser.js#L111-L143
  if (_window.chrome) {
    let chrome_version = u.replace(/^.*Chrome\/([\d]+).*$/, '$1')
    if (_window.chrome.adblock2345 || _window.chrome.common2345) {
      match['2345Explorer'] = true
    } else if (
      _mime('type', 'application/360softmgrplugin') ||
      _mime('type', 'application/mozilla-npqihooquicklogin')
    ) {
      is360 = true
    } else if (chrome_version > 36 && _window.showModalDialog) {
      is360 = true
    } else if (chrome_version > 45) {
      is360 = _mime('type', 'application/vnd.chromium.remoting-viewer')
      if (!is360 && chrome_version >= 69) {
        is360 = _mime('type', 'application/hwepass2001.installepass2001') || _mime('type', 'application/asx')
      }
    }
  }

  // 修正
  if (match['Mobile']) {
    match['Mobile'] = !(u.indexOf('iPad') > -1)
  } else if (is360) {
    if (_mime('type', 'application/gameplugin')) {
      match['360SE'] = true
    } else if (
      _navigator &&
      typeof _navigator['connection'] !== 'undefined' &&
      typeof _navigator['connection']['saveData'] == 'undefined'
    ) {
      match['360SE'] = true
    } else {
      match['360EE'] = true
    }
  }

不过这里要注意:navigator.mimeTypes 已经从 Web 标准中移除(也许未来的某天这个方法就没法用了)

Navigator.mimeTypes - Web APIs | MDN

判断 360 的版本,是做了一个版本的对应关系

// https://github.com/mumuy/browser/blob/4a50ee18cc76a5013dea3596bb33fbab9ed584c3/Browser.js#L283-L292
function get360SEVersion(u) {
  let hash = { '86': '13.0', '78': '12.0', '69': '11.0', '63': '10.0', '55': '9.1', '45': '8.1', '42': '8.0', '31': '7.0', '21': '6.3' }
  let chrome_version = u.replace(/^.*Chrome\/([\d]+).*$/, '$1')
  return hash[chrome_version] || ''
}
function get360EEVersion(u) {
  let hash = { '86': '13.0', '78': '12.0', '69': '11.0', '63': '9.5', '55': '9.0', '50': '8.7', '30': '7.5' }
  let chrome_version = u.replace(/^.*Chrome\/([\d]+).*$/, '$1')
  return hash[chrome_version] || ''
}

最后

虽然我们分享了如何科学识别检测用户浏览器的方法,但是为了网络环境的健康,为了不重蹈浏览器大战时的覆辙,呼吁大家不要针对特定浏览器提供差异化内容。

作者:新一

999 次点击
所在节点    分享发现
3 条回复
awing
2021-08-19 23:15:45 +08:00
我来打破 0 回复 /dog
DoctorCat
2021-08-20 10:25:21 +08:00
waste my time
anouser
2021-08-22 00:53:51 +08:00
实际上还是做 feature detection 比较好。
user agent 的话,各种套壳的浏览器,以后你还要更新维护。不如直接把你用到的 API,放到用户环境里面去检测一下,如果都支持就可以继续。对于 ua 检测来说,就是推荐用户使用你们觉着体验比较好的客户端

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/796845

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX