人脸 Landmark 识别框架选型，纠结中，求指点

最近的项目需要用到人脸识别 Landmark 和 face mesh ，调研了市面上主流的 NN 框架：MNN, NCNN, TNN, MediaPipe;

MNN 阿里的，速度快，有个 MNNKit demo ，人脸关键点 106 个，单帧处理耗时在 3-5ms ； TNN 腾讯基于 NCNN 做的速度优化版本，有个 demo ，270+关键点，识别速度，单帧 3-5ms ，缺点关键点有点抖动； MediaPipe：谷歌开源的，有 473 点 face landmark ，在 iOS 平台识别速度 10-15ms 单帧；但安卓平台同配置手机 30-50ms ，CPU 占用也比 MNN 高 2-3 倍；

除了人脸识别，MediaPipe 还带了背景分割，头发分割等，缺点就是刚才说的性能可能有问题。MNN 的化只有一个人脸 106 点识别，没有其他官方 demo 。TNN 有快一年没更新了，所以不准备考虑。

本人刚接触深度学习，还不清楚如何训练模型和框架基础原理。MNN 和 MediaPipe 算是两个资料比较多的框架，准备从这个两个入手, 个人倾向 MediaPipe ，现成的 demo 功能比较多。

OK ，问题：

MediaPipe 的性能问题存在在哪里，是模型的问题还是框架的问题？
MNN 和 MediaPipe 推荐哪个，如果 MNN 做 face mesh ，有哪些快速可用的模型或代码？

gavin6liu

184 天前

首先来个暴论，AI 领域 Google 的东西最好别碰，所以 MediaPipe 排除。

其次这些都是推理引擎而已，MNN ，NCNN 属于同一类型，TNN 属于基于 NCNN 的二次封装。

另外由于你刚接触这个，只有用一些预训练好的模型和代码，策略就是哪个框架有现有的 Demo 就用哪个。

和 TNN 类似的还有，YY 开源的 VNN ，可以选择。

keepwalk2020

183 天前

MediaPipe 对硬件要求高，但是效果是相对较好的，高精度模型 google 没有放出来
Yolo 对硬件要求低，甚至可以抛在树莓派上，效果中上吧
dlib 貌似也不错
SPIGA 正在试，对比后才知道效果
油管上有一个视频，对比各种人类识别框架的效果，自己搜了一看便知，楼主有方便发个 QQ 吗，一起讨论，最近也在做这方面的东西

这是一个专为移动设备优化的页面（即为了让你能够在 Google 搜索结果里秒开这个页面），如果你希望参与 V2EX 社区的讨论，你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/1066556

V2EX 是创意工作者们的社区，是一个分享自己正在做的有趣事物、交流想法，可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.