![]() |
1
kuro1 46 天前 ![]() YOLO 自己训练
|
![]() |
2
jimrok 46 天前
你这个方向不是图像识别和事态感知的内容吗,军工和自动驾驶行业的人能帮你判断一下吧。
|
3
chanlk OP @kuro1 我看 YOLO 很多的应用场景在 B 端,聚焦的场景很单一,我们这个是家用的场景,用户可能放在卧室、客厅、户外都有可能,而且场景里会出现的物品和事件太多了,感觉很难弄一个通用的 YOLO 模型出来。
|
![]() |
5
lyxxxh2 46 天前
但是 api 不错,真的是实际场景图吗?
我用 grok chat,前几张好识别的,确实可以回答出来。 但是不好识别的,一样 gg 。 yolo: 安防数据集,算是挺常见的。 去网上找训练好的模型,让 ai 帮你测试。 数据集也行,自己训练下。 |
![]() |
6
lyxxxh2 46 天前
https://docs.ultralytics.com/zh/guides/security-alarm-system/
如果你找好了模型,自己都不用写什么代码,官方都有示例。 |
7
hwdq0012 46 天前
安防一般不是用目标识别吧, 一般是移动侦测,姿态分析(摔倒)
|
![]() |
8
monkeyWie 46 天前
最近不是有个 FastVLM 吗,很快运行条件也低
|
![]() |
9
monkeyWie 46 天前
不对,是叫 smolvlm
|
![]() |
10
wyntalgeer 46 天前
@chanlk #3 那就弄 N 个出来
|
14
leven87 46 天前
自己训练最灵活,或者找一个别人的模型,自己调参
|
![]() |
16
sleeepyy 46 天前
gemini api 很便宜效果也不错
|
![]() |
18
xytest 46 天前
收藏一下 期待 小而美的解决方案
|
19
chanlk OP @wyntalgeer 有这么想过,但是怕弄出来效果也不好。
|
![]() |
20
wyntalgeer 46 天前
@chanlk #19 玩 YOLO 不要想着一劳永逸,一开始效果注定不好,但是你要给一个“疑似”报警并收集下来,继续训。迭代久了就值钱了
|
![]() |
21
rockdodos 46 天前
Qwen 微调效果还行
|
![]() |
22
bluesenzhu 46 天前
摄像头厂家不是吹自己就能告警吗
|
![]() |
23
encro 46 天前
既然放在卧室,那么如何识别男女主人是在造人还是在家暴?
|
![]() |
24
clemente 46 天前
找海康威视贴牌 OEM
|
26
chanlk OP @bluesenzhu 最早期移动侦测、声音告警,近些年有人体告警(装了红外感应),或者有一些人体侦测算法集成在摄像机里。稍微复杂的识别摄像机带不动。
|
29
wanghui22718 46 天前
https://www.corerain.com/solution
端侧解决方案,了解一下 |
![]() |
30
Liftman 46 天前
你这个还不够低。来。让我掏出来一个给你。https://github.com/apple/ml-fastvlm 500m 的小模型。我在 mac 上跑。100ms 一次解析都嫌慢。不过再快也没意义了。。毕竟看不清了已经。。。。
|
![]() |
31
Liftman 46 天前 ![]() https://github.com/ngxson/smolvlm-realtime-webcam 用这个项目跑我楼上的模型比较简单。。
|
![]() |
32
zzhpeng 46 天前
实时分析好吃带宽,如果远端录像识别
|
34
openmynet 44 天前
可以测试下用 clip 做零样本分类
|
![]() |
35
yuxian 43 天前 ![]() 很简单,分为多部分。方便吹牛 B ;
1 ,在终端,使用通用的 YOLO ,嵌入端,可以用压缩好的模型。性能佳。无需训练。直接调用 sdk ,即可使用。作为泛用场景监控。只需要有疑似的图像,视频片段上传即可,精度可以自行根据严格模式调节。 2 ,在服务端,处理终端上传的疑似数据。优先使用自训练的 yolo 。对于依然无法确认的,可以调用视觉大模型,再次核对。如果依然无法确定结果的,人工接入审核。 |
![]() |
36
AmaQuinton 43 天前
项目上用过某个研究院提供的 api ,用于道路违停和火灾预警实时监测
|
38
chanlk OP @yuxian 终端暂时不考虑了,我们的设备有部分是第三方的。感觉还是直接上大模型算了了,我们人太少、资源不足搞不了 yolo ,这事儿从头到尾就我一个人干.....
|
![]() |
39
Liftman 43 天前
@chanlk 无所谓啊。https://github.com/ngxson/smolvlm-realtime-webcam 用这个项目跑我楼上的模型比较简单。。这个直接跑。不需要 mac 。
|