V2EX › phpfpm 的所有回复 › 第 22 页 / 共 27 页

@keepeye 没有 crontab

@fancy111 emm howto ？
@ohao
@dolphintwo 每天时间还不一样

我决定背锅。

mysql 每天定时都有备份，我选择重装机器。
这台机器装的是 19.04desktop 升级上来的本来就比较个性

回头直接重装 20.04 server

2020-05-14 11:27:26 +08:00

回复了 phpfpm 创建的主题 › 问与答 › 每天早晨 mysql 8.0 被关闭一次，不知道为啥

@nutting 不是虚拟机，物理机。

2020-05-13 16:56:52 +08:00

回复了 phpfpm 创建的主题 › 问与答 › 有没有什么开箱即用的人脸识别数据库？

@sadfQED2 我能贪心一些，求打包好的 docker 。。。

2020-05-12 08:54:53 +08:00

回复了 phpfpm 创建的主题 › 问与答 › 有没有什么开箱即用的人脸识别数据库？

@askfermi cooool，我只看了 demo 文档没看到这个方法，回头我试一下。
问下这个吃显卡么，还是 cpu 好点就行。

暂时还没有对外使用的想法，还是想把存量的数据分类清楚。
@miao666 百度云的话，我的图敏感度偏高，怕被喝茶。

2020-05-11 22:46:52 +08:00

回复了 phpfpm 创建的主题 › 问与答 › 有没有什么开箱即用的人脸识别数据库？

@askfermi emm 是不错，但是感觉解决的是框出来人脸&与已有的比对，互相之间比对还是要靠炼丹了么。。

2020-04-30 17:38:04 +08:00

回复了 Cielos 创建的主题 › JavaScript › 菜鸟发问！在 for 循环里写 (a == -1) && break; 会报错是咋回事？

看了你的头像，我发出了沉思：可能你入错行了。。

2020-04-29 14:34:00 +08:00

回复了 phpfpm 创建的主题 › 问与答 › 百万级图像抓取去重存档技术方案

@rrfeng 按照我现在的硬件这个查询效率我觉得差不多了，换一台好的服务器还能提高不少效率。
更好的算法也得基于更好的硬件，比如显卡加入什么的，愿闻其详

2020-04-26 19:35:18 +08:00

回复了 phpfpm 创建的主题 › 问与答 › 百万量级的汉明距离的数据有没有什么快速计算接近的方法呢？

根据上面的帖子优化了一版
从 5*200*25k 个 distance 用 10s 了
到 5*200*200k 个 distance 用 15s

之后一个点的全量数据对比 (5*1M ）个 distance 在 20s 内能搞定，考虑用队列离线算~

2020-04-26 09:19:57 +08:00

回复了 phpfpm 创建的主题 › 问与答 › 百万量级的汉明距离的数据有没有什么快速计算接近的方法呢？

@0o0o0o0
@tzm41
@yuruizhe
@also24

昨天想了一个思路，准备动手去做
还是空间换时间，而且要利用好“diff < n”这个条件去筛。

128bit diff <=3 那么把 128bit 分成四段，至少能有一段是完全一致的。

1M 个分成 4M 段每段按照哈希值存到一个桶里面，会有 2^32 个桶，每个桶基本不会有冲突。
之后每个 hash 找近邻的时候只需要找 4 段对应的 hash 取个并集，算一下这部分就好。

2020-04-25 20:35:15 +08:00

回复了 phpfpm 创建的主题 › 问与答 › 百万量级的汉明距离的数据有没有什么快速计算接近的方法呢？

@vchar2ex 我已经找到实现了，我的问题不是如何算 hash，而是如何降低复杂度快速去找。

2020-04-25 19:58:30 +08:00

回复了 phpfpm 创建的主题 › 问与答 › 百万量级的汉明距离的数据有没有什么快速计算接近的方法呢？

@yuruizhe 没毛病，空间换时间。
你空间给小了和 1-count 预处理效果差不多
给大了……你给不起。。
128bit 不小的。。。

2020-04-25 19:52:05 +08:00

回复了 phpfpm 创建的主题 › 问与答 › 百万量级的汉明距离的数据有没有什么快速计算接近的方法呢？

@imn1 更正一下，FFI

我的场景这个判重已经足够了，稍后算一下几个 hash 算法的 dist 的权重，做一个新的阈值。

2020-04-25 19:48:54 +08:00

回复了 phpfpm 创建的主题 › 问与答 › 百万量级的汉明距离的数据有没有什么快速计算接近的方法呢？

@imn1 世界上最好的语言对 OpenCV 的封装不好。。。
当然 php74 之后就有 ffp 了，拭目以待吧~

2020-04-25 19:47:32 +08:00

回复了 phpfpm 创建的主题 › 问与答 › 百万量级的汉明距离的数据有没有什么快速计算接近的方法呢？

@also24 我直接硬数的，反正 n^2 的算法里面的 n 次 bit 计算怎么搞都不差太多……
但是优点确实是能省好多 distance
毛估，distance 计算数量减少百分之 90，但是多算了 n 次绝对值相减，里外里效率提升 50%这样

ext_gmp 的 distance 已经很省时间了

2020-04-25 19:28:27 +08:00

回复了 phpfpm 创建的主题 › 问与答 › 百万量级的汉明距离的数据有没有什么快速计算接近的方法呢？

@lizytalk lsh 是分段的，会降低敏感度，因为图片无法分段。

2020-04-25 19:23:43 +08:00

回复了 phpfpm 创建的主题 › 问与答 › 百万量级的汉明距离的数据有没有什么快速计算接近的方法呢？

@imn1 处理的已经是针对 hash，而不是图片了。

踩了一个语言的坑，有一些代码写的还不够 dry，目前已经优化到计算
5*200*25k 个 distance 用 10s 了。

2020-04-25 19:12:51 +08:00

回复了 phpfpm 创建的主题 › 问与答 › 百万量级的汉明距离的数据有没有什么快速计算接近的方法呢？

@also24 又做了一个优化，比较 distance 之前算下 bit count 的差值，超过阈值就不算了。
这样又可以快一点点。

2020-04-25 18:20:33 +08:00

回复了 phpfpm 创建的主题 › 问与答 › 百万量级的汉明距离的数据有没有什么快速计算接近的方法呢？

@imn1 我尝试了一下算 hash dup 的算力。
必要的缓存优化我做了，hash 全部读取到内存没有 io 问题。

计算 5(个算法）*200 个 src*10k 个目标的汉明距离大概需要 1 分钟
i5 4200U@1.6G 睿频到 2.2 的单核

如果目标上升到 1M(100 倍），5*200 这组需要的时间将会上升到 100 分钟

当然换一个好点的 cpu 提升 10 倍也就顶天了，10 分钟算 200 个（因为前面的 target 少）

1M=200*5000, 算均值是 5 分钟一批，需要 25000 分钟，大概 400 个小时。

1 ... 14 15 16 17 18 19 20 21 22 23 ... 27

❮

❯