V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  iseki  ›  全部回复第 1 页 / 共 46 页
回复总数  913
1  2  3  4  5  6  7  8  9  10 ... 46  
首先,不严谨地说,东西只要在客户端就可以被破解。其次,Java 这边你要想尽量提高逆向工程难度,看看 GraalVM Native Image 吧
@xuanbg

1. 已经发出去的 token 怎么办
2. 改动内容多半比开始就用 JWT 要大
@laminux29 pg 的实际做法,可以看做(我没读代码,只说等效结果),按 3gram 输出的所有条目去查 gin 索引,对结果 recheck 。这种做法不可能出现漏掉数据的情况。
@dejavuwind 对的,similarity 就是明确的模糊查询,这个 case 显然要求的是精确查询
@laminux29 …你要不自己下载个 pg 试一下
我这个例子只是告诉你 k-gram 是个啥东西,不是说 pg 只会从这几个值里挑一个去找索引。
@dejavuwind 你用的是相似度,我说的是 LIKE '%keyword%',咱俩说的不是一个东西啊
@laminux29
```
select show_trgm('12345');
show_trgm
---------------------------------
{" 1"," 12",123,234,345,"45 "}
(1 row)
```
这个东西的分词是 "12345" -> "123", "234", "345" 这种策略的,不会有你说的那种问题

@laminux29 存在类似风险时(比如输入长度小于 3 或者因为字符编码等问题没法搞),PG 会直接回退,放弃这个索引
@laminux29 PG 的这个 trigram + GIN 很粗暴,不会有假阴性问题,缺点就是读放大有点大。
这个需求最大的问题是,如果不加其他限定条件,那就必须考虑当输入的 keyword 很短时,召回特别大量数据以至于几乎无法使用的现实问题。
@lambdaq PostgreSQL 有个日本人写的扩展,bigm ,2gram
@laminux29 不会有错误结果,现实中都是使用 like %keyword% 搜索,数据库会在使用基于 k-gram 分词的 GIN 索引基础上再做一次 recheck 。
trigram 就是分词,索引是 GIN 或者 GiST 。我们这边线上在用,没什么大问题。
@sagaxu pg 一般这种场景直接用 like ,系统会自动加一个 recheck 解决假阳性
@laminux29 non-word 是指空白符什么的,数字属于 word ,虽然我也不知道这是哪里的规定
55 天前
回复了 abstime 创建的主题 Java 文件上传后解压缩的问题
@wnpllrzodiac 7Z 格式怎么就非标了,主要是 Zip 格式太老了,字符编码都没统一,确实风险有点大。
71 天前
回复了 firhome 创建的主题 职场话题 闻所未闻的倒计时思路。。。。。
这功能挺好玩的。
你不能因为自己做着麻烦就说人家需求逆天啊。
@xuanbg 我何时说跟前端有关系了?
考虑找找无绳电话?(但是这种东西安全性存疑),正常点的方案家用的没听过,商用的…部署门槛就很高吧
即使这样我觉得用 JWT 也不是不行:
1. JWT 有标准化的规格说明,IETF RFC ;
2. 没必要为了节省传递 token 的那点流量把自己的路堵死,日后万一需要无状态降级也有机会;
@BarackLee 移动路障不危险吗
1  2  3  4  5  6  7  8  9  10 ... 46  
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2931 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 63ms · UTC 14:48 · PVG 22:48 · LAX 06:48 · JFK 09:48
Developed with CodeLauncher
♥ Do have faith in what you're doing.