V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  MoYi123  ›  全部回复第 6 页 / 共 22 页
回复总数  421
1 ... 2  3  4  5  6  7  8  9  10  11 ... 22  
cache 里不要按调用次数缓存, 改成每秒更新一次就行吧.

还有算 topn 可以用 heap, 虽然这点应该没多大影响.
279 天前
回复了 Curiosity777 创建的主题 Java 请教一个不断增长的数据统计问题
矿是什么东西? 建议不要在问题里加上只有你知道的业务词汇.
然后看了问题, 我也不知道你想要查什么, 怎么查.
带懒删除的 fib heap
285 天前
回复了 zdking08135 创建的主题 程序员 请教一个系统设计题
只要想办法把 Euler Tour Tree 存数据库里就行了.
dijkstra 关于这个写过文章, 可以看看.
https://www.cs.utexas.edu/users/EWD/transcriptions/EWD08xx/EWD831.html
297 天前
回复了 WilliamColton 创建的主题 C 一个简单(奇怪)的 C 语言问题
如果要在 clion 的 terminal 里输入, 推荐把 Emulate terminal in the output console 打开
297 天前
回复了 xyxy 创建的主题 数据库 海量数据存储问题,求大佬们指导选型
这么大个公司, 不去大厂挖大佬, 来论坛问我们这些穷哥们?
建议发一下编译器的版本

或者试试看这样写
auto alloc = vector<int64_t>(2701131776 / 8 + 1);
char* yuanshuju = reinterpret_cast<char*>(alloc.data());
307 天前
回复了 avadakur 创建的主题 程序员 关于数据库高并发插入的版本号问题
直接用 mysql 的事务 id 怎么样?
@249239432 r-tree ,kd-tree 这些数据结构都不行, 还得是我最爱的集群 for 循环最高效
326 天前
回复了 main1234 创建的主题 程序员 [求问] 没学历没基础咋入门 AI 啊
很多年前收藏的 https://github.com/microsoft/ML-For-Beginners
当然看是不可能看的.
你可以写一个比较复杂的 reader 吧
用一个 queue 来实现 reader,
Read(p []byte) (n int, err error) 可以知道已经读了多少, 可以释放队列头部已使用的压缩数据
到 zlib.NewReader 读不出数据的时候, 再往 queue 里添加新的压缩数据

没试, 应该是可以的.
328 天前
回复了 SJH0402 创建的主题 MySQL mysql 分表能带来哪些显著的,可见的提升?
@SJH0402 你要是能直接把查询优化好, 有人会不听你的方案吗?
1. 把关键词列表放到一个 list, 去重排序, 并且把原先的关键词列表替换为这里的 rank, 关键词列表变成 list<list<rank>> 即把 string 离散化.

2. 把上面的 list<string> 变成 ac 自动机, 在文本中搜索. 得到一个 list<int>

3. 在 list<list<rank>>里搜索有哪几个 list<rank>是 list<int>的子序列, 在这里面抄一个最快的算法 https://leetcode.cn/problems/number-of-matching-subsequences/description/
个人建议别熔断, 做这种事情就是纯背锅的.
354 天前
回复了 dyv9 创建的主题 MySQL 全表价格排序的性能
n = 3000000
id = [i for i in range(n)]
原价 = [random.random() * 99999999 for _ in range(n)]
厂家折扣 = [random.random() * 1000 for _ in range(n)]
卖家折扣 = [random.random() * 1000 for _ in range(n)]
买家折扣 = [random.random() * 1000 for _ in range(n)]
汇率 = [random.random() * 10 for _ in range(n)]

table = list(zip(id, 原价, 厂家折扣, 卖家折扣, 买家折扣, 汇率))


def sort_by(row):
id, 原价, 厂家折扣, 卖家折扣, 买家折扣, 汇率 = row
return 原价 - 厂家折扣 - 卖家折扣 - 买家折扣 * 汇率


import time

start = time.time()
table.sort(key=sort_by)

print(time.time() - start) # 1.0334241390228271


300w 行用 python 全部排序也才 1 秒, 数据库里 c/c++的排序怎么可能要 10 秒呢?
况且 limit n 的情况下只需要 O(n)的排序算法. python 里的还是 O(nlogn)的.

你该不会是把数据全拉到本地再计算的吧.
354 天前
回复了 Mithril 创建的主题 职场话题 如何避免波音这类问题发生在你公司
怎么上来就复读程序员思维? 我看 op 也没说要用技术来解决吧?
2024-01-09 14:11:16 +08:00
回复了 zwyyy456 创建的主题 程序员 caddy 的内存占用异常高
core dump 下来, 到本地的 goland 里看
Settings -> Build, Exections, Deployment -> Deployment -> optional -> Delete remote files when local are deleted;
要快应该得搞点 simd 吧(readme 里也提到了), 这个代码里好像也没有.
1 ... 2  3  4  5  6  7  8  9  10  11 ... 22  
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   5491 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 39ms · UTC 09:17 · PVG 17:17 · LAX 01:17 · JFK 04:17
Developed with CodeLauncher
♥ Do have faith in what you're doing.