压缩数据用指数曲线好,还是对数曲线好?

2020-02-24 11:55:07 +08:00
 JCZ2MkKb5S8ZX9pq
1545 次点击
所在节点    问与答
8 条回复
ryd994
2020-02-24 13:34:18 +08:00
为什么不用浮点数?
ryd994
2020-02-24 13:36:04 +08:00
我懂你意思了。这要看情况。
论文和金融上用对数比较多
因为很多数据之间就是对数关系
所以对数转换之后就是一条直线,非常直观
ylrshui
2020-02-24 14:04:44 +08:00
当然是对数,把指数变化变为线性变化;开 5 次幂后的曲线无法直观观察数据变化
autoxbc
2020-02-24 16:10:30 +08:00
这个好像叫心理物理学,有两个著名定律

1. 韦伯-费希纳定律(Weber-Fechner law)
2. 斯蒂文思幂定律(Stevens's power law)

分别对应上面的两种数据处理方式

具体适用范围不知道,我觉得还是和数据来源有关
比如描述噪声的分贝等级是第一种
描述亮度变换的 Gamma 曲线是第二种
JCZ2MkKb5S8ZX9pq
2020-02-24 20:52:38 +08:00
@ryd994
我的数据都是访问量,粉丝数这类的,比较随机,不是某一种指数的增长曲线。
比方说有 99 个人的粉丝都在几十万,但有 1 个博主粉丝破千万了,放在一个图表里就需要考虑显示的优化。

@ylrshui
我本来感觉是计算效率可能有点不一样。
视觉上的话 5 次幂我用过,看也看得出。
开幂其实一个指数不变底变,一个底不变指数变。我等会儿画出来看看。
ylrshui
2020-02-24 23:11:45 +08:00
@JCZ2MkKb5S8ZX9pq 数据范围对开 5 次幂的影响较大,范围较小,开 5 次幂压缩太过,范围太大,压缩不够,这种方法处理出的数据仍是指数关系。对数则将指数关系转化为线性关系,数据范围的影响就要小的多,具有通用性
JCZ2MkKb5S8ZX9pq
2020-03-02 00:16:01 +08:00
@ylrshui 测试了一下,数据直接用的新浪的 ncov,log 用的 e。

相对关系都能表现出来。
对数压缩完之后,数据更近一点。但通过调整底数或幂,都可以变。
对数计算好像快一丢丢。
对数 1 需要稍微做点处理,显示 0 的话不符合直觉。

简单来说,两种好像区别并不大。
JCZ2MkKb5S8ZX9pq
2020-03-02 00:16:34 +08:00
@ylrshui 具体见 append 中的图片

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/647043

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX