V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
wangbenjun5
V2EX  ›  程序员

现在的所谓 AI 推荐算法只能这样吗?

  •  
  •   wangbenjun5 · 2020-04-14 13:39:32 +08:00 via Android · 9283 次点击
    这是一个创建于 1669 天前的主题,其中的信息可能已经有所发展或是发生改变。
    以某条和某音为例,先不提当中有多少人工干预的成分,人工干预基本上就是像让你看啥你就看啥

    所谓智能推荐就是你看什么都越多推荐什么越多,假如有天天看小姐姐跳舞,你会发现你的主页全部都是小姐姐跳舞的视频,躲都躲不掉……

    这特么的叫智能?我这周吃肉,下周就一定还喜欢吃肉?天天吃肉也腻吧

    我也不清楚这些大公司那么多所谓的 ai 工程师,年薪上百万都在忙啥,动不动就是各种高级词汇,神经网络,回溯算法……实际上做出来的产品就像是一个根据标签模式匹配的玩意,谈不上什么智能……说难听点,不就是打些标签,搞个相似度匹配?
    104 条回复    2020-04-15 13:41:49 +08:00
    1  2  
    littleylv
        1
    littleylv  
       2020-04-14 13:42:43 +08:00   ❤️ 6
    某条和某音没装过,不知道,但网易云是真的人工智障,只要你稍微多听几首特定标签的,或者同时喜爱了两三首一样的,就天天专门给你推这类型的
    xloger
        2
    xloger  
       2020-04-14 13:45:27 +08:00   ❤️ 27
    还有淘宝,比如我买完了键盘鼠标等东西后,然后就给我推荐这些。可是我已经买好了啊......
    Immortal
        3
    Immortal  
       2020-04-14 13:45:41 +08:00   ❤️ 1
    @littleylv #1
    虽然我不知道网易云的算法 但是我觉得他们甚至可以偷懒了
    一首歌在一个歌单里 推荐的时候 从另一个有这首歌的歌单里随机几首都可以
    因为一般歌单会把相同口味的歌放一起
    littleylv
        4
    littleylv  
       2020-04-14 13:48:35 +08:00   ❤️ 2
    @xloger #2 对,某宝某东都这样,智障,我都交易成功了,还给我推
    lv2016
        5
    lv2016  
       2020-04-14 13:49:28 +08:00   ❤️ 2
    这个问题不好评价,因为我们个人只能通过自己及身边的人来获取评价,是一个有偏估计,站在全国人民的角度,或许这种算法符合大多数人的喜好。大厂内部肯定有自己的评价指标,比如人均观看视频时长。从另一个角度来说,推荐算法学习到的也是大多数人的观看模式,并不一定能细化到个人。
    leogoforit
        6
    leogoforit  
       2020-04-14 13:50:09 +08:00   ❤️ 1
    信息茧房
    wangbenjun5
        7
    wangbenjun5  
    OP
       2020-04-14 13:52:03 +08:00 via Android
    @littleylv 基本上都差不多了,就是看什么给你推什么
    fancy111
        8
    fancy111  
       2020-04-14 13:52:20 +08:00
    因为本身就是标签而已。 不过话说回来,谁知道你下周想吃啥啊?
    artyhacker
        9
    artyhacker  
       2020-04-14 13:52:31 +08:00   ❤️ 1
    我觉得推荐应该是推荐相关内容,而不是相似内容. 相似内容查 tag 就能查到,相关内容才是需要 AI 去自学习完成的东西.
    ForeverYoung123
        10
    ForeverYoung123  
       2020-04-14 13:56:04 +08:00   ❤️ 1
    尝试把所有喜欢都取消,所有官媒都拉黑。
    winterfell30
        11
    winterfell30  
       2020-04-14 13:58:47 +08:00 via Android
    explore 确实是推荐系统公认的难题,不是开发的人意识不到,是这个在做不好的情况和点击率转化率就是矛盾的
    binux
        12
    binux  
       2020-04-14 13:59:08 +08:00 via Android
    问题是推什么呢?如果不推相关的,那就推热门的呗。到时候你又说这样和门户有什么区别了。
    wangbenjun5
        13
    wangbenjun5  
    OP
       2020-04-14 13:59:54 +08:00 via Android
    @leogoforit 是啊
    wangbenjun5
        14
    wangbenjun5  
    OP
       2020-04-14 14:00:30 +08:00 via Android
    @ForeverYoung123 某条置顶的新闻,你拉黑都没用
    xingshu1990
        15
    xingshu1990  
       2020-04-14 14:00:55 +08:00   ❤️ 1
    抛开编程、推荐算法,按照一般人的习惯,网易云这种推荐相似风格,会是:一个人听来听去,可能喜欢上某几首音乐,抵触同风格中其他几首。——不如改成:一行的类似风格的歌单,一行与之相反风格的歌单。
    淘宝的推荐,比较建议分成两种:①一种是没下单的时候,推荐一个年龄段,或者一个群体共同喜欢的产品。②另外一种是给那些已经购买过这类产品的人,推荐上下分类的产品(参考鸟笼效应)。
    可能
    wangbenjun5
        16
    wangbenjun5  
    OP
       2020-04-14 14:01:27 +08:00 via Android
    @binux 你说的还真是这样,大部分推的都是热门或者人工干预的,亦或是某些作者自己花钱推广的
    kop1989
        17
    kop1989  
       2020-04-14 14:01:43 +08:00   ❤️ 3
    往科学了说,因为目前的 ai 还是统计学,是对历史的过拟合。而且虽然你很反感,但可能对于公司来讲是利益最大化的方式。

    往科幻了说,如果 ai 真的能猜准你的心思,就意味着个人人格的彻底暴露,这比个人隐私的暴露要残酷得多。相当于你这个人的行为和内心活动是可以被机构预测的。这是非常恐怖的一种环境。
    coderluan
        18
    coderluan  
       2020-04-14 14:03:44 +08:00   ❤️ 16
    之前看谁说的来着:在亚马逊买了台 switch lite,系统会给你推荐游戏卡,在淘宝买了台 switch lite,系统会给你推荐别的颜色的 switch lite 。
    murmur
        19
    murmur  
       2020-04-14 14:05:42 +08:00
    推荐算法其实是按利润来的
    我想了很久也没想明白
    后来想了一下,男人是推荐算法的目标用户么,不是,当然是女生,女生才会买大量的衣服、鞋、化妆品、零食
    越是理智的人越不会受推荐算法干扰,反倒是喜欢冲动宠物的是,所以买啥推荐啥符合给女生推荐的策略
    hallDrawnel
        20
    hallDrawnel  
       2020-04-14 14:07:20 +08:00   ❤️ 2
    淘宝是真的智障,我买完一个显卡,然后疯狂推显卡,难道我一个普通人整天买显卡?然后无论买完什么都是疯狂的重复推同一样东西,真是醉了。

    京东也是一个德行,不过京东做的比淘宝好的就是有一个常购清单的推荐,里面推荐的确实是我会重复买的东西。
    wangbenjun5
        21
    wangbenjun5  
    OP
       2020-04-14 14:19:52 +08:00 via Android
    @hallDrawnel
    @murmur
    @kop1989

    其实想想也是,推荐的这东西也许根本就不是从技术角度,更多的是从商业角度考虑,利益最大化,所以即使用不用 AI 也无所谓,但是对外一定要说是高科技
    narutots
        22
    narutots  
       2020-04-14 14:26:26 +08:00   ❤️ 2
    最大的矛盾点是:“动不动就是各种高级词汇,神经网络,回溯算法……实际上做出来的产品就像是一个根据标签模式匹配的玩意”
    smallpython
        23
    smallpython  
       2020-04-14 14:26:34 +08:00
    是的, 只是这样, 不过即便只有这样也能带来巨大的利润
    至于智能算法, 对外当然是怎么好听怎么说, 能赚钱的方法就是好方法
    p2pCoder
        24
    p2pCoder  
       2020-04-14 14:28:18 +08:00
    其实更多人就是喜欢困在自己的信息茧房里
    对于推荐系统,包括广告,说白了都是为了最终转化率,对于拥有海量用户的产品来说,提升一个点,就是肉眼可见的钱
    至于推荐系统里面的其他目标,什么新鲜度之类,完全不是核心 kpi
    我在算法部门做推荐引擎,经常业务方产品经理认为系统推出某个产品是脑残,应该在策略上进行限制,但是只要算法反手一份统计数据过去,业务方就不会说啥了
    就拿电商来说,大多数场景,肯定不到 1%,用户重复购买曾经买过的商品的同 spu 甚至同 sku 产品,是远高于购买新的 spu 的
    lithbitren
        25
    lithbitren  
       2020-04-14 14:40:33 +08:00
    一个想法,不一定对。
    推荐同类商品的,对于采购来说,初期会连续买样品,然后会在确定最终采购目标时会大批购置某样商品,对于刷单的账号可能也是这样,这些交易行为可能在交易中产生了过大的权重。
    而一般的散客购物行为,预测起来非常复杂且随机性较强,本身可能就很难在算法黑箱中提取出特征。
    所以最后,导致了推荐结果最终会向行为路径的比较明确的采购和刷单靠拢,忽略了一般消费者的体验。
    从最终效果来看,很有可能这个算法就是为采购商服务的,采购商买了样品后本来就拥有继续购买同类商品的动机,这种推荐机制可能确实对电商销量有显著提高,算法工程师可能也因此完成了 KPI,只不过恰好牺牲了散客体验罢了。
    鸟笼效应可能需要更复杂的算法设计,感觉听到在做的不太多。
    JerryCha
        26
    JerryCha  
       2020-04-14 14:52:02 +08:00
    因为基础就是统计然后分类,当你不了解一个人的时候你会从自己过往的知识与经历中找答案解读对方的一言一行。
    murmur
        27
    murmur  
       2020-04-14 14:57:00 +08:00
    @littleylv
    因为网易没多少歌了,腾讯坐拥全国最大正版曲库,他的逻辑就是,我有那么多的歌,你不多听几个类别你不亏么
    网易的歌其实就是那几类,小众的外语、民谣歌曲,盗版或者部分正版的 ACG 、同人,盗版或者部分正版的古风曲
    类别太集中,你既然能忍得住歌少也选网易,说明你对网易的曲库有高度认同,这个推荐也无可厚非
    toan
        28
    toan  
       2020-04-14 15:08:26 +08:00
    @littleylv 网易云,始于推荐,止于推荐。
    起初用网易云,在每日推荐里,听到里许久没有听到的、曾经感觉好听不知道歌名(音乐名)的这些歌曲,然后就沦陷一度成为音乐软件首选。
    后来的后来,不小心刷到个什么奇怪的歌曲、音乐或者搜索一些儿歌之类的之后,每日推荐里真的不能听了,有种洗脑般的感觉。
    在之后的之后,音乐版权啊什么的各种不爽,网易云已经在手机的某个角落里落灰了。
    yogogo
        29
    yogogo  
       2020-04-14 15:15:58 +08:00
    @coderluan 还是亚马逊的推荐算法靠谱,会上瘾,买完一个东西会一路买下去。然而国内的推荐算法,怎么看都是打标签推荐,看过一个就只推这类目的。
    xfriday
        30
    xfriday  
       2020-04-14 15:18:28 +08:00
    现在的 AI 就是 KNN 而已
    azcvcza
        31
    azcvcza  
       2020-04-14 15:19:35 +08:00
    理想中的推荐算法,应该是一个图节点被点亮后,与该节点相连具有购买或其他关系最大的相邻节点被点亮;
    现在好像更多是推荐同一棵树上,同一层级的兄弟节点
    tfdetang
        32
    tfdetang  
       2020-04-14 15:26:27 +08:00
    > ……说难听点,不就是打些标签,搞个相似度匹配?

    打标签很没技术含量吗?很多推荐就是根据视频内容,评论内容对视频自动打标签,然后推给符合标签的人群。 如果不用那些 fancy 的技术,连打标签恐怕都做不好吧
    BlackBerry999
        33
    BlackBerry999  
       2020-04-14 15:31:43 +08:00
    随着推荐的深入,往往信息视野会越发狭窄。
    问题在于推荐贴合的是一条线,即单一风格的内容。
    解决方法是将线展开为面,单一 ==> 相似的不同风格内容。
    loryyang
        34
    loryyang  
       2020-04-14 15:34:26 +08:00   ❤️ 4
    这个其实很好理解,任何基于规则的,比如基于标签,你能做到 60 分,但是用模型,你可以做到 65 分,虽然看起来依然很傻逼。但是从后台的数据可以看到,需要的指标依然上涨了。而这提升就是公司最看重的。试想如果你可以为公司每日上亿收入提升 1%个点,老板肯给你多少钱?
    请注意这里,主要的指标,并不是你认为的指标。而且关心的不是你一个人的偏好,更重要的是作为一个整体,这个数据的变化趋势。
    公司内部一般都有一套非常完整的体系来证明算法的效果,比如经典的 AB test,一般会通过分层分流实验来做。正所谓内行看门道,外行看热闹。一个普通人都看的出来的问题,公司内部必然已经发现了。依然存在的大概率是因为这并不是一个问题。小概率是公司内部机制,比如 KPI 导向等造成的
    zmxnv123
        35
    zmxnv123  
       2020-04-14 15:36:55 +08:00
    有种推荐算法是寻找和你喜欢听歌类型的一类人,根据余弦定理计算向量夹角。
    你和某个人的夹角越小,说明喜欢类型越相似。
    这样就可以把另一个人喜欢的类型推荐给你,可以防止出现楼主这样的问题。
    hoyixi
        36
    hoyixi  
       2020-04-14 15:39:57 +08:00   ❤️ 1
    推荐? 4 月 3 号晚上开始到 4 号那两天,直接扯脖子灌了
    NotNil1
        37
    NotNil1  
       2020-04-14 15:42:29 +08:00
    淘宝你买了条裙子,疯狂给你推裙子,然后就会一条接一条的买,一个夏天买 10 条都有的,这个策略也有可取之处,你觉得这个策略智障,大概率是因为你不是这个策略的受众,那淘宝为啥不做个适合你的呢,因为我们被战略放弃了。
    lhx2008
        38
    lhx2008  
       2020-04-14 15:43:14 +08:00 via Android
    抖音的推荐还是不错的,
    murmur
        39
    murmur  
       2020-04-14 15:44:48 +08:00
    @lhx2008 抖音、头条我认为这个算法有争议,因为在某些人眼中来说这些都是糟粕,没有什么营养,打法时间的东西,那么怎么推荐给你你都觉得爽
    就跟你说鸡汤文和造谣有什么高下之分,奥里给和老八谁比谁优秀么
    lhx2008
        40
    lhx2008  
       2020-04-14 15:45:12 +08:00 via Android
    楼主说的就是新鲜度和覆盖度的问题,抖音也不是没做这方面的努力,会有新的视频看你喜不喜欢看的,如果以前喜欢现在不喜欢,点反馈很快就不推了
    lhx2008
        41
    lhx2008  
       2020-04-14 15:47:51 +08:00 via Android
    @murmur 看的爽就是抖音的目标,看的不爽那是教育,新闻联播。游戏也是消遣嘛。
    skyyp
        42
    skyyp  
       2020-04-14 15:49:00 +08:00
    @hoyixi #36 那天就是在抖音看新闻联播
    wszgrcy
        43
    wszgrcy  
       2020-04-14 15:51:26 +08:00 via Android
    这么说你是看不起我决策树是 ai 了?(#滑稽)
    lhx2008
        44
    lhx2008  
       2020-04-14 15:58:08 +08:00 via Android
    @murmur 其实抖音上面内容比想像中多得多,生活的方方面面都有,每个人的爽点也不一样,推荐还是有一点价值的吧
    wangbenjun5
        45
    wangbenjun5  
    OP
       2020-04-14 16:09:47 +08:00 via Android
    @hoyixi
    @skyyp 哈哈,形象
    nnnToTnnn
        46
    nnnToTnnn  
       2020-04-14 16:21:57 +08:00
    你试试 Steam 的推荐
    chendy
        47
    chendy  
       2020-04-14 16:27:18 +08:00
    感觉推荐算法基本都是标签匹配,音乐类的,淘宝京东,steam,都是差不多的感觉
    体会最深的是淘宝,手滑点了一件女装,然后就满屏幕都是女装…
    顺便一说我真的佛了,这帖子里竟然也有人说 zz 话题,block 列表又长了一点
    longbye0
        48
    longbye0  
       2020-04-14 17:16:52 +08:00
    @xfriday kNN 是 k 最近邻,你在说啥呢
    KousukeSakurako
        49
    KousukeSakurako  
       2020-04-14 17:23:21 +08:00
    @littleylv 深有同感
    taurus2333
        50
    taurus2333  
       2020-04-14 17:38:37 +08:00 via iPhone
    @xloger 我有一次更狠,买了一部手机,过几天给我推送,说这款手机降价了……
    StubbornC
        51
    StubbornC  
       2020-04-14 17:47:14 +08:00
    莫名联想到西部世界的 Rehoboam 系统
    StubbornC
        52
    StubbornC  
       2020-04-14 17:47:55 +08:00
    @StubbornC 或许那才是真正的人工智能(狗头
    wangyzj
        53
    wangyzj  
       2020-04-14 17:49:32 +08:00
    某个号称以算法起家的公司他们家的产品自从我用过今日头条后
    我就再也不用了
    什么烂算法


    https://www.v2ex.com/t/657932
    看我之前开的帖子
    有老哥提出了调参工程师,特征工程师等等,可能大多数做的是这种吧
    算法已经很成熟且很难变动了
    wangyzj
        54
    wangyzj  
       2020-04-14 17:50:30 +08:00
    @xfriday 应该比 knn 高级点吧
    怎么也得来个 cnn
    openbsd
        55
    openbsd  
       2020-04-14 18:00:00 +08:00
    @hallDrawnel #20
    @wangbenjun5 #21
    还真不是 利益最大化 个人觉得就是人工智障 无脑推
    之前买了个净水器,它不推 滤芯 杯子 烧水壶
    天天推各种牌子的净水器,难道让买上一堆净水器做评测么 ?
    openbsd
        56
    openbsd  
       2020-04-14 18:05:54 +08:00
    @NotNil1 #37
    快消品这样推荐没毛病
    但是大家电,电脑这些价格高,能用很长时间的产品也这么推 ?
    SakuraSa
        57
    SakuraSa  
       2020-04-14 18:20:33 +08:00
    对于重复推荐已经购买的商品,理论上可以通过已经购买降低排序权重的方式解决。
    根据用于购买的数据统计,每个品类的购买周期,然后做已经购买的降权。
    但是,一旦开启类这个策略,推荐系统的核心指标 ctr 就掉得很厉害。

    感觉,很难在用户体验和点击率、购买率之间平衡呀
    甚至,不知道怎么用指标衡量用户体验
    encro
        58
    encro  
       2020-04-14 18:26:43 +08:00
    说过狗东的笑话:你上午卖了一款 iPhone,下午给你推荐另外一家店铺同型号更便宜的,我究竟要不要退货呢?
    drydiy
        59
    drydiy  
       2020-04-14 18:28:35 +08:00
    @coderluan #18
    这个真的是感同身受。我一段时间看鼠标,并且在天猫买了。结果就是买完后天天推送鼠标给我。真是服了。
    gzchen
        60
    gzchen  
       2020-04-14 18:34:03 +08:00
    恰恰是这么一回事,能做到这个程度的你也可以年薪 P5-P7 起,大约也就是 ZJU,SJTU 的硕士生的水平。
    encro
        61
    encro  
       2020-04-14 18:42:30 +08:00
    其实我也做过推荐,也能理解吧。

    1,推荐外层的是根据用户浏览历史标签来的;
    2,购物车页面的推荐才是根据用户当前选择的产品,推荐相关产品;

    而亚马逊主要是根据用户购买历史,而不是浏览历史。


    还有一个是性能问题,按照浏览历史用户通常看得太多,filter 不好实现啊,filter 之后基本没有价值了。

    另外一个因为推荐的都是广告位,是主营收入呢,都被加入 filter 之后,平台怎么赚钱呢,难道学 AMAZON ?收入怕得大降,被竞争对手打死,被投资人骂死,Aamzon 交易手续费高啊,所以药不能停,只能继续牺牲消费者利益,保证平台利益了。
    pmyile
        62
    pmyile  
       2020-04-14 18:54:18 +08:00
    @xloger 这个真的是超级想吐槽。 智障的一逼
    Unclev21x
        63
    Unclev21x  
       2020-04-14 19:02:32 +08:00 via iPhone
    @xloger 老哥,你成功把我逗笑了😊
    zsdroid
        64
    zsdroid  
       2020-04-14 19:06:47 +08:00   ❤️ 1
    我觉得如果要做出 100%的完美推荐 AI,就需要你敞开 100%的隐私。但是你肯吗?
    至少在电影里,斯塔克是 100%信任贾维斯的。
    cherryas
        65
    cherryas  
       2020-04-14 19:07:09 +08:00
    因为你没搞懂推荐系统的目的,
    推荐你需要的东西 X
    推荐你最可能买的东西 √
    limyel
        66
    limyel  
       2020-04-14 19:07:54 +08:00
    @binux 我感觉应该推其他看舞蹈区的人之后看的视频,
    ChefIsAwesome
        67
    ChefIsAwesome  
       2020-04-14 19:11:10 +08:00 via Android
    说到推荐,不得不再说说搜索。淘宝那搜索搜的都是啥玩意,牛头不对马嘴的玩意都能排前面。我就想老老实实按标题搜索都没办法。
    jinliming2
        68
    jinliming2  
       2020-04-14 19:13:09 +08:00 via iPhone
    买了个冰箱,推荐算法不给你推荐冰箱贴之类的东西,反倒觉得你还有可能再买几个冰箱……
    p2pCoder
        69
    p2pCoder  
       2020-04-14 19:16:23 +08:00
    @ChefIsAwesome 本质上已经没有纯粹的搜索了,都是搜索推荐和搜索广告
    gladuo
        70
    gladuo  
       2020-04-14 19:44:14 +08:00   ❤️ 1
    提供点信息量:
    1. 『不就是打些标签,搞个相似度匹配』,上神经网络之前可能无论你怎么努力,怎么 hack 机器给出来的标签准确率就是差,相似匹配匹配的就是不相似,真的上 nn 之后有些系统才可以说,准召能看点了
    2. 虽然大家经常说『信息茧房』,但是说穿了,你经常看的主题确实就是你喜欢、感兴趣的类型,要是给你推荐美女视频、搞笑视频你不感兴趣,没点击、播放,埋点之后是会上报算作负例的,要是你再主动搜点别的看,是可以纠正推荐的;另一方面是,如果不推荐你这些,又该给你推荐点啥呢,给你推荐点冷门的、小众的、晦涩艰深的,你真的有兴趣看吗?最多只能按『大多数用户可能喜欢』,给你推荐点 popular 的,尴尬的是小姐姐、低俗高效在全体用户群中就是主流 [摊手]
    xfriday
        71
    xfriday  
       2020-04-14 19:54:14 +08:00
    @wangyzj CNN\RNN 等就是在讲如何(维度)去 KNN 而已,我只是想表达,为啥要把“这个东西像什么”的技术冠名为 AI ?
    haruhi
        72
    haruhi  
       2020-04-14 20:38:15 +08:00 via Android
    协同过滤,大哥们…只是匹配了相同行为的人,还干了啥…然后推给你
    northisland
        73
    northisland  
       2020-04-14 20:43:11 +08:00
    這套算法,我只服谷歌

    1. 上個月家裏套套馬上沒了,YOUTUBE 精準投遞 HK SKYN 的視頻。
    2. 我配一臺 windows 開發環境,第一條搜索搜 windows 上 git 的問題,第二條剛打一個 t,馬上給我自動提示 TortoiseGit 。

    五體投地
    lostaya
        74
    lostaya  
       2020-04-14 20:50:07 +08:00
    我觉得以前的虾米音乐推荐算法是真的挺好的,不会一味的重复,每首都是惊喜
    Tunomon
        75
    Tunomon  
       2020-04-14 20:54:11 +08:00
    现在的人工智能根本不能叫人工智能,说白了就是数据统计,概率的问题。
    murmur
        76
    murmur  
       2020-04-14 21:01:51 +08:00
    @ChefIsAwesome 淘宝搜索好像劣化了,以前支持-排除,现在去掉了这个功能似乎
    Merlini
        77
    Merlini  
       2020-04-14 22:13:04 +08:00
    其实现在的推荐算法的 accuracy 有百分之几就不错了,性能也已经瓶颈了。现在比较火热的推荐系统的可解释性和多样性方面。
    wangyzj
        78
    wangyzj  
       2020-04-14 22:26:49 +08:00
    @xfriday 哈哈哈,换个词高大上,带一波节奏涨一波工资啊
    JCZ2MkKb5S8ZX9pq
        79
    JCZ2MkKb5S8ZX9pq  
       2020-04-14 22:58:54 +08:00
    考虑过这类算法,个人比较倾向于:
    找寻相似用户 -> 筛选这些用户共同感兴趣的内容 -> 移除你已经看过的内容

    但具体写的时候有两个问题
    一个是运算量很大,不是专门搞这个的,也就没怎么去优化。
    二是万一不巧,跟你共同兴趣的用户,涉猎范围就刚好都很单一,那其实还是会回到茧房。所以各种来源的配比,或者说新内容不够时候的规则,还是要回退到其它推荐内容。
    laminux29
        80
    laminux29  
       2020-04-14 23:03:11 +08:00   ❤️ 2
    针对题主的问题,一点点来回答。

    1.现在太阳系内,不存在真正的智能,原因在于两点,第一是人类科技目前没有彻底弄懂智能的运作机制,你看到的神经网络其实也只是个猜测;第二是目前设备没有足够性能去模拟智能与智能形成的环境。

    现阶段,所谓的 AI 、人工智能、机器学习,本质其实是对数据进行统计、整理与分析。这种方案,取名叫 [人工智能] 、 [大数据] 等等,更多的是出于商业目的,进行炒作,提高利润。举个例子,一道名叫 [高汤炖海鲜] 的菜,你愿意为此付多少钱?但如果改名叫 [佛跳墙] ,是不是价格又不一样了?


    2.推荐算法,针对的是大部分无脑群众。这些群众买日常的用品,还真是买了第一次,下次又会买类似产品,所以推荐算法在这个场景下,就很有效了。而买显卡这类高智商的人群,则会有自己的理性想法,不容易被推荐与广告洗脑。


    3.高薪工作岗位,并不在于该岗位一定就有啥难度,或没难度。岗位的薪水,与很多因素有关,比如稀缺性、从业人数、起步门槛等等。举个例子,安卓开发难吗?七八年前安卓刚火的时候,大部分工程师因为不喜欢风险,不知道安卓这个类别有没有前景,因此不愿意去学这个东西,导致懂安卓的人很少,因此当时安卓岗位的工资异常地高。但现在?

    另外补充一点,很多异常高薪的岗位,并不是这个岗位有多少技术含量,而是这个岗位要能为公司:
    提出问题、解决问题、带队(管理)、人脉关系。

    这 4 点,单独一两点,还比较容易,能通过努力去达到。但如果一个人要同时满足这 4 点,那就不是纯粹的努力就能办到的了,除了努力,更需要机遇与运气。所以,超高薪岗位,比如 XX 经理、XX 总监等岗位的本质,更多的在于运气。

    最后,别想太多,保持心态,脚踏实地。小富靠勤,大富靠命。
    optional
        81
    optional  
       2020-04-14 23:05:51 +08:00 via iPhone
    各种推荐算法,参数都有 abtest 的,结果就是相对最优的。
    irgil
        82
    irgil  
       2020-04-14 23:30:48 +08:00
    @loryyang 终于看到一个懂行的了
    binux
        83
    binux  
       2020-04-15 00:15:47 +08:00 via Android
    @limyel #63 那当然还是舞蹈视频了,人的爱好各不相同,如果跳出舞蹈区当然也会看不同分类的视频。但无论如何,都不会有舞蹈视频的比例高。
    就算是个人都明白的道理,机器统计分析之后会不明白?
    fuermosi777
        84
    fuermosi777  
       2020-04-15 00:33:46 +08:00
    我是油管的内容组的工程师,就是 lz 说的年薪上百万都在忙啥的那种。我可以明确告诉你我们的产品绝对不是“像是一个根据标签模式匹配的玩意,谈不上什么智能“或者“打些标签,搞个相似度匹配”的玩意。算了,说了你也不懂。
    CoderGeek
        85
    CoderGeek  
       2020-04-15 00:42:09 +08:00
    标签 模型 矩阵 打分 大数据的 bi 后 实时分析 离线 加协同过滤
    说是 AI 还因为 gj zz 等因素需要加强人为操作 不加人为百分百出问题
    比如我就知道某浪 就有 zf 资讯类人员常驻...

    比如 1 楼说的某音渣浪 都是行业佼佼者
    但是我这里吐槽一下网购 馬不要了 你那个叫推荐嘛?想钱想疯了
    我这几年是真的讨厌网购 零售行业这方面简直 low 到地底

    有句话赚钱的都写在...上 迎合市场 时间久了还是俗气 就是转化率变现了
    公司要挣钱 DAU MAU UV PV KPI 没的说
    谁能告诉某手和某音的区别吗 为了生活

    肯定有想楼主一样想法的 肯定有
    但是难听点还是要恰饭的嘛
    jugelizi
        86
    jugelizi  
       2020-04-15 00:45:13 +08:00
    买避孕药的推荐避孕套
    买奶粉的要推荐尿不湿
    CoderGeek
        87
    CoderGeek  
       2020-04-15 00:45:37 +08:00
    我说下 我前一分工作 四年 IP 类的 从初创干到 b 轮 从 bi 一点点打标 上协同 实时 离线 冷启动
    包括 主编 老板 产品 提升体验 优化 > 数据 数量 提高变现 付费权重 经历过 才会知道
    有的时候被这些信息喂养到底是好是坏
    CoderGeek
        88
    CoderGeek  
       2020-04-15 00:59:02 +08:00
    再加一下 大流量的平台不仅仅从用户盈利
    部分变现能力是入住的比如大 V 比如营销号这类
    还是为了恰饭 推游戏 贷款 商品的 AD
    又引起一波不适 比如 手机一屏 feed 10 条
    早期为了用户体验 10 都是符合用户兴趣的 (虽然符合 但是肯定标题 暗示类少不了)
    慢慢为了提高体验 改制 3 条 人工加权 5 条 用户兴趣 2 条其它热门
    ...再慢慢变为
    上来就是一个 人工加权指定 2 条兴趣 1 条 AD 一条推广软文...
    如果 feed 变短 插入图片 你的第一屏有可能就是上面那些 AD 有权重的软文 然后 兴趣 热门这样

    其它的我再啰嗦一些 可能大家没啥兴趣
    标题党 暗示类 你如果和我类似只需要看自己想看的 屏蔽点多了拉黑多了就发现
    你刷个一段时间后 重复内容 低质量内容就来 因为你范围太小了 毕竟这东西是服务大部分人的
    然后卸了 app 不登录 换设备 不登录 又给你重来一遍
    levelworm
        89
    levelworm  
       2020-04-15 01:01:26 +08:00 via Android
    @fancy111 不知道就对了,干嘛推荐给我呢?直接问我不就行了吗?一定要猜,猜出来的惨不忍睹。。。其实我觉得这些完全没必要,现在没必要将来也没必要,赶紧开除这帮人省省钱是正道。就给我一个搜索框就行了,别折腾有用没用的了。。。
    levelworm
        90
    levelworm  
       2020-04-15 01:04:44 +08:00 via Android
    @zsdroid 问题是我不需要他推荐,没有选项把这个关闭那只能喷了啊。
    levelworm
        91
    levelworm  
       2020-04-15 01:08:30 +08:00 via Android
    @optional 然后实际上业务强度大,纯净的 abtest 其实很不好做。
    systemcall
        92
    systemcall  
       2020-04-15 02:52:38 +08:00 via Android
    因为所体现的问题,解决带来的收益小。
    比如电商,那种不经常购买的设备反复推荐意义不大,但是专门再做一套并不能带来很多收益。真正反复购买的东西才是主要盈利。
    广告是不会关的,不然怎么赚钱? feed 肯定要加广告的。
    至于为什么不能改为不定向推荐,这个确实不太清楚,为了 KPI ?至少 google 和 ms 的广告 id 可以重置和改为不定向推荐吧。
    如果是娱乐平台,感觉大部分人都用的很舒服,而且你逛久了会发现国内的互联网很多方面的东西很浅,这几年很多地方越来越浅。以前一般也是有个固定的圈子,比如 0 几年的时候一个论坛基本上一类东西,用户也类似。很多平台自己就几年的寿命,在生命周期内现有的推荐算法并不会引起很多用户反感,这样做足够了。
    laqow
        93
    laqow  
       2020-04-15 03:04:36 +08:00 via Android
    可以,但是没必要
    zenithar
        94
    zenithar  
       2020-04-15 03:23:35 +08:00
    实在找不到维持泡沫的风口强行造出来的呗,我大学那会儿 AI 的定义还是真·人工智能呢,后来除了阿尔法狗以外,菊花所谓的 AI 相机也就自动上个美颜滤镜就 AI 了。
    dartabe
        95
    dartabe  
       2020-04-15 03:52:49 +08:00
    instagram 也不行啊 全都推荐的网红
    optional
        96
    optional  
       2020-04-15 08:28:16 +08:00 via iPhone
    @levelworm 这个场景下 abtest 很好做
    goodboy95
        97
    goodboy95  
       2020-04-15 09:44:16 +08:00
    某条某音不好评价,但某宝是真的智障,不知道自己的定位就瞎套 AI,起码买了某个商品之后就应该知道要把该商品剔除掉吧
    FFFire
        98
    FFFire  
       2020-04-15 09:49:04 +08:00
    @hoyixi 诶,可不敢乱讲
    soulmine
        99
    soulmine  
       2020-04-15 10:32:47 +08:00
    你都不知道你自己喜欢什么 指望 AI 知道? AI 是神么?
    zaul
        100
    zaul  
       2020-04-15 10:52:06 +08:00
    @hallDrawnel 它以为你买显卡挖矿
    1  2  
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   5353 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 29ms · UTC 08:44 · PVG 16:44 · LAX 00:44 · JFK 03:44
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.