有朋友在追一科技或者其他国内的 NLP 创业公司待过的嘛,想问点事儿

2023-02-06 13:48:28 +08:00
 FelixBoom

ChatGPT 都通过谷歌 l3 面试了==。想了解了解国内自然语言这方面的进展啊,感觉最近几年要不就是停滞要不就是搞元宇宙才冒出来一下... 有朋友在追一科技或者其他国内的 NLP 创业公司待过的嘛,想问问有亲身经历的朋友,国内的同类公司或者实验室项目的阻碍在哪儿。 谢谢啦,不胜感激!

2522 次点击
所在节点    程序员
22 条回复
mk3s
2023-02-06 15:04:37 +08:00
我同学哈工大研究生毕业去了追一,然后就跳到百度了,据说追一有股权,但是少得可怜,她说搞 ai 大部分难都难在落地,且国内的公司都在追求盈利,虽然无可厚非,但就和这个公司的名字一样,永远是追随者,无法成为领头羊
monkeyzsf
2023-02-06 15:31:46 +08:00
曾经的某智能客服,数据统计属于其他( 5 年前):
很难落地盈利,甚至于 AI 业务是靠着其他业务来养活的。
很搞笑的是经常要求 1 周做个 demo 出来给客户看,去谈合作啥的。(不到 10 个人的技术团队 1 周能做出啥来)
国内大部分都在做垂直细分领域的智能,比如某个做淘宝电商女装的智能客服,大部分公司都是基于海量数据来提炼答案,也就是需要所谓的知识工程师录入问答数据啥的,科大讯飞早期也是这样搞的,录入员很多很多,现在不清楚了
lrigi
2023-02-06 15:38:04 +08:00
没呆过 nlp 公司,甚至不是做 nlp 方向的。
指望创业公司不如指望大厂,但感觉大厂缺少一点砸钱探索未来的魄力,只能跟人家后面走。
GPT3 成本快 3000w 美元,一万张 GPU ,国内有这个资源的屈指可数。
机器之心看到在这方面国内已经落后两年了,智源这种最有希望出一个吧(国内 nlp 危
20112019
2023-02-06 17:13:19 +08:00
搞过 nlp,目前国内对于 ai 整体来看,倾向于追(或者说抄),毕竟模型或者大致的 idea 开源之后,再自己搞点魔改,然后用业务数据跑跑就能用,为啥要自己从头到尾搞?目前的症结在于小公司有胆量,可能也有点技术,但是一没数据,二没钱或者说钱不够。大公司要么躺平怕危险目前核心业务,要么不愿意花钱养着高成本团队做短期出不了效益的事。说实话,国内做 ai 要感谢这一波 aigc 和 chatgpt ,直接替很多公司续了命,毕竟美国那边认可了烧钱能出成果,那么国内这帮创业公司就会被认可烧钱的意义,不然也是一地鸡毛。
FelixBoom
2023-02-06 17:24:13 +08:00
@mk3s 感觉国内的投资逻辑和美国很不一样,这对这种前期难商业化的公司头疼的很.. 不过百度准备下个月发的那个,谨慎看好==,AIGC 那个就够烂了..
FelixBoom
2023-02-06 17:27:51 +08:00
@201120 小公司没数据这个事是不是很要命啊,也想问问目前有啥值得关注的 npl 的初创公司或者团队嘛
FelixBoom
2023-02-06 17:29:09 +08:00
@monkeyzsf 这也是在追一吗
20112019
2023-02-06 17:34:39 +08:00
@FelixBoom ai 界有个词,叫大力出奇迹。算法能够提高上限,但是模型的下限是数据确定的。为啥国内很多做垂直领域的 ai ,他们难道不想做通用的吗,没钱没数据才是关键。尤其是通用大模型,数据量少了,你怎么覆盖边界情况,想想也不可能。初创不清楚,目前已经换到工业互联网赛道。不过整体不看好国内 nlp 方向,倒是觉得 cv 方向有点东西。
gezimonkey
2023-02-06 17:50:16 +08:00
国内 NLP 环境很差,小公司没钱没数据,起步都很费劲,并且中文环境现在能讲的真话太少,导致大量反讽,识别很差
mk3s
2023-02-06 18:05:27 +08:00
@FelixBoom 国内目前大部分人都还在为生活奔波,长期目标持续投入只停留在国家战略层面,也许等我们都老了,可能就稍微有点改观了呢,还是先从自己开始改变吧,说不定就能影响到周遭然后获得意想不到的成就呢~
monkeyzsf
2023-02-06 18:23:13 +08:00
@FelixBoom 不是,同行,现在死掉了
dlsflh
2023-02-06 19:09:11 +08:00
内容农场能训练出什么好模型?
opentrade
2023-02-06 21:37:21 +08:00
@gezimonkey 观点新颖
David1119
2023-02-06 23:31:08 +08:00
ChatGPT 一出,搞 NLP 的估计想死了,学了多年的知识分分钟被迭代了
FelixBoom
2023-02-07 16:53:29 +08:00
@20112019 确实,无限的数据和钱的苦功.。CV 至少一眼能看到落地场景,通用 AI 太难找钱了..
FelixBoom
2023-02-07 16:54:18 +08:00
@gezimonkey 起步大概需要个什么规模的钱和数据啊
FelixBoom
2023-02-07 16:56:56 +08:00
@monkeyzsf 所以你们原来是想做通用然后调整到智能客服这个垂直领域吗,还是一开始就
FelixBoom
2023-02-07 16:57:40 +08:00
@David1119 物理学不存在了.JPG ==,
gezimonkey
2023-02-08 09:48:18 +08:00
@FelixBoom 几百万人民币总是要有的,数据的话就不好说了
FelixBoom
2023-02-10 15:28:34 +08:00
@mk3s 冒昧,能不能问问你这位从追一去百度的同学的联系方式啊,myfelix177 这是我微信。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/913587

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX