小白求推荐人工智能学习路线和教程

272 天前
 bright0908
原本是 Java 开发,公司因业务转型,打算做大模型、人工智能方面,各位有没有这方面的学习路线和资料推荐下
4112 次点击
所在节点    Python
25 条回复
NoOneNoBody
272 天前
好多模型人家都弄好了,写个程序其实不难,不怕见笑,我只会抄
例如 sklearn AgglomerativeClustering 聚类核心代码就两行
agglomerative = AgglomerativeClustering(n_clusters=n_clusters)
clusters = agglomerative.fit_predict(scaled_weighted_features)
但是大量的工作是怎么整理数据符合 fit_predict 的要求,还有就是跑一次可能很耗时,如果结果不理想,就要重新组织数据再一次,再一次,再一次……

更多的工作在查错,因为数据量太大,你搞不清是哪一个样本出错的,或者是怎样的错误
例如跑着跑着断了,报错是维度不一致,想维度问题其实是想不通的,一般数据都是批量处理的,不会出现单个数据维度异常,其实更大可能是某个数据为空或者 np.nan ,模型优先“检查维度”导致报错是维度不一致
原始数据不为空,但一些转换处理会导致部分变为空,例如 rolling 移动窗口首尾有窗口不够的问题,diff 左右值求差必然少一个,过滤数据后忘了“补齐”或“对齐”……诸如此类

还有前面说的 float 类型的事,数据没错,程序逻辑也没错,就是跑起来就报错,因为 pytorch 默认 float32 ,但 numpy 默认 float64……破,搞了我几个小时,一直以为数据错了
如果用到 numba 加速的话,类型也是大问题

个人建议 numpy/pandas 还是要熟,有批量转换和查找的能力,“查找”就是定位,找到哪一行哪一列的数据

我近半年写的代码,写出来都是很快,随机模拟生成数据都能跑,就是用实际数据就断,估计近半时间都是在花类型的查“错”上
bright0908
272 天前
@hardto #20 主要是给矿上做的产品,类似于盘古大模型这种
bright0908
272 天前
@ShadowPower #13 好的,多谢老哥
bright0908
272 天前
@NoOneNoBody #21 收到😺,多谢老哥给的经验
dayeye2006199
272 天前
学好英语,好好做 prompt

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/1018376

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX