没人把小红书的数据爬下来,然后微调一个帮助写文案的垂直 gpt 吗?

2023-04-13 05:10:18 +08:00
 Weixiao0725

最近几天看了几位老哥分享的用自己的知识库微调的模型,看起来很靠谱的样子。所以产生这个想法。

4963 次点击
所在节点    奇思妙想
17 条回复
wy315700
2023-04-13 07:11:24 +08:00
很刑
haimianbihdata
2023-04-13 08:35:05 +08:00
微信公众号。月小水长
diagnostics
2023-04-13 09:22:21 +08:00
+人们,离谱大事件,有个下头 it 男竟然要用我们的话来生成 AI 模仿我们。
diagnostics
2023-04-13 09:22:48 +08:00
爬虫犯法吧?
Sting1226
2023-04-13 09:57:57 +08:00
@diagnostics #3 又小红薯那味儿了。
mrochcnnnnn
2023-04-13 12:18:17 +08:00
这个事情是不是只能小红书做
ashone07
2023-04-14 08:23:01 +08:00
感觉小红书很多内容是文字嵌在图片里的
xieqiqiang00
2023-04-14 17:42:51 +08:00
@diagnostics 家人们谁懂啊
jayin
2023-04-15 19:58:18 +08:00
当然可以。问题是小红书很难爬。
felixlong
2023-04-15 21:11:56 +08:00
做这个的当然是偷偷做了。谁会傻到说出来。OpenAI 都不敢公开他们的训练数据源。
huzhizhao
2023-04-17 02:13:19 +08:00
家人们,谁懂啊……
leefor2020
2023-04-17 13:39:32 +08:00
家人们,咱就是说一整个大无语住了,竟然有人想要爬我们的私密信息,蒸虾头!
sL83OdzP0RtI2l31
2023-04-17 18:00:58 +08:00
有的 我对象天天用这个
PerFectTime
2023-04-18 22:56:17 +08:00
爬那辣鸡玩意干啥,全自动女拳机器人?
kaddusabagei38
2023-04-20 09:29:33 +08:00
制造一台造粪机器?
lchynn
2023-04-24 21:06:36 +08:00
@ashone07 先 OCR + 图像目标检测 ,然后分离出来的再做训练。或者直接丢给支持多模态学习输入的 GPT 4 ?
skysmile
2023-06-06 10:39:22 +08:00
@xinchao 你对象用的 能不能推荐下呢

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/932106

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX