ChatGPT 能干审核员的活吗?

18 天前
 coolqoo

我最近把每天常看的论坛/公众号/博客里的更新内容全扔给 ChatGPT , 让他帮我挑一些高质量的推送到 TG ,水文扔垃圾桶。

我写的提示词如下:

You are an AI content evaluator. Your task is to evaluate the quality of web content based on the following criteria and return the results in JSON format. The JSON should contain the webpage title, content quality score, and a summary of the content.

Evaluation Rules:
1. The total score is 100.
2. The higher the content quality, the higher the score will be.
3. Prioritize content related to money-making techniques/ideas and top-notch technology.
4. If the content is an advertisement, the final score will be the content quality score multiplied by 0.35 (i.e., 35%).

Please follow these steps:
1. Read the content of the webpage.
2. Evaluate the content quality based on relevance, depth, accuracy, and usefulness, particularly focusing on money-making techniques/ideas and top-notch technology.
3. Check if the content is an advertisement. If it is, adjust the final score accordingly.
4. Provide a brief summary of the content in Chinese.

Return the results in the following JSON format:
{
  \"title\": \"Webpage Title\",
  \"content_quality_score\": FinalScore,
  \"summary\": \"内容总结\"
}

Example:

{
  \"title\": \"How to Make Money Online: 10 Proven Methods\",
  \"content_quality_score\": 85,
  \"summary\": \"本文探讨了十种行之有效的网上赚钱方法,包括自由职业、联盟营销和网上家教。每种方法都有详细说明和实用技巧。\"
}

Here is the webpage text for evaluation:
Title:[文章标题]
Content:[文章内容]

Output:

我定的规则是 30 分以下垃圾箱,70 分以上推 TG 。 运行了一周发现 TG 收到的文章里也有垃圾广告,垃圾箱里也有我非常想看的内容。

我总结我这套流程不成立的原因可能有 3 个

  1. 提示词写的不行
  2. 发给 AI 的内容没经过处理(我直接发了网页的 innerText )
  3. ChatGPT 干不了这个

我推测大概率是 3 ,因为提示词改了挺多的,而且每次 AI 针对相同内容返回的质量评分都天差地别。最恶心的就是 AI 会莫名其妙说它回答不了有害内容。

求懂的大佬们指点一二

1996 次点击
所在节点    奇思妙想
14 条回复
PluginsWorld
18 天前
优化你的评估示例。吴恩达相关的课程我印象中有讲到这个。
GeruzoniAnsasu
18 天前
TimePPT
18 天前
就提一点,用做比较的方法替代打分,让模型打分跟抽盲盒效果差不多
yinmin
18 天前
( 1 ) api 可以递交多轮对话,你模拟多轮对话的方式加入几对打分示例
( 2 )改用 gpt-4o ,如果觉得贵也可以改用国产大模型试试(例如:deepseek v2 、qwen-1.5-110B 、零一万物 yi-large-turbo ),高阶的国产大模型能力接近 gpt-4 ,价格接近 gpt-3.5
yinmin
18 天前
另外,多轮对话形式的“一个 prompt+多组模拟问答”的效果,远好于“写在一个 prompt”
ogli324
18 天前
em. 想评价一份博客或者文章是否高质量 感觉很难,不如做一些文章打标签 提取文章核心信息 在文章前部分加入前言这种 另外我记得 tg 好像支持评价吧,如果推送后连续收到不好反馈及时撤回下架?
unii23i
16 天前
gpt 审核不出敏感词吧
zhangH258
15 天前
@TimePPT 比较的方法是指给更多示例?
TimePPT
15 天前
@zhangH258 就是让模型选 A 好还是 B 好,不要给单独例子打分,比较法会更加稳定,打分大概率幻觉
zhiyu1998
15 天前
B 站不久生产使用了一次了吗,然后很多进击的巨人就爆出来,还有其他一些之前 2014 年才有的 B 站动漫
neptuno
14 天前
用的模型名称是什么
rekulas
13 天前
你需要拟定多轮+多角色的方式(类似 langchain 这样), 而不是指望一个 prompt 就解决你的问题, 用多种角色来协同评分,还应该加上最终审查之类的角色, 并且如楼上所说先提取大意作为输入, 我想这样效果会好不少
JoryJoestar
13 天前
先下个结论:能肯定是能,而且我还能介绍几个给你,一个是 Redfeed ,好像是 AI 审核的,高质量推送的
1. 需要精准,结合 RAG ,不然像你说的敏感词这一步,你就寄了。
2. 提示词,不要一步到位,需要分任务,比如说第一步:先码掉敏感词;第二步:提取核心信息,如果你有特别关注的,你也可以使用 RAG 匹配。第三步:根据第二步和原文,给文章打分,写好评分规则。第四步:分数通过,则推送。还可以做更多:帮你总结成一段,然后推送原文。
JoryJoestar
13 天前
@rekulas 层主说的很对,偏 AI Agent 方向走

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/1048016

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX