新来 v 站提问,主要是找不到合适的群问这个问题。如果有不当行为请及时指出。
一直对聊天机器人没什么感觉,因为一方面不缺情感寄托,一方面也习惯于在办公时用传统搜索引擎获取知识和技巧,大语言模型的两种用途用不上或者有平替。
但听了一期《原来是这样》与机器人对谈的节目 之后突然感觉,这种新型的智能语音助手是没有平替的,有了它我可以在通勤和散步的无人路上听一个概念如何拆解,也可以在和人争论的时候迅速叫出语音助手搜索概念,类比一个博学的同行者。
去年对大语言模型热没有特别关注,但是知道 product hunt 和很多平台都上线了大量衍生产品,感觉总有一个适合这个需求的吧。毛估一下,也就是那些问答模型联网加上语音识别加上语音生成,技术上也没有大问题。
看了下 v 站有一些老帖做过类似产品,例如 https://global.v2ex.com/t/939914 和 https://www.v2ex.com/t/923438 ,不过好像都没做下去。我其实还挺喜欢第二个链接的阅读助手的概念的,现在在听一本由 tts 转的 ePub 书,里面每个注释处只会念一个数字,如果可以打断朗读问注释内容会很有趣。另外就是一些科普类文章和论文也可以追问。不过现在好像都没做下去。
我想象中的这类智能助手,应该能正确进行语音交互,可以随时打断,并且能联网,能通过某种方式给出链接以待确认。最好还能念书和查询书中内容。形式可以是 app ,甚至群机器人、电话客服。
问问万能的网友有没有类似的产品呢?