大模型 Tools(Function Calling)实用性分析 - 以媒体信息解析为例

98 天前
 marquina

作为一个喜欢收集影视资源的人,笔者面临的一个任务是:从文件名中解析出格式化的媒体信息(信息源统一为The Movie Database (TMDB)),方便整理文件,如:

文件名 格式化信息
Young.Woman.and.the.Sea.2024.2160p.DSNP.WEB-DL.H265.HDR.DDP5.1.Atmos-ADWeb.mkv {'title': '泳者之心', 'genre': 'movie', 'year': 2024}
[動畫瘋] 物語系列 第外季&第怪季[9][1080P].mp4 {'title': '物语系列', 'genre': 'tv(anime)', 'year': 2009, 'tv_season_num': 5, 'tv_episode': 9}

那么,在给定文件名的情况下,怎么用大语言模型( LLM ,以下简称大模型) + TMDB API 来完成媒体信息的解析工作呢?这篇文章应运而生。

当然,解析媒体信息 + 整理媒体文件(或者说媒体文件刮削),已经有很多现成的解决方案,如nas-toolsjellyfin,笔者更多是想探索大模型的可能性。


"太长不看"的总结:


原文链接:大模型 Tools(Function Calling)实用性分析 - 以媒体信息解析为例 - OrangeWolf 的博客

878 次点击
所在节点    OpenAI
4 条回复
anonydmer
98 天前
看了原文,挺好的,楼主可以再加个 kimi 的测试一下,它有一个原生 JSON Mode 的功能
TimePPT
98 天前
实体抽取输出 json 现在 gpt4o 有 json schema 模式
neteroster
98 天前
4o mini 也可以传 json schema
marquina
98 天前
@anonydmer #1
@TimePPT #2
@neteroster #3
其实文章围绕的点是“如何更好地让大模型调用外部函数”,是否用 json mode 区别不大😂

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/1074588

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX