@
pengtdyd lbs: location based service, 用在业务场景里,就是根据访问者设备的一些地理位置特征,比如通过基站、wifi 、网络 ip 等综合得出此设备所处的实际物理位置,甚至可以得到具体的经纬度坐标(注意国内经纬度应用通常存在故意混淆的偏差)。这个访问地址,就可以帮助 App 和应用程序快速给用户反馈。
举个例子,打开外卖软件,外卖软件会推荐周围的可以点餐的餐厅,这就是自动根据你的地理位置计算得出的。如果你在系统里把他的地理位置权限关掉,他就做不到了。
NER: named entity recognition, 命名实体识别。 实体在自然语言分析行业中,可以理解为一个物体,一个对象,可以是具体的也可以是抽象的。在给定的条件下,例如我指明“苹果”是一种水果的名称,那么 NER 就是从文本中,抓到指代“/水果/苹果”的实体词条出来(并且尽量避开手机品牌“苹果”)。 比如“苹果必须削皮吃吗”, 这里就应该识别;“苹果手机啥时候发货”,这里就不能识别。
这种识别和 chatgpt 是类似的,本质上是一个数学概率和逻辑关系的模型,中间也需要很多的人工标注,可以认为是有间监督的机器学习。
---
@
SZhan 这就是 toG 业务的难点了,屁大点预算想发射卫星。我建议在 Github 上找点开源的模型工程(开源大模型,或者开源的 NLP 功能挂件、分词器。),然后搞一个文本地址库做三元组数据库,写一个强匹配的规则引擎,直接用前面的地址文本库做文本相似度匹配,给出 1-2 个结果,让操作员自己去选最后的结果。
毕竟只设计地理位置这一个领域的文本数据,准确度是可以达到一定程度的(但按照我的经验,到 90%就不错了)
什么大模型计算,让对接业务的销售去吹:得加钱。
注意,地址库每年都会有一些变化,比如上面回复的统计局地址,其实都是有过期消息的(毕竟是 年度的),如果用了这种方案,后面更新也得注意,省得被那边客户骂。(同样,得加钱)