如何做一个分析足球转会概率的网站?

2015-05-26 10:17:53 +08:00
 sicongliu
目前比较流行发布足球转会概率的网站是德国的转会网 (Transfermarkt.de).
德国《转会市场》网站(TransferMarkt)科普贴

其工作原理是由各个俱乐部的数据员手动填入转会目标并估算概率,主观性非常大。最近学习python的爬虫和nltk,突然有个想法能否用爬虫爬下世界几大主要的转会新闻发布媒体(德国kicker,图片报,法国队报,goal,espn,sky,马卡等等大概15个)每日的转会新闻(假设只针对五大联赛),不知道如何用nltk对数据进行分析自动计算转会概率?例如可以从新闻相似度以及报道频率以及媒体可信度(比如队报的新闻比马卡可信)。
4069 次点击
所在节点    Python
22 条回复
imn1
2015-05-26 10:20:19 +08:00
人心不可测
13k
2015-05-26 10:23:48 +08:00
球员上场时间 -_-!
justfindu
2015-05-26 10:28:45 +08:00
学习了爬虫 再学习语义解析 情绪分析 再学习机器学习 最后判断概率
这样你就可以运用到其他方面了 比如股票 比如大事件
最后你就可以搞大数据预测
分分钟上百万了哦
fxxkgw
2015-05-26 10:40:28 +08:00
楼主你先分析下舜天的孙可会不会转会,最有可能转到哪里
力帆的张池明被恒大挖走的概率多大
张稀哲继续留在狼堡的概率多大,许尔勒呢?
最后最后 贝尔呢
国安傻逼
northisland
2015-05-26 10:56:43 +08:00
从折腾的角度来做这事儿,用bayesian theorem做:

最开始从球星这个赛季的表现来看,是否可能因表现不好或表现太好而被甩卖~(是否有转会传闻)
作为启动判定的条件,既p(x)

第一步接受俱乐部属性入手:
皇马喜欢买白人,巴萨喜欢烤肉帮锋线,拜仁爱挖德甲联赛,阿森娜擅长甩卖队长,A米只问是不是0身价,(利物浦喜欢甩卖巨星然后买一堆刮刮乐~~这点纯属逗乐)
作为条件密度分布p(x|c)

然后看转会俱乐部是否需要那个类型的球员,估算出先验概率p(c)


用MAP求解p(c|x)
em70
2015-05-26 11:04:41 +08:00
这个可能得大数据分析,不能只靠新闻,比如球员得上场时间,状态,绯闻,以及过往的转会规律,建立复杂的数学模型,难点在于很多统计数据不能通过公开网络拿到.

我觉得你可以换个方向,去研究足彩赔率,预测一下胜负比较有价值,足彩盘口数据是公开的
49degree
2015-05-26 11:07:40 +08:00
我只想问,得出这个数据有什么意义呢?
jacob
2015-05-26 11:07:42 +08:00
我对这个很有兴趣,不过这个东西不会受欢迎,因为百分之80的球迷都是煞笔.别问数据哪来的,就跟贴吧百分之90都是垃圾一样,没人统计,但数据差不了多少一样.

我第一想法是这样的:
1.球员加盟队伍时间.
2.球员出场时间
3.球员传出要转会的新闻
4.球员身价
5.目标俱乐部平均转会价格
6媒体报道时间
7.报道频率
8转会期

低身价球员意味着可能一个新闻就转出了,而高身价球员往往有炒作的可能
低出场时间可能是主力替补,不一定就会转会.
3无球员可能主力销售,比如张稀哲.


另外,目标球队通常要传出转会动作,否则可能是烟雾弹,该目标球队可能被人当作抬价工具,
northisland
2015-05-26 11:11:07 +08:00
@northisland
MAP那段说错了,MAP是求解模型内部参数的方法,这里只用把p(c)和p(x|c) 乘起来就好了~
guotie
2015-05-26 11:36:14 +08:00
吊炸天。
Maltazard
2015-05-26 11:50:53 +08:00
关注下~自己也有类似的想法,觉得情绪分析是个很有趣的方向~
zichen
2015-05-26 12:07:07 +08:00
其实感觉影响足球转会的就四个因素,只不过怎么根据这4个因素得出一个通用的公式是个问题:
对于卖方:球员愿意走,球队愿意卖。
对于买方:球队愿意买,球队买的起。
shoumu
2015-05-26 12:14:53 +08:00
补充一下,球员与其它俱乐部的贡献频率,再加上情感分析的一些内容
jyootai
2015-05-26 12:35:14 +08:00
要估测一个球员的转回概率是很复杂的事情
1,球员自己的意向
2,俱乐部当前的形势,包括经济、政治、球队风貌
3,球员经纪人的态度
4,球员的家庭
5,其它有哪些俱乐部是对此球员有意向,并且哪家俱乐部相对有优势
……

以上只是其中要分析数据的一部分。还有看哪些因素占主导作用

比如当前巴萨大脑哈维,俱乐部是想继续续约的,但哈维自己不愿意,想功成身退去卡塔尔,在转会上这就是球员自己的意向占主动作用。

又如尤文天才博格巴,现在几大豪门都在争抢,皇马、巴萨、曼联、枪手、巴黎等,但他本人的意向是巴萨,想去和梅西踢球,不过最终的结果权还是在尤文,尤文会不会放人,而俱乐部放不放人的第一指标当然是谁给的价格高就放给谁,所以这又是是俱乐部的形势决定。

终上, 要估测一个球员的转回概率还的仔细分析,并不是一件简单的事,更不是光抓取各大网站的消息就行的,这些站点也是一些小道消息,除非有俱乐部或球员自己发布新闻发布会出来的消息
JConlee
2015-05-26 12:37:50 +08:00
不如研究一下FM的算法。。。
staticor
2015-05-26 12:39:15 +08:00
关注曼联的新闻挺多的, 到现在还拿不准德赫亚今年走不走.
loratadine
2015-05-26 12:40:54 +08:00
最后做出来也没有消息灵通的媒体靠谱..
TingHaiJamiE
2015-05-26 12:48:46 +08:00
楼主你先人肉分析一下吴曦有没有可能回家?
wizardoz
2015-05-26 13:07:37 +08:00
你先把算法解决了,再来考虑网站的事
foyu
2015-05-26 14:27:38 +08:00
@northisland 喜欢烤肉帮的是小国际好吗

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/193740

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX