用 Python 把微博数据绘制成一颗“心”

2017-02-17 21:10:14 +08:00
 lzjun

把自己发的微博爬下来,用 numpy 和 matplotlib 绘制而成图片,图片中的文字是微博中出现频率最高的词语

完整代码:https://github.com/lzjun567

创意思路:http://mp.weixin.qq.com/

4806 次点击
所在节点    Python
9 条回复
keisuu
2017-02-17 21:21:49 +08:00
不明觉厉
zzcchh
2017-02-17 21:28:58 +08:00
哥们,真 666
qingshi
2017-02-17 22:02:52 +08:00
分词是怎么处理的?
kuntang
2017-02-17 22:05:43 +08:00
@qingshi 看代码是结巴分词
lzjun
2017-02-17 22:41:52 +08:00
@kuntang 是用的结巴分词,不过它的局限在在于没法处理 HTML 标签。论英文分词还是 Java 中的 Lucene 牛
willhunger
2017-02-17 22:59:59 +08:00
挺有想法的
coolloves
2017-02-18 14:09:24 +08:00
马克下
yanzixuan
2017-02-19 09:02:16 +08:00
@lzjun 为啥要处理 HTML ,用 bs4 直接 text 过滤掉啊。
mingyun
2017-02-19 13:17:10 +08:00
$ python heart.py
Traceback (most recent call last):
File "heart.py", line 9, in <module>
from scipy.misc import imread
File "d:\python3\lib\site-packages\scipy\__init__.py", line 61, in <module>
from numpy._distributor_init import NUMPY_MKL # requires numpy+mkl
ImportError: cannot import name 'NUMPY_MKL'


这个怎么办?

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/341280

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX