V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
推荐学习书目
Learn Python the Hard Way
Python Sites
PyPI - Python Package Index
http://diveintopython.org/toc/index.html
Pocoo
值得关注的项目
PyPy
Celery
Jinja2
Read the Docs
gevent
pyenv
virtualenv
Stackless Python
Beautiful Soup
结巴中文分词
Green Unicorn
Sentry
Shovel
Pyflakes
pytest
Python 编程
pep8 Checker
Styles
PEP 8
Google Python Style Guide
Code Style from The Hitchhiker's Guide
mjc0608
V2EX  ›  Python

求数据可视化大作业的 idea

  •  
  •   mjc0608 · 2015-08-04 22:48:33 +08:00 · 4579 次点击
    这是一个创建于 3434 天前的主题,其中的信息可能已经有所发展或是发生改变。

    暑假大作业,已经疯了。关键是要求要有“意义”,数据至少二维,要能反映一些问题,数据类型来源不限。。。然而没有主题啊啊啊啊啊啊。可以调用任意api。。。

    19 条回复    2015-08-05 22:48:32 +08:00
    minvacai
        1
    minvacai  
       2015-08-04 23:01:54 +08:00   ❤️ 1
    首先去租一个vps,然后搭一个网站,再然后你马上会发现在每次登录的时候系统都会提示你有很多的试图登录你的网站未遂的消息,一天能上千的样子……于是你就可以把这些登录企图的IP和时间从日志里扒出来,看,这就二维了吧?再写个程序根据IP查询所在国家地区,不就可以可视化了?

    最后,我考虑要不要向你安利一下我在digitalocean的推荐链……
    mjc0608
        2
    mjc0608  
    OP
       2015-08-04 23:09:06 +08:00
    @minvacai 你很有想法啊。。。然而什么样的网站一天能上千。。。虽然我正好有台闲置的do主机。。。
    minvacai
        3
    minvacai  
       2015-08-04 23:12:16 +08:00
    @mjc0608 我也不知道为什么会这样啊……我站建得少,隔一夜登上去一看吓了个半死
    好吧,如果你不喜欢这个点子,我还有很多乱七八糟的主意,比如说国家统计局的人口数据,再有就是公共卫生科学数据中心,有各种疫源地的统计表,excel格式,地址见http://www.phsciencedata.cn/Share/index.jsp
    armysheng
        4
    armysheng  
       2015-08-04 23:15:57 +08:00
    UCI 的machinelearning dataset
    mjc0608
        5
    mjc0608  
    OP
       2015-08-04 23:16:31 +08:00
    @minvacai 前几天再apistore的api简直疯了
    minvacai
        6
    minvacai  
       2015-08-04 23:27:34 +08:00
    @mjc0608 百度的那个apistore?
    ooxxcc
        7
    ooxxcc  
       2015-08-04 23:31:56 +08:00
    股票。。。。
    riaqn
        8
    riaqn  
       2015-08-04 23:34:55 +08:00 via iPhone
    LZ是SJTU大一,作业是rr布置的暑假大作业?
    chengzhoukun
        9
    chengzhoukun  
       2015-08-05 00:12:58 +08:00
    统计局或者那些经典的数据集比较好获取,但是我觉得那东西很无聊,可以获取社交网站或者电商的数据(爬虫或者别人公开的数据)然后自己清理、建模、可视化啥的
    对了,kaggle上有很多有意思的数据和题目
    master13
        10
    master13  
       2015-08-05 08:37:41 +08:00
    当然是要追热点。去把25年的上证指数涨幅情况,和当天新闻联播的情绪指数做一个二维图,你会发现一些秘密……

    http://www.thepaper.cn/newsDetail_forward_1330266
    em70
        11
    em70  
       2015-08-05 09:17:56 +08:00
    分析下欧洲足球比赛的盘口与最终结果的关系,比如庄家看好主队胜的时候,主队获胜的几率是多少
    mjc0608
        12
    mjc0608  
    OP
       2015-08-05 10:29:01 +08:00
    @riaqn 暴露了。。。
    mjc0608
        13
    mjc0608  
    OP
       2015-08-05 10:45:00 +08:00
    @minvacai 看了半天感觉用不上。。。
    minvacai
        14
    minvacai  
       2015-08-05 11:08:02 +08:00
    @mjc0608 啊。。。3楼的都用不上?疫源地什么的,要配合地图使用吧
    vikeria
        15
    vikeria  
       2015-08-05 13:39:16 +08:00 via Android
    前几天好像看到一个爬取qq空间3000万数据,然后做的一个小分析的帖子
    czheo
        16
    czheo  
       2015-08-05 14:58:38 +08:00
    bitcoin历史交易数据可视化,数据容易获得,可做的东西也很多。
    mengzhuo
        17
    mengzhuo  
       2015-08-05 15:43:30 +08:00 via iPhone
    看看d3js里的例子
    zonghua
        18
    zonghua  
       2015-08-05 19:23:51 +08:00 via iPhone
    家用机也能叫大数据?
    riaqn
        19
    riaqn  
       2015-08-05 22:48:32 +08:00 via iPhone
    @mjc0608
    枉费我去年上心做了,最后分数大家都差不多
    http://blog.riaqn.com/imdb-report/
    所以你不必太费心
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   1743 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 24ms · UTC 16:29 · PVG 00:29 · LAX 08:29 · JFK 11:29
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.