通过 IPython Notebook 体验 ODPS 大数据分析服务

2016-03-22 00:30:12 +08:00
 onesuper
http://notebook.odps.online/

“大数据就像青春期的性,每个人都在谈论,每个人都以为别人在做,所以每个人都宣称自己也在做。”

—— Simon Matthews

关于大数据有人觉得是泡沫,有人则相信它的价值,我们恰好是后一种人 :)。 ODPS 的全称是 Open Data Processing Service ,是阿里云的大数据计算服务。考虑到上手 ODPS 这样的大数据服务门槛比较高,至少要先注册阿里云的账号,并开通 ODPS 服务,然后下载、配置好命令行工工具……总之比较麻烦,所以我们开发了 Notebook 这样开箱即用的服务( http://notebook.odps.online/
),让用户可以通过 IPython 来与 ODPS 进行交互,同时也是一个教程,帮助对大数据感兴趣的人了解 ODPS 是什么。

下面这张图就是在 ODPS 的 Notebook 中执行一条 SQL 的样子,可以一次查询几个 TB 的数据,而一切的计算都跑在 ODPS 的集群中。



通过 IPython Notebook 也可以方便地对数据进行可视化:



当然了,所以操作都是通过 Python~



ODPS 目前还提供了 Dataframe 这样的数据结构,简化了科学计算。
目前我们也正在建设周边的生态工具: http://repo.aliyun.com/

欢迎大家来试用~
3749 次点击
所在节点    Hadoop
6 条回复
greenmoon55
2016-03-27 21:43:51 +08:00
Internal Server Error
gancl
2016-04-01 17:04:45 +08:00
```

Connected to pydev debugger (build 145.260)
Traceback (most recent call last):
File "C:\Program Files (x86)\JetBrains\PyCharm 2016.1\helpers\pydev\pydevd.py", line 1530, in <module>
globals = debugger.run(setup['file'], None, None, is_module)
File "C:\Program Files (x86)\JetBrains\PyCharm 2016.1\helpers\pydev\pydevd.py", line 937, in run
pydev_imports.execfile(file, globals, locals) # execute the script
File "C:\Program Files (x86)\JetBrains\PyCharm 2016.1\helpers\pydev\_pydev_imps\_pydev_execfile.py", line 18, in execfile
exec(compile(contents+"\n", file, 'exec'), glob, loc)
File "C:/work//BigData/aliyun.py", line 1, in <module>
from odps import ODPS
File "C:\work\Python34\lib\site-packages\odps\__init__.py", line 33, in <module>
from .ipython.magics import *
File "C:\work\Python34\lib\site-packages\odps\ipython\magics.py", line 22, in <module>
from odps.inter import enter, setup, teardown, list_rooms
File "C:\work\Python34\lib\site-packages\odps\inter.py", line 33, in <module>
from .df.backends.frame import ResultFrame
File "C:\work\Python34\lib\site-packages\odps\df\__init__.py", line 23, in <module>
from .core import DataFrame
File "C:\work\Python34\lib\site-packages\odps\df\core.py", line 30, in <module>
from .backends.pd.types import pd_to_df_schema
File "C:\work\Python34\lib\site-packages\odps\df\backends\pd\types.py", line 40, in <module>
for np_type in _np_int_types + _np_float_types:
TypeError: unsupported operand type(s) for +: 'map' and 'map'
```
运行失败
gancl
2016-04-01 17:07:41 +08:00
The odps module is not an IPython extension
gancl
2016-04-01 17:07:51 +08:00
The odps module is not an IPython extension ```
chinekingseu
2016-04-04 22:26:29 +08:00
@gancl Python 3 在发布 0.4 的时候兼容性有些问题,现在已经修复了,更新 pyodps 重试下哦
chinekingseu
2016-04-04 22:26:56 +08:00
@gancl 确认安装 pyodps 了吗?

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/265301

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX