GraphAr:一款开源的图数据存储和归档的标准化文件格式

2023-05-16 15:51:13 +08:00
 aeczen

Hi ,v2ers ,给大家介绍一下我们开源的标准化图数据文件格式 - GraphAr

项目地址: https://github.com/alibaba/GraphAr

背景

随着社交网络分析、数据挖掘、科学计算等应用的发展,图计算作为海量数据分析的重要组成部分,变得日益重要,业界也诞生了很多基于内存 /外存的图存储、数据库、图分析和交互式图查询引擎等。由于图计算的生态非常碎片化,存在很多不同类型的数据格式和访问模式,因此需要建立一套标准化的文件格式和访问接口来解决各种图计算系统的数据导入导出,互相访问的问题。

GraphAr 是什么

GraphAr 就是为了解决不同图计算系统数据导入导出过于复杂的问题而设计的。它为图数据定义了一套标准化的、独立于计算 /存储系统的文件格式,并提供了一系列接口用来生成、访问和转换这些格式化的文件。GraphAr 可以帮助各类图计算应用或现有系统方便快捷地构建和访问图数据,它既可以作为图计算应用的直接数据源,也可以服务于图数据的导入 /导出和持久化存储,减少各类图系统之间协同工作的开销。

目前 GraphAr 项目包含:

未来还会添加更多的数据类型,文件类型支持,多语言 SDK 等

设计思路

为了尽可能兼顾各类系统对图数据存储和访问的不同需求,GraphAr 标准化图文件格式的设计考虑了如下要点:

应用场景

GraphAr 现已支持在多个场景中进行应用,部分已经实现的案例包括

未来

未来随着 GraphAr 的发展成熟,我们的目标是将项目贡献到一个供应商中立的场所,例如 Apache 、LF AI & Data 。这将确保项目继续以开放透明的方式进行开发,并得到广泛的开发者社区的贡献。

👏 如果你对开源感兴趣,欢迎加入 GraphAr 的社区,和我们一起推进 GraphAr 的发展。

👏 如果你觉得这个项目还不错,可以在 github加星,关注,这是对我们开发者莫大的鼓励。

649 次点击
所在节点    分享创造
0 条回复

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/940442

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX