pandas read_csv 如何指定部分(前 n 个)seperator

2019-01-25 17:10:10 +08:00
 hujianxin

比如我的 csv 文件是这样的

age,first_name,other
12,hello,world,john
13,hi,csv,lili

如上面所示,第一行有使用逗号分割了三个元素,第二、三行使用逗号分割了四个元素。

现在需求是通过 pandas 读入 csv 文件,成为一个 Dataframe,形式如下:

age   first_name     other
12    hello          world,join
13    hi             csv,lili

这种需求 pandas 能实现吗?希望使用过的大佬可以帮忙解惑,多谢!

1399 次点击
所在节点    程序员
1 条回复
habin
2019-01-26 00:00:21 +08:00
可以的,other 是 world、csv 的表头,john,lili 没有表头的通过读取后可以直接字符串连接
data = pd.read_csv('1.csv')
data['other'] = data['other'] +',' +data['Unnamed: 3'] # 'Unnamed: 3'为 john、lili 的表头
data.drop('Unnamed: 3',axis = 1,inplace = True)

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/530640

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX