@
l1xnan 确实说的有问题,是因为两个原因要拆分
1 、文件太大,单独打开太慢
2 、即便打开了提示字段超长,可能现实不全,但是转为 xlsx 不会有这个问题
然后就开始想拆分方案,我自己参考网上的方案写了一份,感觉有点慢:
import pandas as pd
# 读取 CSV 文件
data = pd.read_csv('customer.csv')
# 按照“客户编号”列排序
# 转换为字符串列排序
data['客户编号'] = data['客户编号'].astype('str')
sorted_data = data.sort_values(by='客户编号', ascending=False)
# 将数据拆分为 30 个数据桢并保存为 CSV 文件
num_files = 30
chunk_size = len(sorted_data) // num_files
for i in range(num_files):
start_idx = i * chunk_size
if i < num_files - 1:
end_idx = (i + 1) * chunk_size
else:
end_idx = len(sorted_data)
chunk = sorted_data.iloc[start_idx:end_idx]
chunk.to_excel(f'chunk_{i + 1}.xlsx', index=False)