300 个 excel 工作表, 30000 行数据,如何快速找到其中的空值和 0 值?

2018-03-24 20:53:56 +08:00
 mogp
试过的办法:通过 VBA 合并全部工作表,通过定位空值来实现。

求其他思路、办法,谢谢
3417 次点击
所在节点    问与答
14 条回复
Linxing
2018-03-24 20:59:02 +08:00
写个 Python 脚本跑一跑
wbing
2018-03-24 21:09:32 +08:00
记得 vba 是能遍历目录下的文件的,直接遍历所在目录下的这 300 个工作表,然后写个函数找到一张表的空值和 0 值就可以了吧。
HuHui
2018-03-24 21:17:29 +08:00
突然想起 大数据
vmebeh
2018-03-24 21:30:23 +08:00
对于已经打开的文件,用 vba 遍历很快;文件打开的过程会慢点
如果是纯数据的话,转换成 csv 或者文本更方便。
hbliu
2018-03-24 22:38:47 +08:00
可以直接用 shell 脚本处理
tulongtou
2018-03-24 22:40:51 +08:00
只能把内容都读出来(用各种语言)一个一个看吧,还有其他法子么?
facat
2018-03-24 22:46:57 +08:00
操作 excel 还是 vba 最方便,不要觉得 vba 很 low 就去用其他语言
akira
2018-03-24 22:54:49 +08:00
关键是你找到以后要干嘛
Moorj
2018-03-24 23:15:28 +08:00
没错,主要还是找到后你要干嘛,如果只是要找出来,随便找个数据库软件,写个批量导入的脚本,一股脑塞进去,然后 SQL 查找就完了
SandyLee
2018-03-24 23:25:30 +08:00
notepad++试一下?
a1237a
2018-03-25 08:24:20 +08:00
每个 30000 ?
sky101001
2018-03-25 09:24:56 +08:00
我有时也会遇到类似的需求,只有几个表,单表 3w 条数据。 都是偷懒直接导进数据库,然后干活的,不管是查空值还是干别的什么,一条 sql 的事。 操作结束后导出为 excel 也挺方便。
如果你的表是 300*3w,那可能还是用 vba 遍历目录文件快一些了。但既然你能用 vba 把表合并起来,我猜应该没有 900w 那么多吧。
lsmgeb89
2018-03-25 13:50:50 +08:00
上 Spark ?
mogp
2018-03-26 21:25:06 +08:00
@Linxing 正在学 python,谢谢
@wbing 目前用的是 VBA 处理
@HuHui 这点数据,杀鸡不能用牛刀
@vmebeh 换成文本?
@hbliu 没玩过 SHELL
@facat 现在用的是 VBA,没觉得 LOW
@akira 找出来,标成不一样的颜色就可以
@Moorj EXCEL 导到什么数据库方便?有什么好用的工具导入?
@SandyLee 这个有难度不?
@a1237a 总共 3W 条信息
@lsmgeb89。。。。。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/441100

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX