立志要当程序猿的人,不是应该学会减少重复性劳动么?

2016-05-08 16:15:30 +08:00
 Rafaam

楼主是一只长期潜水于 V2EX 的传媒学生,如果有说错的地方,欢迎大神们指出。

昨天,我一个软件工程专业的同学拿了如上的一份 EXCEL 来找我,说项目老师让他根据 D 列的主题分别填写 B 、 C 、 E ,总共 1 万多行的数据要两天内完成。我那个同学苦恼不已,四处找熟人帮忙。楼主是个外行,想不到取巧的方法,只好答应帮他完成一部分。问题是,立志要当程序猿的人,难道不应该学会让电脑来做这些重复性劳动么(╯‵□′)╯︵┻━┻

论坛的大大们有什么好办法吗?

补充另一张 EXCEL :

2775 次点击
所在节点    问与答
14 条回复
just1
2016-05-08 16:19:55 +08:00
结巴分词可以尝试
shiny
2016-05-08 16:25:10 +08:00
考虑分词吧,有现成的轮子可以用
pheyer
2016-05-08 17:05:28 +08:00
愿意花时间的话上面已经给出提示了
省时间的话某宝上搜 python excel
21grams
2016-05-08 17:13:04 +08:00
两天不见得写的出来,学生更不可能
scys
2016-05-08 17:51:45 +08:00
10k 的容量,这种分词人肉大概是 6 个小时左右 ~_~
猜测老师在分配自己的外快中。
mcone
2016-05-08 18:18:06 +08:00
没基础的话 2 天还是人肉来吧,什么立志当程序猿什么的,别想那么多……

这貌似是老师自己的私活平均分下来的吧,之前我校某老师出的翻译版的书,也是这么分给学生然后攒起来的。。。。。。
Rafaam
2016-05-08 18:43:49 +08:00
@just1
@shiny
@pheyer
谢谢你们的指点
Rafaam
2016-05-08 18:47:33 +08:00
@21grams
@scys
@mcone

我是学新闻的,只是不理解我那同学都大三了,为什么还在做这么笨的工作°Д°
打破了我对程序猿的美好幻想……
just1
2016-05-08 18:51:36 +08:00
@wanll93918 程序员有什么美好幻想。好吧(∩_∩)我高一
Devin
2016-05-08 19:46:25 +08:00
把各行都出现的字都去掉,应该可以解决一半问题,最后问题变成字符处理问题
server
2016-05-08 19:51:50 +08:00
减少别人的重复劳动,不是较少程序员的重复劳动
billlee
2016-05-08 23:33:55 +08:00
@just1 和 @Devin 已经把方法说出来了,就是分词 + IDF. 用 python 应该可以轻松搞定的。
不过只有一万个样本的话,准确率可能不是很高,速度可能和手工做差不多,但是写代码总比填一万个空轻松啊。
xiamx
2016-05-08 23:47:27 +08:00
手动填 1000 行, 80/20 Split ,分词, IDF , SVM
yixiang
2016-05-08 23:50:46 +08:00
粗糙方法:网上搜索农产品名称,建个数组,根据字符串匹配出 BC ,手工做个几百行数据,做关键字数组,根据字符串匹配出 E 。

显然这个方法关键字数组会不怎么准确,但如果是我就将就用这个了。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/277134

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX