陷在这段思路里了,求指教

2016-09-27 21:05:25 +08:00
 omg21
现在有一批网页要处理,都是不同站点的。我用 BS4 做的处理代码能处理大部分的页面,有一小部分页面需要单独设计代码才能取得需要的数据。
如果把全部站点用一段代码来处理,做一个循环,每一个都处理一遍,那一小部分需要单独处理的页面就需要用 if 判断来确定。很显然,这部分需要单独处理的页面每个都需要一个 if 来判断,这就大大增加了程序运行时间,因为每一个页面都要经过那若干 if 判断后才能处理。
如果把单独处理页面的代码单拿出来,就等于用了两套类似的代码来做相同的事件,改动代码时也很麻烦,需要两处同时修改。
不知道还有什么方法能够实现在一段代码里高效的处理上述问题的解决方案。
2563 次点击
所在节点    Python
5 条回复
264768502
2016-09-27 21:19:21 +08:00
EAFP LBYL
menc
2016-09-28 02:08:09 +08:00
用 dict 来存,查找时间度降低为 O(1),可以视为不占用资源了
Carrycat
2016-09-28 03:36:47 +08:00
用 if else 判罚吧, if 后 python 不会 evaluate else 的东西,整个 runtime 还是 O ( n) 重写一遍就是 O ( n+m )了,别担心 python 判断 if 的速度。还有就是有句话说的好 "Any fool can write code that a computer can understand... But only good programmers write code that humans can understand." -- Martin Fowler
linruiyi
2016-10-08 15:46:46 +08:00
一个思路:做一个数据库,作为给各个独立设置代码的网站的配置数据库,写成一个通用的网页处理工具。这样子当单独设计的网页多的时候,后期只需要给数据库增加配置,当然你还可以搞个前端页面来进行配置写入。
omg21
2016-10-08 22:13:12 +08:00
@linruiyi 这样做就等于是运行时从两个表中取数据,前一个表存放的是通用的页面,直接取出来就处理就可以了,后一个表存放需单独处理的页面,挨个判断进行处理,可是这就需要用两套代码了。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/309381

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX