Python 中的这些坑,早看早避免。

2018-11-30 23:11:28 +08:00
 cxa

说一说 python 中遇到的坑,躲坑看这一篇就够了

传递参数时候不要使用列表

def foo(num,age=[]):
	age.append(num)
	print("num",num)
	return age
print(foo(1))
print(foo(2))
print(foo(3))

上面的代码输出的结果并不是我们预期的那样,打印出三个数组[1],[2],[3]。 而是下面这样.

num 1
[1]
num 2
[1, 2]
num 3
[1, 2, 3]

为什么会这样呢,原因就是参数 age 是一个列表,列表是一个可变对象,同时在作为函数参数时,相当于全局变量,在函数预处理时就已经分配了内存空间。那么我们如何修改呢? 其实很简单只要不让列表参数作为列表,一般可变类型对象作为参数的时候默认都是给定 None,然后根据对象判断是否为空,如果为空再去定义成列表,修改如下:

def foo(num, age=None):
    if not age:
        age = []
    age.append(num)
    print("num", num)
    return age
print(foo(1))
print(foo(2))
print(foo(3))

for。。。else 的使用场景

在刷 pythontip 的时候遇到这道题,觉得很有必要和大家普及下 for。。else 的用处,好了下面我们开始: 输出 100 以内的所有素数,素数之间以一个空格区分(注意,最后一个数字之后不能有空格)。

#在一般领域,对正整数 n,如果用 2 到根号 N 之间的所有整数去除,均无法整除,则 n 为质数又叫素数。
import math

num = [] #存放 1-100 之间的素数
for i in range(2, 100):
    for j in range(2, int(math.sqrt(i)) + 1):
        if i % j == 0:
            break
    else:
        num.append(i) #根据定义如果都无法正常才加入
for index, i in enumerate(num):
    if index == len(num) - 1:
        print(i)
    else:
        print(i, end=" ")

根据关键语句「所有整数去除,均无法整除,则 n 为质数又叫素数。」,转化成程序也就是说在所有的的数字都循环完了,还不能出才作为质数,也就是最后的那个 else,体现了这句话。由此可以看出 for。。else 还是挺重要的。

字典赋值

看下面的代码,猜想输出结果:

a = {}
a[1] = "A"
a[1.0] = "B"
a[2] = "C"
print(a)

如果不知道字典里的键和 hash 有关,就不会知道结果是下面这个样子

{1: 'B', 2: 'C'}

这是为什么呢? 因为,Python 中的字典是通过检查键值是否相等以及哈希值来确定两个键是否相同. 具有相同值的不可变对象在 Python 中始终具有相同的哈希值. 因为 1=1.0 所以 hash(1)==hash(1.0).同样的我们知道 python 中的 true 相等,我们试着 计算其 hash 值可以看到 hash(1)==hash(True)。 由此我们可以得到如下等式:

hash(1)==hash(1.0)==hash(True)

因为只不可变对象才存在 hash 值所以 hash([])不存在。同样我们可以推断出

hash(0) == hash(False) == hash("")

根据 PEP285 中 Review 部分第 6 条所述,bool 类其实是从 int 类继承而来.

print(isinstance(True, int))

关于 if 判断条件正确写法

python3 中 0=[]=()={}=None=False="",所以当我们在判断列表,或者字典字符串是否为空的时候不用再使用 a==None,这样的语句了。

a=[]
b={}
c=""
if not a:
   print("a 不为空")
if not b:
   print("b 不为空")
if not c:
   print("c 不为空")

同样的代码少写

一般我们写 if 判断的时候,我们都写成下面这种形式:

if type == "A":
    print(1)
elif type == "B":
    print(2)

像这样的我们需要写好多重复代码的程序,此时就要考虑是否优化了,针对这种情况我们可以优先考虑字典。

my_dict = {"A":1, "B":2}  #etc
print(my_dict[type])

另外我们在使用给对象的属性赋值的时候

class A():
    def __init__(self,dicts):
        self.name=dicts["name"]
        self.age=dicts["age"]
        self.sex=dicts["sex"]
        self.hobby=dicts["hobby"]
if __name__ == '__main__':
     dicts={"name":"lisa","age":23,"sex":"women","hobby":"hardstyle"}
     a=A(dicts)

我们看到我们需要换取传入的字典的各个键值,并创建键值同名一个属性,这里我们只有 4 个还好,想象一下如果我们传入的字典有 100 个键。。。如何还是这样一个一个赋值不敢想不敢想,人家都写完代码了,你还在赋值有木有。。 其实一开始的那段代码已经给出了答案,如果不会也没关系, 下面我们就来点 pythonic 的 python。来解决这个问题。 上面代码简化为:

class A():
    def __init__(self,dicts):
        self.__dict__.update(dicts)
        print(self.__dict__)

if __name__ == '__main__':
     dicts={"name":"lisa","age":23,"sex":"women","hobby":"hardstyle"}
     a=A(dicts)

小心闭包中的坑,python 的惰性计算

我们观察下面的代码

ls = []
for x in range(5):
    ls.append(lambda: x**2)
print(ls[0]())
print(ls[1]())
print(ls[2]())

我们以为它会输出[0],[1],[4].但实际情况是。。。。。

16
16
16

这是什么鬼? 其实这和 python 的惰性求值有关。惰性求值,也就是延迟求值,表达式不会在它被绑定到变量之后就立即求值,而是等用到时再求值。x 实际不在 lambda 的作用域中。只有当 lambda 被调用时,x 的值才会被传给它。也就是最后的一次循环中 x 为 4,后面的 ls[1],ls[1],ls[2],ls[3]实际都是 16。同时这是面试常考的一个点,希望大家牢记。 这个问题考察了闭包。

执行文件路径和当前路径

执行文件的路径和当前的路径这是两个概念 获取文件的当前路径时可以的使用

import os
os.getcwd()

但是在需要执行的文件的获取其执行路径的时候就最好不要用这个了。 一般使用下面这种方式,动态的获取路径

import sys
sys.path[0]

###使用 eval 转整的时候数字前不能有 0

eval("02")

会发生错误:

Traceback (most recent call last):
  File "/demo/1.py", line 1, in <module>
    eval("02")
  File "<string>", line 1
    02
     ^
SyntaxError: invalid token

While 1 比 While True 快?

python2 的时候是这样,以为 python3 True=1 所以结果实际是一样的。 由于 Python2 中,True/False 不是关键字,因此我们可以对其进行任意的赋值,这就导致程序在每次循环时都需要对 True/False 的值进行检查;而对于 1,则被程序进行了优化,而后不会再进行检查。 Python3 中,由于 True/False 已经是关键字了,不允许进行重新赋值,因此,其执行结果与 while 1 不再有区别

处理长的字符串

对于长的字符串我们一般使用"""多文本"""的形式,但是换行的时候容易导致哪里出错,此时可以考虑在外面加个小括号,像这样

("""多文本""")

关于 requests 模块的编码问题

作者实际上提供了个自动识别网页编码的代码,在获取 res(请求的对象),获取源码之前使用 下面的代码即可获取正确的网站编码。

res.encoding=res.apparent_encoding

更多工具使用以及 python 技巧,请关注公众号:python 学习开发。

8331 次点击
所在节点    Python
48 条回复
zhuangzhuang1988
2018-11-30 23:21:37 +08:00
还是直接换语言吧.
di94sh
2018-11-30 23:29:18 +08:00
lihongjie0209
2018-11-30 23:56:30 +08:00
写小脚本的不在意这些, 写大项目的要更强大的约束
ddzzhen
2018-12-01 00:35:37 +08:00
支持一下
CODEWEA
2018-12-01 00:42:04 +08:00
换 php 吧
Mirage09
2018-12-01 01:02:33 +08:00
要看坑的话,看这个:
https://github.com/satwikkansal/wtfpython
Kylin30
2018-12-01 02:34:14 +08:00
换职业吧
findex
2018-12-01 05:48:05 +08:00
换 c++吧
q397064399
2018-12-01 06:14:06 +08:00
避免这些坑的做法就是先学习一门强类型编程语言,等你玩溜了强类型 再回来用 Python 就明白 Python 为什么要这样,强类型解决了哪些问题,同时强类型跟弱类型各自又有哪些缺陷,怎么做才能更好避免这些问题。

我一直说 Python 是编程老师傅手上的玩具,不是入门菜鸟的导师工具,业界在吹 Python 适合入门简直就坑人。

新手连类型系统都搞不清楚,就开始编程,能组织 5000 行代码 并不断维护这些代码 你就烧高香吧。
janxin
2018-12-01 07:58:14 +08:00
执行文件路径和当前路径这个不是是个程序就会有的问题吗...
wzw
2018-12-01 08:01:20 +08:00
@q397064399 #9 能写 5w 行,还能维护,算不算过关😄
XIVN1987
2018-12-01 08:15:38 +08:00
惰性求值只说了问题,,没说解决方法啊:
ls = []
for x in range(5): ls.append(lambda x=x: x**2)
print(ls[0]())
print(ls[1]())
print(ls[2]())

输出:
0
1
4
swulling
2018-12-01 08:22:04 +08:00
@q397064399 Python 也是强类型
zxcvsh
2018-12-01 08:59:35 +08:00
如果你一定要在自己不明白的时候这样写就加上地址判断;熟悉了规则机制后,你都可以当全局变量用了
Wincer
2018-12-01 09:00:01 +08:00
@q397064399 Python 是动态强类型,谢谢
www5070504
2018-12-01 09:02:25 +08:00
有些是基础就该知道的 另外我感觉这种公众号文章就别复制粘贴了 这种文章已经到处都是了
zxcvsh
2018-12-01 09:03:23 +08:00
@Wincer js 才是弱类型,当初第一次用的时候,一个 if 判断,变量值都变了,我才知道 == 和 ===
被自己蠢哭
berretta
2018-12-01 09:10:53 +08:00
写了五六年 python,有些语法从来没写过
hsfzxjy
2018-12-01 09:38:51 +08:00
建议用 if x is None 判断对象是不是 None,很多时候 None 带有缺失值的语义
trait
2018-12-01 09:54:23 +08:00
楼上应该是混淆了 strong vs weak, static vs dyn,当然这种情况也不好说什么,毕竟清北 c9 以下的大多数码农培训班都不会,也没能力开设 PL 基础课程
go/rust 出生的 2010 年前后,工业界面对暴涨的业务需求和摩尔定律停滞终于想起了学术界早就研究出来几十年的东西,现在的大多数技术不过是在炒冷饭,python 这些动态老牛车不过是乘着摩尔东风和暂且少量的数据和代码要求才这么火,这些破车等到下一个“摩尔”可能还有机会

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/513217

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX