请教: pydantic 对 BaseModel 使用的 bug?

38 天前
 mkroen

今天在项目中使用 BaseModel 遇到了一个问题,model 的某个字段的值一直赋值不上,在经过一番研究之后,我将其简化,发出来和大伙们讨论


from pydantic import BaseModel


class A(BaseModel):
    data: dict | list | BaseModel


class B(BaseModel):
    data: BaseModel | dict | list


a1 = A(data={"a": 1, "b": 2})
a2 = A(data=a1)
a3 = A(data=["1", "2"])

b1 = B(data={"a": 1, "b": 2})
b2 = B(data=b1)
b3 = B(data=["1", "2"])

print(a1)  # "data={'a': 1, 'b': 2}"            正常
print(a2)  # "data=A(data={'a': 1, 'b': 2})"    正常
print(a3)  # "data=['1', '2']"                  正常

print(b1)  # "data=BaseModel()"                 不正常
print(b2)  # "data=B(data=BaseModel())"         正常
print(b3)  # "data=['1', '2']"                  正常

这里可以看到对于 b1 的实例化,data 的值并没有成功赋值给 b1.data
按理来说,不管我做不做类型注解,这里都不应该影响我正常赋值和实例化


环境:
python3.10.8
pydantic==2.6.3


当我把 pydantic 更新到最新的 2.10.2 时,实例化 b1 会报错,但是 b3 依然可以执行

AttributeError: 'BaseModel' object has no attribute '__private_attributes__'

我有尝试去 pydantic 的 issue 搜索过,但相关 issue 太多了,没找到相似的。
感觉像是 pydantic 的 bug ?还是因为有什么特性?

1417 次点击
所在节点    Python
14 条回复
Lychee0
38 天前
```python
class B(BaseModel):
data: Union[Self, Dict, List]
```
先这么写倒是可以,mypy & ruff 扫了下能过

我发现不标 Self 时 b2.data 还会变成 List ,好奇怪
Lychee0
38 天前
自动转 List 应该是特性?(这个不应该抛错误吗
mkroen
38 天前
@Lychee0 #1
python3.10 还没有 typing.Self ,这里我写 BaseModel 意思是,data 可以是其他继承 BaseModel 的 class ,而不一定仅是 B 这个 class
jzhouwyy
38 天前
@Lychee0 #1 python3.12 pydantic2.10.2 按你这样写啥事没有
sunfkny
38 天前
缺少用于显示的 __private_attributes__ 和 __pydantic_computed_fields__,空继承一下或者补上属性就好了,正常继承,metaclass 会设置这两个属性的

class BaseModel(BaseModel): pass

BaseModel.__private_attributes__ = {}
BaseModel.__pydantic_computed_fields__ = {}
chaunceywe
38 天前
这种最好用 union+discriminator,没 type pydantic 也不知道到底按哪个类型解析
009694
37 天前
因为 pydantic 是按照类型实例化是否成功决定是否匹配上的啊。 你的 b 按照顺序会先尝试使用 BaseModel 进行实例化 结果还真成功了 自然就成 BaseModel 了
009694
37 天前
BaseModel 的包含范围和 dict 是一致的 虽然实例化的时候传进去的东西会全丢失 但是不妨碍外部认为转换成功了
mkroen
35 天前
@sunfkny 这样能解决 2.10.2 的报错问题,但是 b1 的实例化还是没接收到参数。我的本意是,data 为任意继承 basemodel 的类都满足
mkroen
35 天前
@009694 #7 感谢解释。但是这里我觉得 pydantic 直接把 BaseModel 认为和 dict 一致,有点反直觉。如果 data 注解为仅 BaseModel 类型,当我传入一个 dict 类型,pylance 是会标红的:无法将“dict[str, int]”类型的参数分配给函数“__init__”中类型为“BaseModel”的参数“data”。
mkroen
35 天前
@009694 #7 pylance 会识别他标注过的几种类型,这一点我理解。但感觉还是像楼上说的用 Union 解决好一点。
009694
35 天前
@mkroen union 和|是完全一致的 问题不出在这里。
009694
35 天前
@mkroen 你需要的是让 union 中的类型不要有可解析的交集 否则你永远不知道会解析成谁 一旦 pydantic 内部解析优先级变了 那你的代码就炸了。BaseModel 和 dict 出现交集这个事我理解算一种历史遗留产物,猜测是是当初 pydantic 诞生是为了实现一种 typeddict , 所以在传入参数是 dict 且指定类型是 BaseModel 的时候会尝试解析成 BaseModel 。
mkroen
33 天前
@009694 #13 感谢。我换种写法已经解决了问题,主要是想明白这里的错误的原因。这种类似子集的类型,把子集放前面,超集放后面就可以解决了。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/1093783

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX