在排查一个数据问题时候,遇到一个 python 的报错
原先是脚本是卸写在 pg 存储过程里,爬取某个网页数据,开始我以为是编码问题,导致脚本出错
再自己电脑上用 pycharm 测试了下,
大概就是如下操作
# encoding: utf-8
tt = "'101005','xxxxx 小区','xx 路 365.357.369 号,389 幢 3-7 层楼'"
print(tt.split(',')[0][1:-1])
print(tt.split(',')[1][1:-1])
print(tt.split(',')[2][1:-1])
print(tt.split(',')[3][1:-1])
输出如下=========
101005
xxxxx 小区
xx 路 365.357.369�
89 幢 3-7 层楼
往常数据用 , 来切分[1:-1]都没问题
但有一条数据象向上面的中间有 , 就导致切分的有点问题,输出的有 �
这个理论上不应该输出 xx 路 365.357.369 ,有大佬遇到过吗
用的是 python2.7
原先是脚本是卸写在 pg 存储过程里,爬取某个网页数据,开始我以为是编码问题,导致脚本出错
再自己电脑上用 pycharm 测试了下,
大概就是如下操作
# encoding: utf-8
tt = "'101005','xxxxx 小区','xx 路 365.357.369 号,389 幢 3-7 层楼'"
print(tt.split(',')[0][1:-1])
print(tt.split(',')[1][1:-1])
print(tt.split(',')[2][1:-1])
print(tt.split(',')[3][1:-1])
输出如下=========
101005
xxxxx 小区
xx 路 365.357.369�
89 幢 3-7 层楼
往常数据用 , 来切分[1:-1]都没问题
但有一条数据象向上面的中间有 , 就导致切分的有点问题,输出的有 �
这个理论上不应该输出 xx 路 365.357.369 ,有大佬遇到过吗
用的是 python2.7