问个 Python 分割字符串的

2017-07-31 21:53:58 +08:00
 fearme

我有这样一行文字

1#   000655   金岭矿业  9:25  17 中报 股+涨价 -钢铁 +国企改革  17 半年报预增 137%至 158%+铁矿石 (资源)+实际控制人山东省国资委 持有 58.41%+主业包含对钴金属的生产销售  1

我想要能够提取成

000655    17 中报 股+涨价 -钢铁 +国企改革  17 半年报预增 137%至 158%+铁矿石 (资源)+实际控制人山东省国资委 持有 58.41%+主业包含对钴金属的生产销售
2076 次点击
所在节点    Python
7 条回复
Tony042
2017-07-31 22:08:48 +08:00
python split 函数,然后再字符串拼接就行
ech0x
2017-07-31 22:20:08 +08:00
这是股市新闻?
“ 1#” 如果在开头有规律的话应该是好去除的
“ 00065 ” 是股票代码吧,与“金陵矿业”这类的有对应关系,利用开放的 API 或者数据库应该可以查到这个对应关系,然后提取删除就行了。
9:25 是时间,利用正则提取删除。
wisej
2017-07-31 22:39:55 +08:00
s = '000655 金岭矿业 9:25 17 中报 股+涨价 -钢铁 +国企改革 17 半年报预增 137%至 158%+铁矿石 (资源)+实际控制人山东省国资委 持有 58.41%+主业包含对钴金属的生产销售'
l = s.split()

name = l[1]
time = l[2]

name_length = len(name)
time_length = len(time)

name_start_index = s.find(name)
time_start_index = s.find(time)
time_end_index = time_start_index + time_length - 1

p1 = s[:name_start_index]
p2 = s[time_end_index + 1:]

print(p1 + p2)
nongmei
2017-08-01 10:54:33 +08:00
为啥我首先想到的是 awk
fearme
2017-08-01 11:11:39 +08:00
非常感谢
araraloren
2017-08-01 11:37:49 +08:00
@nongmei 我首先想到的是这是个伸手党。。
fearme
2017-08-01 11:47:55 +08:00
@araraloren 我是初学者,如果打扰各位,很抱歉,下次不这样了

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/379386

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX