请教关于 Yahoo Pipes 中文本替换的问题。

2014-09-08 17:09:44 +08:00
 yanyuechuixue
就是某个著名的网站)提供的RSS不是全文输出的,最重要的是输出的RSS是不带有图片的,于是想用Pipes做一个能够输出图片的RSS方便离线看。
在使用中,抓取到的页面是html语言的,而我需要用String Replace 这个工具给替换成RSS标准格式。
比如
<input type='image' src='http://1.2.3.4/5.jpg' >
这个,我需要替换成
<img src="http://1.2.3.4/5.jpg" >
即把input type='image' 替换成img即可。
在使用的时候,发现如果选择的是first(只替换第一个)是能成功的,而如果选择every,则不能成功。
我觉得应该不是我操作的问题吧?

另外,Pipes在debug的过程中表现得很不稳定,有其他替代品么?
3033 次点击
所在节点    问与答
10 条回复
iugo
2014-09-08 17:13:22 +08:00
Pipes 真是好东西, 当年用它抓 BBC 新闻. 现在好久不用了...

替代品就是自己写脚本抓.
yanyuechuixue
2014-09-08 17:52:18 +08:00
@iugo 多谢,我想请问一下,写这个脚本大概用哪些命令?我需要先curl它自己的rss到一个文件里,然后遍历这个文件里所有的link(这个应该用什么命令?而且还得记住行号。。),然后curl 这些link,把得到的结果里响应的<div>复制到这个文件里(有什么命令能够根据匹配选择性的复制一部分么?),然后把该替换的地方替换掉(替换的话我倒是会。。)。。。。

麻烦了,我不是计算机专业的。。。我一学理论物理的人完全是凭兴趣玩这个。。。。。。。。
iugo
2014-09-08 17:57:16 +08:00
@yanyuechuixue 抱歉, 我也不是码农, 只能勉强算个产品经理, 知道大概解决方法, 但具体不会操作, 只能再和码农沟通.

我曾经也是学物理的...
yanyuechuixue
2014-09-08 18:32:58 +08:00
@iugo 啊~那我再去问别人去~~~谢谢啦~~~
ETiV
2014-09-08 21:49:44 +08:00
试试正则"Operators/Regex"

in:你自己填
replace:<input.+src="([^"]+)".+type="image"/>
with:<img src="$1"/>

[√]g 其他留空
ytzong
2014-09-08 23:48:21 +08:00
楼主抓的是1024么?
yanyuechuixue
2014-09-12 22:36:20 +08:00
@ETiV 嗯,我试试去。谢谢!~
yanyuechuixue
2014-09-12 22:36:42 +08:00
@ytzong 心里懂就行了。。。不要说出来啊!!!
yanyuechuixue
2014-09-12 22:37:01 +08:00
@ytzong 你肯定也抓过,否则不会这么了解。
ytzong
2014-09-13 07:52:53 +08:00
@yanyuechuixue 发邮件吧 ytzong7#@gmail.com

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/132325

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX