最近在学 linux shell 一直学不会 sed 与 grep 的用法,希望大佬指点一下
打算用来提取 html 里面的内容,测试代码如下
<tr border=0>
<tr><td valign=top>
<div id="leftside">
<div class="clear">
</div>
<div id="playvideo">
<div id="playvideo-videoname">
韩式 Sussi
</div>
<div id="playvideo-content">
<div class="arrow-general">
</div>
<div class="videoplayer">
<video id="vid" class="video-js vjs-default-skin vjs-big-play-centered"
controls preload="auto" width="465" height="360"
poster="http://img2.aliyun.com/thumb/FA13AS3456XVB.jpg" >
<source src="http://v.advideos.com//mp43/FA13AS3456XVB.mp4?st=boGNNUn6--7TxTJJ8uKtjA&e=1518240294" type='video/mp4'>
</div>
</div>
</div>
</div>
</div>
</tr>
</table>
1、想要提取
<div id="playvideo-videoname">
韩式 Sussi
</div>
里面的 韩式 Sussi
2、和
<source src="http://v.advideos.com//mp43/FA13AS3456XVB.mp4?st=boGNNUn6--7TxTJJ8uKtjA&e=1518240294" type='video/mp4'>
里面的 http://v.advideos.com//mp43/FA13AS3456XVB.mp4?st=boGNNUn6--7TxTJJ8uKtjA&e=1518240294 url ,当面页面里面可能有好几个
听说 sed 只能按行来提,这样的话第一个要提取的内容老是提不出来。第二个因为是在 src 里面而且通配另一个字串,原谅我正则表达 式真的看不懂。
请大佬们解惑。
这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。
V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。
V2EX is a community of developers, designers and creative people.