V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
ainpy
V2EX  ›  PHP

求助: PHP 提取大段字符串中的 img ,然后将处理过的 src 替换回去

  •  
  •   ainpy · 2018-06-02 17:53:26 +08:00 · 3047 次点击
    这是一个创建于 2351 天前的主题,其中的信息可能已经有所发展或是发生改变。
    具体需求是,把 A 程序数据库的文章批量导入 B 程序数据库,

    这样会有一个问题,A 程序里 content 的图片的格式是 img src=/upload/xxx/xxx.jpg

    需要写个方法下载 content 里的图片(需要提取 img,然后在 /upload 前加上域名)、改变 src 的值(将下载的图片的路径写到 content 对应的 img)替换

    目前的思路是

    正则匹配出 content 里的所有 img,然后下载,得到路径,替换原 content 对应的 img src

    想的通, 写不出来, 尴尬了


    例:
    $str =
    "<p>V 站的程序员都好牛 b</p>,<img src=\"/uploads/allimg/170427/10330HO4-0.jpg\"> 巴拉巴拉 <img src=\"/uploads/allimg/170427/10330HO5-1.png\"> <div>你们最帅了</div>";

    要得到的结果,
    下载$str 里的图片,得到路径,重写 src
    11 条回复    2018-06-04 00:01:56 +08:00
    zjsxwc
        1
    zjsxwc  
       2018-06-02 18:00:33 +08:00 via Android
    html parser 了解下
    ainpy
        2
    ainpy  
    OP
       2018-06-02 18:04:04 +08:00
    我不是要写爬虫啊, 我是在 php 链接远程数据库,拿到数据后需要提取字符串里的图片,然后下载图片到本地,得到路径后,替换字符串里对应图片的地址,然后入库。
    DavidNineRoc
        3
    DavidNineRoc  
       2018-06-02 18:12:09 +08:00
    一楼说的对
    DavidNineRoc
        4
    DavidNineRoc  
       2018-06-02 18:12:19 +08:00
    掘金的效果?
    update
        5
    update  
       2018-06-02 18:19:04 +08:00
    付费解决吧
    laobaozi
        6
    laobaozi  
       2018-06-02 18:31:54 +08:00 via Android
    做过整个数据库迁移的 只能一条一条处理
    laobaozi
        7
    laobaozi  
       2018-06-02 18:34:28 +08:00 via Android
    首先正则匹配 content 所有的 src 安按顺序下载图片并上传 再依次替换
    laobaozi
        8
    laobaozi  
       2018-06-02 18:37:12 +08:00 via Android
    或者 旧站点的所有图片按原来的层级全部下载到复制到新站点的某个目录 这样只需要只修改 content
    demonchang
        9
    demonchang  
       2018-06-02 19:12:11 +08:00 via iPhone
    whyiyhw
        10
    whyiyhw  
       2018-06-02 20:25:56 +08:00 via Android
    手册正则替换里面 preg_match_all 的第一个例子,你可以看下,我之前为了拿富文本编辑器内容里面的文字和图片,也被正则卡了半天。
    Junjunya
        11
    Junjunya  
       2018-06-04 00:01:56 +08:00
    ……看了半天,难道不是一个简单的 正则匹配 img 的 src 然后替换的操作么?

    <?php

    $str =
    "<p>V 站的程序员都好牛 b</p>,<img src=\"/uploads/allimg/170427/10330HO4-0.jpg\"> 巴拉巴拉 <img src=\"/uploads/allimg/170427/10330HO5-1.png\"> <div>你们最帅了</div>";
    $b= preg_replace("/<img src=\"(.*?)\"(.*?)\>/i", '<img src="' . 'http://baidu.com' . '$1" $2 />', $str);
    echo $b;

    是这个样子么
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   4387 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 23ms · UTC 10:05 · PVG 18:05 · LAX 02:05 · JFK 05:05
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.