一半做法参考:
用 php 呼叫 word.exe 将来源 A.DOC(或 A.DOCX)另存成 A.XML
然后记得 php 中要写结束 word.exe 的代码.不然每次转档都会多一个画面看不见的 word 在执行.
接着你只要会处理 XML 就好了.word 能将 DOC(X)转成类似网页这样带有标签的 XML.
接着你要找你要的文字分别对应哪些标签就可以了
学过 XML 吗?
建议用 Firstobject XML Editor 打开 A.XML.
这个软体可以显示出 XML 的树状结构(左边).还有原始文字(右边).
可以用搜寻文字先找你要的姓名或是电话的栏位值.
对这个值按右键.这个软体选单有个 get path 这样的功能.
然后显示在下方.这是个 XML 格式的路径.又称 XPATH.
然后看 php 对 XML 的操作说明:
http://php.net/manual/zh/refs.xml.php尤其是开档和 DOMXPath 这两个.
基本概念就是
$word = new COM("word.application") or die("Unable to instanciate Word"); //呼叫 word
$word->Visible = 1;
$word->Documents->Open('a.doc'); //来源 DOC 档
$word->Documents[1]->SaveAs('a.xml',8);//8 是啥我忘了你查一下.
//以下 3 行都是关闭 word.exe 用的.
$word->Quit();
$word = null;
unset($word);
//xml 操作
$xdom=load('A.XML');//函数没写完整.看手册.这里意思一下.
$str=xpath('//xxx/xxx/x',$xdom);//前面的 xxx 路径就是 xpath 大致上的样子.后面是你开档的$xdom.
echo $str;//有看到文字剩下的就是存入你的目标了.看是资料库还是.TXT 都可以.