关于 lxml.HTML 相关的问题
<dl class="dl-horizontal ip_list"> \n
<dt>外观与性状:</dt>
<dd><b>透明无色至非常略黄色液体</b></dd> \n
<dt>密度:</dt>
<dd><b>1.027 g/mL at 25 °C(lit.)</b></dd> \n
<dt>熔点:</dt>
<dd><b>187°C</b></dd> \n
<dt>沸点:</dt>
<dd><b>187 °C(lit.)</b></dd> \n
<dt>闪点:</dt>
<dd><b>200 °F</b></dd> \n
<dt>折射率:</dt>
<dd><b>n20/D 1.458(lit.)</b></dd> \n
<dt>蒸汽压:</dt>
<dd><b>0.216mmHg at 25°C</b></dd> \n
<dt>蒸汽密度:</dt>
<dd><b>4.02 (vs air)</b></dd> \n
<dt>存储条件/存储方法:</dt>
<dd><b/>
<p> \n\t\t\t\t \t</p>
<div>储存于阴凉、通风的库房。远离火种、热源。保持容器密封。应与氧化剂分开存放,切忌混储。配备相应品种和数量的消防器材。储区应备有合 \n
<dt>稳定性相关:</dt>
<dd><b/>
<p> \n\t\t\t\t \t</p>
<p>避免与氧化物接触。</p>\t\t\t\t
</dd> \n
<dt>其它信息:</dt>
<dd><b/>
<p> \n\t\t\t\t \t</p>
<p>1.      性状:未确定</p>
<p>2.      密度(g/mL,20℃):1.027</p>
<p>3.      相对蒸汽密度(g/mL,空气=1):4.02</p>
<p>4.      熔点(ºC):<-70</p>
<p>5.      沸点(ºC,常压):187</p>
<p>6.      沸点(ºC,
kPa):未确定</p>
<p>7.      折射率:1.458</p>
<p>8.      闪点(ºC):93</p>
<p>9.      比旋光度(º):未确定</p>
<p>10.   自燃点或引燃温度(ºC):
未确定</p>
<p>11.   蒸气压(mmHg,20ºC):0.4</p>
<p>12.   饱和蒸气压(kPa, ºC):未确定</p>
<p>13.   燃烧热(KJ/mol):未确定</p>
<p>14.   临界温度(ºC):未确定</p>
<p>15.   临界压力(KPa):未确定</p>
<p>16.   油水(辛醇/水)分配系数的对数值:未确定</p>
<p>17.   爆炸上限(%,V/V):未确定</p>
<p>18.   爆炸下限(%,V/V):未确定</p>
<p>19.   溶解性:未确定</p>\t\t\t\t
</dd> \n\t \n </div> \n</dd>
</dl>
这是一个 html 格式 正常我用 //div[@id='phyChem']/h2[text()='物化性质']../div[@class='ip_box']/dl//dt 能拿到 11 个 dt 标签
但是用 //div[@id='phyChem']/h2[text()='物化性质']../div[@class='ip_box']/dl/dt
只能拿到 9 个 dt 标签 请问这个问题是因为什么原因呢?是不是 lxml 的一个 bug 呢?
1
xiaxichen OP 已经找到问题了 此贴终结。我犯傻气了
|