请教一个 Python pandas dataframe 特定列单元格内容高亮的问题

2021-03-04 00:57:15 +08:00
 hackpro

1 、pandas dataframe 带格式输出到 terminal/console 本身难度好像很大 遂转而输出到 html
https://github.com/pandas-dev/pandas/issues/18066

2 、html 表格高亮应该设置 df.stylebackground-color: yellow 属性
https://pandas.pydata.org/pandas-docs/stable/user_guide/style.html

3 、考虑到 dataframe 本身数据量很大,为了效率应该使用 df.apply 而非 df.applymap,后者是逐个元素处理
https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.DataFrame.apply.html#pandas.DataFrame.apply

折腾了快一个星期了,但是死活不起作用,求助各位大佬帮忙😢
精简后的 python 代码如下:

import pandas as pd
import os
import webbrowser

def write_data_to_file(filename, content):

    file = open(filename, mode='w')
    file.write(content)
    file.close()


def highlight_hot_color(col):

    hot_color = ['red', 'yellow', 'orange']
    check = [item in hot_color for item in col]
    return ['background-color: yellow' if v else '' for v in check]

if __name__ == '__main__':
    df = pd.DataFrame([['Allen', 'red', 20], ['Tom', 'yellow', 30], ['Jack', 'blue', 40], ['Bob', 'grey', 50]], 
        columns=['name', 'color', 'age'])
    df.style.apply(highlight_hot_color, subset=['color'])

    html = df.to_html(index=False)
    file_name = 'test.html'
    path_name = os.path.abspath(file_name)
    url = 'file://' + path_name
    write_data_to_file(path_name, html)
    webbrowser.open(url)
1740 次点击
所在节点    Python
5 条回复
ZAXON
2021-03-04 09:49:57 +08:00
```python
df = pd.DataFrame([['Allen', 'red', 20], ['Tom', 'yellow', 30], ['Jack', 'blue', 40], ['Bob', 'grey', 50]],
columns=['name', 'color', 'age'])
df_result = df.style.apply(highlight_hot_color, subset=['color'])

with open('test.html','w') as f:
f.write(df_result.render())
```

试试这样写?最后的生成 html 我是出于方便这么写的,你可以再看看有没有更好的写法。

我更好奇的是第一个需求,是要达到 https://github.com/pandas-dev/pandas/issues/18066#issuecomment-371150717 这样的结果吗
hackpro
2021-03-04 12:18:00 +08:00
@ZAXON 感谢大佬回复

1 、高亮的问题部分解决了 但有一个问题
df.style.apply 返回的是一个 Styler 类型 不再是 dataframe
如果我需要给 dataframe 用上 pretty_html_table.build_table 进行表格风格挑战的话还是很麻烦

2 、您提到的第一个问题 我是想做成链接里面的那样 但是好像难度很大
目前输出到命令行我用的就是最原始的 print(df.to_string()) 😄
ZAXON
2021-03-04 14:25:47 +08:00
个人感觉 dataframe -> html.table 最灵活的方法还是直接使用 jinja2,我在公司邮件里面生成表格就是这样操作的。

terminal 的格式化输出我推荐用的 https://github.com/willmcgugan/rich 这个库,不过不确定能不能解决你的这个问题。
TimePPT
2021-03-04 14:31:25 +08:00
@ZAXON jinja2+1,如果长期有样式需求,最好业务和样式分开处理。
hackpro
2021-03-05 17:13:04 +08:00
@ZAXON @TimePPT 感谢两位老哥的建议和解答

我现在的解决办法是用 dataframe.style 解决表格输出时高亮的问题,但是默认的表格实在是太丑了
所以找了个 pretty_html_table 的包,可以非常方便的解决表格样式的问题
from pretty_html_table import build_table
html = build_table(data_frame, 'green_light')
write_data_to_file('test.html', html)

但是 pretty_html_table.build_table()接受 dataframe 作为参数,输出的是 str
而我们之前讨论的 style.apply()接受 dataframe 作为参数,输出的是 pandas.io.formats.style.Styler
两者不兼容 有什么办法把这两个结合在一起吗😭

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/758228

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX