基本情况: 6 月份结业年底修完最后一门课换双证。目前蹲在一家公司实习中,但这家没有转正的 hc 。 国内的 gap 好像真的有罪。boss 直聘和猎聘完全没有下文。 base 上海,可出差
具体简历:
实习经历
| 上海 xx 科技有限公司 | 上海,中国 |
|---|---|
| 系统运维工程师 | 2023.09– 2025.01 |
- 监控系统优化:使用 Ansible 为现有 Zabbix 添加被监控主机,配置监控模板,建立企微告警系统,实现全面监控和实时告警;
-
容器平台搭建:搭建和维护 Docker 平台及 Harbor 仓库,编写 Dockerfile 创建镜像,提高应用部署效率和可靠性;
-
持续集成与部署:配置 Jenkins 实现日常持续集成和部署,优化开发流程,保障发布质量;
-
自动化运维平台搭建:搭建蓝鲸运维平台,流程化服务器等资源新建和关闭,通过 cmdb 使资源管理可视化便捷化;
-
文档编写:编写详细的运维文档,包括系统架构、部署流程、故障处理等内容,提高团队运维效率和知识共享。
| 上海 xxx 有限公司 | 上海,中国 |
|---|---|
| 实施 Intern | 2022.09 –2023.03 |
- 软件部署与维护:独立完成数据中心软件部署、升级及版本维护,保障系统稳定运行;
-
数据库管理:在 SQLServer 等主流数据库中进行查询分析、数据清洗等工作,确保数据平台的高效运转;
-
新功能调试与测试:完成数据平台中新功能调试,参与公司新产品和版本迭代时进行功能测试,并撰写产品文档,为产品优化和改进提供支持;
技能/兴趣
专业技能:
-
系统:掌握系统操作和排查,能够使用性能分析工具,对 CPU 、内存、磁盘、网络等方面进行深入分析和优化;
-
数通:掌握网络分层和各种协议分析,具备网络问题故障诊断和优化;
-
容器:掌握 Docker 、Compose 、k8s 云原生服务治理体系、监控、日志落地应用方案;
-
自动化:熟悉 Devops 理念,能运用多种开源工具( gitlab 、jenkins 、ansible 、maven 、npm )构建自动化发布;
-
数据库:熟悉 mysql 数据库集群架构、sql 应用、性能优化、数据备份恢复;
-
中间件:掌握应用常用中间件集群架构、性能优化如 nginx 、redis 、memcache 等;
-
日志和监控:熟悉 efk 、Prometheus 等可观测性开源工具;
-
云计算:熟练应用阿里云、腾讯云、AWS 等公私有云平台的服务和功能,并能够根据需求选择适合的服务。
证书/培训:
-
全国技能大赛上海选拔赛云计算银牌
-
上海市临港杯首届高校网络安全竞赛三等奖
-
高级信息通信网络运行管理员证书
-
初级信息网络安全专业人员认证证书
-
HarmonyOS 应用开发者高级认证
-
HarmonyOS 云开发基础认证
-
天翼云认证高级解决方案架构师
-
2023 年网络安全宣传周上海地区 ISG“观安杯”CTF 比赛优秀个人奖
-
Certified Kubernetes Administrator
语言: CET4 ; CET6
项目经历
CI/CD ( Jenkins + GitLab + Harbor + 容器化 + 发版通知)
项目背景:
在公司内部主导搭建了一套基于 Jenkins + GitLab + Harbor + Kubernetes 的 CI/CD 流水线,实现从代码提交到自动化构建、镜像管理、容器化部署及发版通知的全流程 DevOps 实践,显著提升研发效率和部署质量。
技术栈与职责:
-
代码管理( GitLab ):
- 基于 GitLab 管理代码,通过 Webhook 触发 Jenkins 流水线,实现代码提交后自动触发构建。
- 采用 分支策略(如
main分支保护、feature分支开发),结合 Merge Request 进行代码审核,确保代码质量。
-
持续集成( Jenkins ):
- 使用 Jenkins Pipeline ( Groovy Script ) 编写多阶段流水线,包括 代码编译( Maven/Gradle )→ 单元测试 → 代码扫描( SonarQube )→ 镜像构建( Docker )→ 推送至 Harbor。
- 通过 Jenkins Shared Library 复用通用逻辑,减少重复代码,提升维护性。
- 利用 Blue Ocean 可视化流水线状态,便于团队监控构建进度。
-
镜像管理( Harbor ):
- 使用 Harbor 作为私有镜像仓库,管理 Docker 镜像版本,并通过 Helm Chart 进行 K8s 应用编排。
- 结合 镜像扫描( Trivy/Clair ) 检查安全漏洞,确保镜像合规性。
-
容器化部署( Kubernetes ):
- 通过 Kubectl/Helm 将镜像部署至 K8s 集群,采用 滚动更新 策略,实现零停机发布。
- 结合 ConfigMap/Secret 管理环境变量,确保配置与代码分离。
-
发版通知与监控:
- 集成 企业微信/钉钉机器人,在部署成功或失败时自动推送通知,包含 版本号、变更内容、构建日志链接。
- 结合 Prometheus + Grafana 监控应用运行状态,实时观测资源使用情况。
成果:
- 效率提升:部署频率从 每周 1 次 → 每日多次,构建时间从 30 分钟 → 5 分钟(并行构建 + 缓存优化)。
- 质量提升:单元测试覆盖率从 **60% → 85%**,生产环境故障率降低 **40%**(代码扫描 + 自动化测试)。
- 成本优化:通过 容器化 + K8s 动态扩缩容,资源利用率提升 **50%**,节省服务器成本约 **20%**。
个人成长:
深入理解 DevOps 全链路,具备从 代码提交 → 构建 → 部署 → 监控 的闭环优化能力,并能通过数据量化改进效果,推动团队 DevOps 文化落地。
监控系统建设项目经验( Zabbix + Prometheus + Grafana + 告警通知 + 数据可视化)
项目背景
在公司运维架构升级过程中,主导设计并落地了一套多维度监控告警系统,整合 Zabbix (传统服务器监控) + Prometheus (云原生监控) + Grafana (可视化),实现对服务器、中间件、Kubernetes 集群及业务指标的全面监控,显著提升故障发现与响应效率。
技术栈与职责
-
基础设施监控( Zabbix )
- 部署 Zabbix Server + Agent,监控 物理服务器/虚拟机 的 CPU 、内存、磁盘、网络等基础指标。
- 自定义 监控模板(如 Nginx 、MySQL 、Redis ),通过 自动发现( LLD ) 动态添加监控项,减少手动配置。
- 配置 触发器( Trigger ) 设置阈值告警(如 CPU 持续 >90% 触发告警)。
-
云原生监控( Prometheus )
- 部署 Prometheus + Exporters ( Node Exporter 、cAdvisor 、Blackbox Exporter ),采集 K8s 集群、容器、微服务 指标。
- 通过 ServiceMonitor 自动发现 K8s 服务端点,实现动态监控。
- 编写 PromQL 查询语句,计算业务关键指标(如 API 请求成功率、延迟 P99 )。
-
告警管理( Alertmanager + 通知集成)
- 使用 Alertmanager 对 Prometheus/Zabbix 告警进行去重、分组、静默,避免告警风暴。
- 集成 企业微信/钉钉/邮件 通知,告警信息包含 故障主机、指标值、恢复建议,并附带 Grafana 仪表盘链接。
- 设置 分级告警策略(如 P1 级故障电话呼叫,P3 级仅邮件通知)。
-
数据可视化( Grafana )
- 搭建 统一监控门户,整合 Zabbix 、Prometheus 、MySQL 等数据源,设计 业务/运维/DevOps 多维度仪表盘。
- 通过 变量( Variables ) 实现动态筛选(如按集群、服务、环境过滤数据)。
- 定制 业务大屏(如交易量实时监控),支持团队快速定位问题。
成果
- 故障发现效率:平均故障发现时间从 30 分钟 → 1 分钟(实时监控 + 主动告警)。
- 告警准确性:误报率降低 **60%**(通过告警抑制和阈值优化)。
- 运维效率:人工巡检工作量减少 **80%**(自动化监控覆盖率达 95%)。
- 业务影响:因监控缺失导致的线上事故减少 **50%**,年累计节省故障处理成本约 200+ 人天。
个人成长
- 掌握 从数据采集 → 存储 → 告警 → 可视化 的全链路监控体系设计能力。
- 具备通过 数据驱动优化监控策略 的经验(如基于历史告警分析调整阈值)。
- 推动运维团队从 被动救火 转向 主动预防,提升系统稳定性。
教育背景
| 上海电机学院 | 上海,中国 |
|---|---|
| 软件工程 | 2020 - 2025 |
- 核心课程:javaweb 开发,数据库系统原理,数据结构,软件质量与测试,软件项目管理,计算机组成原理,操作系统原理