找个合适的运维工程师好难

2017-03-06 21:37:29 +08:00
 adrianzhang
一边是经济周期哀嚎遍野,一边是发愁找不到人。需要找一个运维工程师, JD 如下:
工作职责:
1.负责公司互联网业务线上环境部署与维护;
2.完善监控,报警,排错等管理平台建设;
3.性能调优和故障处理,保证业务 24*7 高可用;
4.负责自动化运维平台的开发和搭建。
职位要求:
1.本科学历以上;
2.三年以上互联网业务相关系统维护工作经验;
3.精通 Linux 系统,如 CentOS, Debian, SuSE, LFS 等;
4.熟练配置各种互联网基础应用,包括但不限于 DNS, HTTP, LVS,Keepalive, Tomcat, MySQL, Nagios, Zabbix 等;
5.熟悉 KVM, RHEV 虚拟化技术和 Docker 等容器技术;
6.熟练掌握 Shell 脚本;
7.了解 Puppet, Ansible, Salt 等任一配置管理工具;
8.具有一定的网络知识,了解 TCP/IP 原理;
9.具有一定存储知识,了解 SAN , NAS 等设备;
10.有 Java, Python, Ruby , Perl, PHP, Go 等开发经验者优先;
11.良好的逻辑分析能力和学习能力,良好的沟通能力,很强的排错能力。

先不说别的,仅拿一条讲讲。
按照初始想法,精通 Linux ,既然给出了多个版本包括 LFS ,那应该指对于 Linux 内核 /文件系统 /存储 /硬件驱动 /启动 / 安装 /SHELL 等等都有相对良好(相对没有在某个细分项投入一定时间钻研)实际操作能力,才称得上“精通”二字(由于是运维类职位,并不要求对源代码有多深厚的掌握)。可是几乎全部候选人( 20+,还是筛出的)对 SHELL 脚本和 VI 都不熟练。

给的薪资不能说多高,但 2~3 万还是有的。但就是很难找到符合要求的人。

看看 V2 小伙伴们怎么看。
29167 次点击
所在节点    职场话题
184 条回复
deyu260
2017-03-07 16:48:21 +08:00
了解 熟悉 精通 这三个词的区别
rogerchen
2017-03-07 16:55:09 +08:00
@tywtyw2002 所见略同,我觉得能把常见开源软件 configure 甚至是 patch 到适合特定的发行版,至少也是 Redhat , Ubuntu 组的核心开发人员了。

@adrianzhang 我觉得你们可能还是要分割职位,总架构师一个职位,偏硬件和网络配置的纯运维一个职位,互联网技术栈 Devops 一个职位,如果还有数据分析技术栈,可能还要再单招一个 Devops 。
这些东西都摸过没什么了不起的,关键是服务器集群线上不能出岔子,出问题要能 hold 住的人不好找。那些说自己只要认识英文+活用搜索引擎就行的你敢招么,显然你是想招能在 SO 上写答案的人。这些方向专精一个就很难了。
tywtyw2002
2017-03-07 17:23:14 +08:00
@rogerchen #122 其实核心算不上,但是至少是专职了。 linux 软件打包最头痛的地方就是在于 lib 的版本和库,库版本 missing match 的话就要做 back port 。 软件越大,涉及的 lib 就越多,打包的难度就越大。

之前我工作的地方有一组人专门做 sles 的软件打包工作,其中就有一项是如何让不同版本的 glib 共存。
cmlz
2017-03-07 18:07:43 +08:00
楼主的要求,在我这里的机房是一个班在做,现在你要求一个人全做了,也就是一个人能领一个班二十几号人的工资吗?
adrianzhang
2017-03-07 18:13:28 +08:00
@zhouyang 抱歉,不行。
@rogerchen 这个建议很好。我考虑考虑


@deyu260
@tywtyw2002

了解,意思是知道有这么个东西,这个东西是什么,干嘛用的,为什么要有这么个东西,业界都有哪些商家做这个,大致有些什么型号,用于实践大概是什么样子。听起来挺恐怖,咱就拿存储里的 SAN 来说,《大话存储》这本书是各大社区都推荐过的,看看这本书,能够记住书里那些东西,这对我来说就叫了解。

熟悉,工作中上手实践过,知道常用的配置和操作。

熟练,工作中上手实践过,知道改哪些配置文件,配置文件是管什么的,里头的参数都是些什么意思,知道怎么启动停止等等一般常用操作和一些不常用但很有用的操作。

精通,不仅上手实践过,而且懂得原理,并能够将相关部分的操作纯熟。例如 LVM ,知道为什么用,怎么用,哪些文件系统用。再说一个简单地挂载到哪个目录这个事情,如果不知道规范,配置文件里写成建立个 /data ,再把数据盘挂到这里,这样的配置有移植性可言吗?
Hucai
2017-03-07 18:29:08 +08:00
除了熟练掌握 shell 脚本,还有很多都是要求熟悉,了解等,好像要求不是很高,感觉寄几还是能够胜任的
Beebird
2017-03-07 18:33:48 +08:00
楼主坐标哪里?
yangxin0
2017-03-07 18:36:18 +08:00
不太好找。很多大厂的很多运维只对内部一些组件熟悉,小厂的运维就更难说了。倒是很多开发非常精通这些配置,楼主可以找找想转运维的开发。
qianguozheng
2017-03-07 18:52:11 +08:00
vi 不是很容易出错,都用 web 系统替代手工修改吗?
你这倒好还希望人用 vi, shell 需要的时候查查就好了吧。



互联网横行的年代,还在趴嵌入式的飘过,其实我也想挪窝了。。。
henices
2017-03-07 19:10:00 +08:00
要求都写了 11 条了 在我看来要求和薪水匹配度不高 是招不来人的主要原因
shanks
2017-03-07 19:30:37 +08:00
要求挺高的。。但是好像都没到点子上。
LZ 大概要的是啥都懂点的万金油熟练工?
won
2017-03-07 19:33:52 +08:00
个人感觉要求可以从阿里 p8-p10 里挖
adrianzhang
2017-03-07 20:15:13 +08:00
@qianguozheng 自动化还没有到可以不依赖人的程度
adrianzhang
2017-03-07 20:16:52 +08:00
@shanks 一专多能吧~其实前头回复里也解释过,例如内核,会在没搜索的情况下能升级内核,就算精通。
adrianzhang
2017-03-07 20:17:05 +08:00
@Beebird 帝都
tracymcladdy
2017-03-07 21:30:17 +08:00
罗嗦一点吧。其实楼主提的这些条件一点都不高。
有经验的运维开发搞定真的是分分钟。
有经验的运维开发都会在初期做好日志,监控。各种自动化脚本等。
运维开发真正最难的是根据业务需要,一些产品参数的设置。比如 linux 内核参数的调优,这个 tomcat 该最大给多大内存,一台机器上该上多少个 tomcat , tomcat 用阻塞模式还是非阻塞模式,缓存的最大连接数给多少, nginx 的连接时间给多长, session 是集中在中央缓存管理还是分布到各个容器中管理然后同步等等。都要一个一个用脚本测试,调到最优状态,并且不放过每一个问题。
而且最关键的是这些参数配置是没有任何前人的经验可以直接拿来用的,业务不同,应用不同,环境不同,没有一套固定的标准的。
再比如压力测试时,测试数据开始全部被压到了一个 tomcat 实例中去,感觉集群像没生效一样,但是前台模拟访问,业务请求又会被分配到不同的实例中去,折磨了一天各种找问题后来才知道 nginx 是基于 C 类地址哈希,同一个内网来的压力测试请求,如果基于 ip hash 的 nginx 部署方式,怎么都会在一个容器上,类似的坑,不知道踩过多少。
13 年就是这样一个核心项目的大集群,调这些参数和压力测试我就用了 3 个多星期,还有上线初期的监控和调优。
不过这些其实都还是算值得的,运维就是要把前期工作做足,然后上线了能天天一觉睡到自然醒就是最好的状态。
Beebird
2017-03-07 21:46:37 +08:00
@adrianzhang 好远。。。
tftk
2017-03-07 21:59:25 +08:00
@tracymcladdy 我觉得你说这些跟 运维开发 没啥关系。。。其实我一直不明白国内为什么要把 运维 和 运维开发 分为两个职位,记得听说过早期的 SA 都是 C 语言程序员,运维默认不是应该自带开发技能么( C 语言至少应该能看懂吧,那些能写 Python 就自称 运维开发 的真的不太好的。。
tracymcladdy
2017-03-07 22:04:52 +08:00
@tftk #138 那请教下你觉得什么样的才算是。 我觉得运维架构不分家,最后的核心竞争力其实是理解和驾驭业务的能力。而不是你能写多少自动化脚本,能管理好多少应用。
牛逼的架构师和运维,都是某个领域的业务专家,资深咨询师。
oth
2017-03-07 22:47:25 +08:00
LFS 大概玩过十几遍吧,那时在做某发行版的一个微小功能。

文件布局虽有些规则,但各大发行版的细节是千差万别,熟悉一个发行版的高手, 2-3w 也不难。

再说 shell , 鲜有职位招聘要这一技能,所以谁回去学写 shell 呢,还不如学学 ruby python 来的实惠。

vi 这个不用,都是 vim

各种基础应用的配置做过一段时间就知道,没必要记忆,只要积累文档,因为应用版本更新,配置手法就会有变化。

比如 MySQL ,我每次都是去看官方文档,当然不一定是 MySQL 官方的,也有其他官方文档,但,如果提高熟练度,那么就是另一个职业 DBA 的要求了

KVM 和 DOCK 的官网文档我都看过。。。 kvm dock 主机也都配置过。。。主要是闲的。。。

运维工具, salt 玩过,但,只是认真搞过这几个其中一个工具, 2-3w 也是很轻松

总的说来,我基本都玩过,杀时间而已。。。

理想的运维真是个劳苦活...

越是规模大的公司,对于单个运维来说也是拧螺丝,这些都懂的,谁会去干活呢?

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/345422

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX