V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
• 请不要在回答技术问题时复制粘贴 AI 生成的内容
michael2016
V2EX  ›  程序员

面试题:业务 5XX 激增挂了,如何快速应急?

  •  
  •   michael2016 · 29 天前 · 3148 次点击
    上一篇发的问题还是有很多人参与讨论了,气氛很好,大部分还是理性的,任何技术东西都有利弊,我们深入了解不同场景存在不同的利弊之处,研究透,能够驾驭得住才是真本领,也非常感谢各位的参与,我自己也学习到了很多现在年轻工程师的一些看问题角度和思路。哈哈

    咱们接着来:
    1. TCP 三次握手和四次挥手的过程,为什么握手是三次,挥手是四次?
    2. 讲讲 MySQL 数据库不同引擎类型之间的区别?如何选择?在实际使用过程中遇到什么风险问题?如何调优解决的?举两个应用场景。
    3. 数据库突然异常,查看参数内存使用率飚高,从而触发了内存 OOM ,导致主备切换,触发这个 OOM 的可能原因有哪些?说说排查思路。
    4. https 和 TLS 的原理是什么?在实际使用过程中遇到什么需要注意的点或风险问题?如何解决的?
    5. 业务突然 5XX 了,接口调用报错,如何快速应急?讲讲大致的思路。
    6. 传统防火墙管理时间长了会积压很多策略,导致防火墙四层 ACL 处理量大,性能下降或者是存储空间不够,应该如何恰当的管理四层网络隔离?
    7. 公司业务要出海,老板通知要满足海外的数据安全合规,如果你是业务负责人,应该如何做?

    请理性不带情绪的参与技术讨论,不喜欢不要带情绪,跟自己对话,控制情绪也是职场一个很重要的点。
    12 条回复    2025-09-24 11:19:57 +08:00
    NoDataNoBB
        1
    NoDataNoBB  
       29 天前
    回滚版本
    bob971683
        2
    bob971683  
       29 天前   ❤️ 6
    1.坚称系统正常,是用户不会用。
    2.承认有问题,但肯定是别人的锅。
    3.说想修但没工具,束手无策。
    4.后悔当初能行动,现在已晚矣。
    kiraskyler
        3
    kiraskyler  
       29 天前
    1 、握手,syn ,ack+syn ,ack ,挥手 fin ,ack ,fin ,ack ,四次挥手因为关闭 tcp 可以单端关闭,也就是 tcp 是双向的,可以关闭一个方向。实际实践中,握手 4 次,挥手 3 次也都是正常的。

    3 、oom 发生在一个进程 page fault 缺页异常申请内存但内存不足时,排查需要监控发生 oom 时刻内存占用情况,通常来说专门跑数据库的机器不应该有其他业务抢内存,数据库进程内存也应该长时间保持一个大致的水位线,不会明显波动。需要长时间监控,排查 oom 时刻各进程的内存情况,是其他进程波动还是数据库波动。
    liuidetmks
        4
    liuidetmks  
       29 天前
    @yushxzh832 半部 YM 治天下
    DefoliationM
        5
    DefoliationM  
       28 天前 via Android
    1. TCP 三次握手和四次挥手的过程,为什么握手是三次,挥手是四次?

    老生常谈了,懒得回复了,懂得都懂,现在这个阶段问点 quic 相关的可能更好。

    2. 讲讲 MySQL 数据库不同引擎类型之间的区别?如何选择?在实际使用过程中遇到什么风险问题?如何调优解决的?举两个应用场景。

    这个确实不知道,MySQL 用的不多。

    3. 数据库突然异常,查看参数内存使用率飚高,从而触发了内存 OOM ,导致主备切换,触发这个 OOM 的可能原因有哪些?说说排查思路。

    感觉是数据库 bug ,或者 SQL 查询写的有问题,limit 设置不合理或者没用流读数据。如果有 SQL 查询日志可以看看那个时段有哪些 SQL 大概就能排查出来。如果是正常请求,建议提 issue 或者给机器加内存。


    4. https 和 TLS 的原理是什么?在实际使用过程中遇到什么需要注意的点或风险问题?如何解决的?

    原理?感觉要写很多,先非对称协商对称加密的密钥,之后都是对称加密。目前主流是使用 aead 。注意防着点客户端所在主机被注入恶意的 ca 证书导致 tls 被劫持,http 请求的内容全被监听了。解决方法是加点 edr 或者 waf ?

    5. 业务突然 5XX 了,接口调用报错,如何快速应急?讲讲大致的思路。

    看情况吧,正常应该会有备用服务,监控检测到异常直接切换过去。

    6. 传统防火墙管理时间长了会积压很多策略,导致防火墙四层 ACL 处理量大,性能下降或者是存储空间不够,应该如何恰当的管理四层网络隔离?

    盲猜防火墙写的太垃圾了,不会自动合并同一网段的地址。自己写的就优化一下,第三方的就换。


    7. 公司业务要出海,老板通知要满足海外的数据安全合规,如果你是业务负责人,应该如何做?


    首先坐飞机飞到对应国家,然后创建公司,然后建设机房,最后在机房部署另一套服务,海外的请求都发给这一套服务。
    Ketteiron
        6
    Ketteiron  
       28 天前
    @DefoliationM #5 第七条不需要实体机房啊,只要是该国家的云服务器就行。
    swananan
        7
    swananan  
       28 天前
    如果面试有人问我三次握手和四次挥手的问题,我会进一步讨论,为什么 TCP 在这方面设计是有问题,QUIC 的解法为什么更优秀。

    https://jt26wzz.com/posts/0003-implement-quic-in-rust/
    https://jt26wzz.com/posts/0008-implement-quic-in-rust/
    cheng6563
        8
    cheng6563  
       28 天前
    1.懒得背
    2.无脑 innodb ,除非你要有意避开事务。
    3.内存配置多了呗
    4.懒得背,风险可能是是 SNI 泄露,开 DOH 解决。native 客户端可加验一下证书有效性。
    5.看监控,没监控就挨个摸。
    6.隔离个毛,内网全开,安全全靠堡垒机
    7.海外哪来那么多安全合规,国内都能搞定还搞不定海外?没有墙你甚至不需要当地服务器 IP
    harlen
        9
    harlen  
       28 天前
    被问过。
    面试官给的答案: 首先就是加机器。 怎么快怎能来, 等排查完用户都丢失了。
    说他们是扁平化,任何开发都有权限,操作加机器,没得那么多条条框框
    testcgd
        10
    testcgd  
       27 天前 via Android
    1.阿巴阿巴
    2.无脑 innodb ,其他走 Redis ,hive ,es
    3.看 qps,看慢 sql
    4.阿巴阿巴,证书记得续费
    5.不管干了啥先回滚,然后看监控,看日志,捞 trace
    6.环境隔离,策略梳理删除
    7.多地区部署完事
    spritecn
        11
    spritecn  
       27 天前
    无脑重启
    bv
        12
    bv  
       27 天前   ❤️ 1
    @swananan 知乎同名,早已关注。此地偶遇,甚幸甚幸。
    关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   Solana   ·   3313 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 21ms · UTC 10:55 · PVG 18:55 · LAX 03:55 · JFK 06:55
    ♥ Do have faith in what you're doing.