V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
Distributions
Ubuntu
Fedora
CentOS
中文资源站
网易开源镜像站
spr1ngs
V2EX  ›  Linux

Linux 运维 面试问题:你们服务器遇到最多的问题是什么

  •  
  •   spr1ngs · 2023-01-03 15:58:50 +08:00 · 4923 次点击
    这是一个创建于 698 天前的主题,其中的信息可能已经有所发展或是发生改变。

    没有啥实际经验 业务运维经验 一直做到服务器硬件运维 大哥们这个问题应该怎么回答 软件方面的问题

    46 条回复    2023-01-06 09:17:20 +08:00
    seers
        1
    seers  
       2023-01-03 16:17:41 +08:00 via Android
    大概率是为什么程序、接口、数据库没反应了
    kokutou
        2
    kokutou  
       2023-01-03 16:18:45 +08:00 via Android
    更新的同时保证业务。。。
    AntonChen
        3
    AntonChen  
       2023-01-03 16:21:53 +08:00
    OOM 、服务假死....
    kindom
        4
    kindom  
       2023-01-03 16:49:49 +08:00
    端口佔用、服務耗用資源突升排查、多隔離服務器校時、內網 DNS
    opengps
        5
    opengps  
       2023-01-03 16:50:36 +08:00
    gold2022
        6
    gold2022  
       2023-01-03 16:56:40 +08:00
    内网 dns 失效,oom
    lambdaq
        7
    lambdaq  
       2023-01-03 17:02:47 +08:00
    端口炸了 线程炸了 进程炸了 cgroup 炸了 pod 炸了 磁盘炸了 跳板机炸了
    andyskaura
        8
    andyskaura  
       2023-01-03 17:07:59 +08:00
    @lambdaq #7 机房炸了
    xmumiffy
        9
    xmumiffy  
       2023-01-03 17:09:52 +08:00 via Android   ❤️ 2
    机房空调坏了导致消防喷淋?
    wei2629
        10
    wei2629  
       2023-01-03 17:10:23 +08:00
    重启就好了
    spr1ngs
        11
    spr1ngs  
    OP
       2023-01-03 17:12:46 +08:00
    @xmumiffy 这也是软件?
    yaron
        12
    yaron  
       2023-01-03 17:30:25 +08:00
    登录不上了
    salmon5
        13
    salmon5  
       2023-01-03 17:36:40 +08:00
    难道不是硬盘爆了?
    ladypxy
        14
    ladypxy  
       2023-01-03 17:37:00 +08:00 via iPhone
    硬盘满了
    salmon5
        15
    salmon5  
       2023-01-03 17:37:01 +08:00
    难道不是 java 内存爆了?
    yongp
        16
    yongp  
       2023-01-03 17:39:39 +08:00
    大概率就是想让你说一种故障,然后回答解决方案、如何监控、以及后续的优化方案吧
    sampeng
        17
    sampeng  
       2023-01-03 17:44:23 +08:00
    没经验就说不知道。。不丢人
    spr1ngs
        18
    spr1ngs  
    OP
       2023-01-03 18:04:15 +08:00
    @sampeng 不知道的话 工作很可能就没有了
    sampeng
        19
    sampeng  
       2023-01-03 18:16:33 +08:00
    @spr1ngs 面试是一个双向筛选的过程,尤其是运维,你靠网上问?就算面试过了,试用期但凡组长较真,试用期就过不去。太多细节了
    cnoder
        20
    cnoder  
       2023-01-03 18:28:23 +08:00
    top1 硬盘满了
    myd
        21
    myd  
       2023-01-03 18:49:44 +08:00
    磁盘满了说明运维根本没干活
    aaa5838769
        22
    aaa5838769  
       2023-01-03 18:50:37 +08:00
    数据查询慢,业务宕了。
    xderam
        23
    xderam  
       2023-01-03 18:52:18 +08:00
    变更啊,90%以上的故障都是变更引起的。
    asilin
        24
    asilin  
       2023-01-03 18:57:06 +08:00 via Android
    遇到最多的问题,就是给别人擦屁股
    89ao
        25
    89ao  
       2023-01-03 19:03:20 +08:00   ❤️ 1
    这是个开放问题,就是让你找个你最熟悉最牛逼的场景来秀技术,这不顺杆子爬吗
    89ao
        26
    89ao  
       2023-01-03 19:30:07 +08:00
    重点不在于什么问题,在于怎么秀。哪怕磁盘满,也可以从问题分析,影响面排查,监控发现,自动清理,故障恢复,应急预案等方面去展开
    cndns
        27
    cndns  
       2023-01-03 19:45:24 +08:00
    就说在项目文档里面把 Linux 拼写成 Linxu ,其他没什么大问题
    wu67
        28
    wu67  
       2023-01-03 19:52:32 +08:00   ❤️ 1
    硬盘爆的见的最多....数据量大又不优化, 然后那个日志越来越大越来越大, 有一次把一台机给直接整挂了, 嘻嘻嘻 /dog
    hhjswf
        29
    hhjswf  
       2023-01-03 19:56:36 +08:00 via Android
    @salmon5 java 内存爆了要运维排查吗?
    zhangyichent
        30
    zhangyichent  
       2023-01-03 19:59:09 +08:00
    显卡驱动掉了
    snuglove
        31
    snuglove  
       2023-01-03 20:20:47 +08:00
    cpu 高的 内存高的 一些软件跑着跑着连不上的 一般都是看程序日志以及重启解决.
    spr1ngs
        32
    spr1ngs  
    OP
       2023-01-03 20:48:27 +08:00
    @sampeng 细节多 不代表干不了
    deorth
        33
    deorth  
       2023-01-03 23:40:09 +08:00 via Android
    rm -rf /
    earneet
        34
    earneet  
       2023-01-04 09:09:43 +08:00
    硬件频繁故障,服务部署在了自己公司机房,40 个物理机,两个月内两个 cpu 挂逼,三个硬盘挂逼。 找采购要说法,采购说也智能是照章程办事,后来迁移到了阿里云服务器上。
    8355
        35
    8355  
       2023-01-04 09:32:54 +08:00
    你回答完之后楼上的回答之后下一个问题就问你怎么处理的?怎么排查为什么会这样以后你怎么避免再次出现你又说不出来了
    上面让你踏踏实实直说你还不想....运维有没有经验连个后端都能问死你
    proxychains
        36
    proxychains  
       2023-01-04 09:44:37 +08:00
    @earneet 第一次见 CPU 挂的
    MoYi123
        37
    MoYi123  
       2023-01-04 10:05:42 +08:00
    最多的肯定是更新代码更新出 bug 吧.
    dog82
        38
    dog82  
       2023-01-04 10:21:15 +08:00
    慢 节点挂 重启
    spr1ngs
        39
    spr1ngs  
    OP
       2023-01-04 12:54:33 +08:00
    @8355 现在收集到问题了 接下来肯定要找到答案啊
    earneet
        40
    earneet  
       2023-01-04 13:20:54 +08:00
    @proxychains 公司配给我的开发机 cpu 就挂过一个了
    cshlxm
        41
    cshlxm  
       2023-01-04 18:41:32 +08:00
    日志把数据盘打满了,数据库把数据盘打满了,新来的运维 rm -rf /*** 了, 服务器网断了,断电重启后服务没起来,硬盘挂了,硬盘挂载不上, 数据损坏造成服务启动不了,升级造成依赖库不可用了,端口冲突造成服务不可用了。。。
    xiaochong2020
        42
    xiaochong2020  
       2023-01-05 12:37:22 +08:00
    假如有一堆 4k 的小文件,占满了 90g 磁盘,你会怎么清理?
    apois
        43
    apois  
       2023-01-05 16:08:08 +08:00
    实际经验,翻周报,我们这边周报都会有记录问题和解决方案,如果是商业软件出现新问题的话,先联系售后技术支持解决,可以分担一半责任。
    spr1ngs
        44
    spr1ngs  
    OP
       2023-01-05 16:30:26 +08:00
    @apois 你这不对题啊 不符合我问题 我没获取到实际 的东西 你们的流程我并不在意
    apois
        45
    apois  
       2023-01-05 22:15:51 +08:00
    @spr1ngs 哦,我答的是实际经验和业务运维经验,你的问题我也不在意,没帮到你,可以不用理会,当我什么都没说。
    xyjincan
        46
    xyjincan  
       2023-01-06 09:17:20 +08:00
    @xiaochong2020 迁移服务,格盘咋样
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2797 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 27ms · UTC 11:36 · PVG 19:36 · LAX 03:36 · JFK 06:36
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.