V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
Distributions
Ubuntu
Fedora
CentOS
中文资源站
网易开源镜像站
cevincheung
V2EX  ›  Linux

乃们用啥做 Linux 上的 daemon 监控?sphinx 挂了都不知道。 - -#

  •  
  •   cevincheung ·
    cevin · 2014-10-28 21:56:16 +08:00 · 3761 次点击
    这是一个创建于 3690 天前的主题,其中的信息可能已经有所发展或是发生改变。
    很简单,挂了自动重启那种。
    29 条回复    2014-10-30 06:50:08 +08:00
    bitwing
        1
    bitwing  
       2014-10-28 21:58:11 +08:00
    supervisor 有这种功能的吧
    julyclyde
        2
    julyclyde  
       2014-10-28 22:00:30 +08:00
    init-daemontools
    用SIGCHLD串一串
    frankzeng
        3
    frankzeng  
       2014-10-28 22:14:20 +08:00
    这种对于做运维的太简单了,可以先检测,发现不正常kill掉,然后重启,把这功能做成脚本放到crontab里,5分钟运行一次。
    cevincheung
        4
    cevincheung  
    OP
       2014-10-28 22:15:51 +08:00
    @frankzeng 最好有一个工具会更好吧,比如

    /sbin/daemon-mointer searchd xxxxxxxx
    然后就万事大吉了。
    eriale
        5
    eriale  
       2014-10-28 22:17:16 +08:00
    supervisor可以自动重启挂掉的应用。
    wuxqing
        6
    wuxqing  
       2014-10-28 22:17:44 +08:00
    可以试试monit
    frankzeng
        7
    frankzeng  
       2014-10-28 22:21:11 +08:00
    你要是会用shell,这比工具简单多了。
    20150517
        8
    20150517  
       2014-10-28 22:21:16 +08:00
    @frankzeng 我去,你们运维就是这样不管3721不正常就kill吗?代码发来看看,哈哈
    frankzeng
        9
    frankzeng  
       2014-10-28 22:23:00 +08:00
    @20150517 对于不正常的进程,首先上去就是重启,你别说,重启能解决90%的问题。
    cevincheung
        10
    cevincheung  
    OP
       2014-10-28 22:24:24 +08:00
    @frankzeng 这个我同意,这是能最大化节省运维时间和成本的方法,与其消耗100分钟的时间去查原因,还不如直接花1秒时间重启服务来得快。
    Jaylee
        11
    Jaylee  
       2014-10-28 22:29:27 +08:00
    supervisor
    binux
        12
    binux  
       2014-10-28 22:36:35 +08:00   ❤️ 1
    sarices
        13
    sarices  
       2014-10-28 22:44:49 +08:00
    supervisor +1
    est
        14
    est  
       2014-10-28 23:14:45 +08:00
    @frankzeng 直接跑个while true ? 也是个好思路。。。。
    pubby
        15
    pubby  
       2014-10-28 23:44:08 +08:00
    @est while true +1

    写过一个服务,一直跑下去会出现奇葩问题,所以.....自带主动停止功能 ^-^
    bearice
        16
    bearice  
       2014-10-28 23:53:13 +08:00
    daemontools拯救世界(不是那个虚拟光驱)
    ryd994
        17
    ryd994  
       2014-10-29 00:01:07 +08:00 via Android
    骚年学学systemd吧
    maemual
        18
    maemual  
       2014-10-29 00:02:03 +08:00
    居然还有这么多人不知道supervisor
    ericls
        19
    ericls  
       2014-10-29 01:58:49 +08:00 via Android
    pip install supervisor
    frankzeng
        20
    frankzeng  
       2014-10-29 06:51:52 +08:00
    @est 为什么要用while true,5分钟之类的跑一次不行么,要是代码逻辑有问题,瞬间就把机器弄死了。
    laputaprince
        21
    laputaprince  
       2014-10-29 07:46:41 +08:00
    就我一个人用 upstart 么。。
    msg7086
        22
    msg7086  
       2014-10-29 10:07:51 +08:00 via iPhone
    就我一个人用 god 么。。
    mulog
        23
    mulog  
       2014-10-29 10:15:39 +08:00
    @laputaprince
    you are not alone :P
    clino
        24
    clino  
       2014-10-29 11:15:51 +08:00
    supervisor +1
    hzqim
        25
    hzqim  
       2014-10-29 11:20:47 +08:00 via Android
    @msg7086
    @laputaprince
    @bearice
    @ryd994
    谢谢您们的介绍!
    codeninja
        26
    codeninja  
       2014-10-29 12:07:12 +08:00 via Android
    monit
    hq
        27
    hq  
       2014-10-29 12:54:09 +08:00
    用supervisord也要注意server重启后supervisor自己会自动运行,不然负责监控的死了
    http://supervisord.org/running.html#running-supervisord-automatically-on-startup
    julyclyde
        28
    julyclyde  
       2014-10-29 14:55:26 +08:00
    @maemual python-supervisor不能保证它自己不死啊
    jpuyy
        29
    jpuyy  
       2014-10-30 06:50:08 +08:00 via iPhone
    直接用forever,还可以根据不同的日志输出到不同文件里方便排查问题
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   4953 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 24ms · UTC 03:58 · PVG 11:58 · LAX 19:58 · JFK 22:58
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.