先说感叹,成熟的产品就是出问题都让人放心
上个月有一次有人反馈低代码平台不能用。
一看是低代码的应用停了。这个怎么停了?是只有他停了吗?
再去看看应用连接的数据库也停了。那么就启动数据库吧。
启动以后看看日志,之前发生什么问题了。

结果从日志上看到从7月23的13点后就没有日志了。然后就是7月28下午15点的启动。
按说不应该啊,一般遇到问题导致异常关闭,应该有错误信号和日志。但是这里明显没有。
仔细想来想去,充分相信Oracle这种成熟的产品如果没有任何记录,那只有一种可能。问题根本不在这里。
那么操作系统会不会有一些信息?毕竟Linux也是成熟的产品。
翻看日志发现一些信息

就日志是 23日下午15点多有OS的重启动作。毕竟这里的Initializing基本可以判断了。从时间可以看到15点26到15点47有20分钟的空档。
果然是成熟的产品即使是出问题也能给我们留下定位的数据。
相比较而言很多应用系统做的有问题了,Java FULL GC了。需要手工去dump才能分析。而Oracle等成熟的产品都把这些必须的记录了下来。非必要的不记录。
那么看看这几天是不是都有这种情况?

很吃惊居然有三次。
事件还原
