泥潭日报 uscardforum · 每日精选

我才知道很多金融公司和互联网公司的SDE的on call是7*24小时哪怕深夜3点也要被吵醒修bug的

内容摘要

互联网与金融公司SDE需7x24小时待命应对突发故障。

1. 关键信息

  • #3 跨时区团队协作覆盖(美国/中国)。
  • #5 #13 大量 false alarm 干扰。
  • #16 出大事时VP也需深夜介入作战室。
  • #23 Grafana全球宕机波及多地oncall。
  • #27 误操作P0事件引发权限冲突。

2. 羊毛/优惠信息

3. 最新动态

4. 争议或不同意见

  • #7 仅少数人常被call,多数数年无事件。
  • #14 正规公司有ops拦截,产品组除外。
  • #28 建议入职正规公司朝九晚五。

5. 行动建议

  • 优先选择有ops拦截的公司。
  • 避免产品组infra岗位。
  • 入职前确认oncall机制与false alert处理流程。
原始内容
--- 第 1 楼来自 高壮男 的回复 (2026-04-24 15:36:09 PDT) ---

这也太累了吧。尤其是那种量化对冲基金或者金融公司的。

--- 第 2 楼来自 老瓢虫 的回复 (2026-04-24 15:37:18 PDT) ---

小林去找个实习吧,别在实验室闭门造车了

--- 第 3 楼来自 0001 的回复 (2026-04-24 15:37:35 PDT) ---

员工一个在美国一个在中国,什么时候出问题都是有人白天

--- 第 4 楼来自 sanitary3528 的回复 (2026-04-24 15:41:00 PDT) ---

0001: 员工一个在美国一个在中国 中国太贵了,在印度或者东欧呢

--- 第 5 楼来自 fularji 的回复 (2026-04-24 15:42:12 PDT) ---

这是有prod的组的常规操作吧 比较气的是大半夜被叫醒然后发现是别的组page错了

--- 第 6 楼来自 sanitary3528 的回复 (2026-04-24 15:44:19 PDT) ---

更气的是一堆 false alert 没人修

--- 第 7 楼来自 msft 的回复 (2026-04-24 15:46:43 PDT) ---

还好吧。金融公司也就一小波人经常被call,多数人干好几年都遇不到这种事。

--- 第 8 楼来自 Aeromexico 的回复 (2026-04-24 15:47:03 PDT) ---

在aws打工的猴子:别说了别说了。

--- 第 9 楼来自 IRS_pro 的回复 (2026-04-24 15:50:14 PDT) ---

都有轮班吧

--- 第 10 楼来自 qwaszx 的回复 (2026-04-24 16:11:12 PDT) ---

不然为啥叫on call呢

--- 第 11 楼来自 Pipita 的回复 (2026-04-24 16:11:34 PDT) ---

血汗工厂你以为开玩笑呢。找个班上吧小林,面试经验还没牛牛姐多。等会牛牛姐先进大厂了。

--- 第 12 楼来自 Joshua 的回复 (2026-04-24 16:15:50 PDT) ---

这就是搬砖版常提到的on call啊,

--- 第 13 楼来自 kerrygold 的回复 (2026-04-24 16:26:06 PDT) ---

绝大部分时候都是false alarm,纯折腾人

--- 第 14 楼来自 Thickness4968 的回复 (2026-04-24 16:27:49 PDT) ---

找个班上吧 稍微正规点的公司基本都有ops拦在第一线 当然产品组除外,这也是我从来不去产品组天天在infra摸鱼原因

--- 第 15 楼来自 eXterkTi 的回复 (2026-04-24 16:28:30 PDT) ---

我前司是电商公司都有7x24 oncall呢,我就是那个苦命的oncall lead,后来分时区协作了才好些。

--- 第 16 楼来自 AppleVisionPro 的回复 (2026-04-24 16:38:46 PDT) ---

出大事的时候, 连vp都在晚上叫起来在作战室里面 一堆人看一个人修bug /uploads/short-url/nN3pOlgkiVgHo1ldvSCfpe0L4qP.jpeg?dl=1

--- 第 17 楼来自 一起看海 的回复 (2026-04-24 16:40:03 PDT) ---

这么好的论坛ID,结果居然是小林

--- 第 18 楼来自 eXterkTi 的回复 (2026-04-24 16:40:06 PDT) ---

双十一我们跟开春晚一样,茶水间里睡倒一大片

--- 第 19 楼来自 starlight 的回复 (2026-04-24 16:41:54 PDT) ---

很多公司各大主要时区都有office呀

--- 第 20 楼来自 AppleVisionPro 的回复 (2026-04-24 16:42:36 PDT) ---

双十一之前应该一段时间code freeze了吧

--- 第 21 楼来自 eXterkTi 的回复 (2026-04-24 16:43:58 PDT) ---

对,但是我当时是cloud ops,跟网吧网管一样的背锅侠

--- 第 22 楼来自 eXterkTi 的回复 (2026-04-24 16:46:45 PDT) ---

看公司,很多公司不信任branch office解决能力,不给你权限,也不帮你cover

--- 第 23 楼来自 独一无二_没有空格_简短 的回复 (2026-04-24 16:54:37 PDT) ---

去年Grafana全球宕机刚好被我碰到了,感觉整个地球的oncall都被叫醒了。另外组的一个妹子好像同时收到了三十多个服务器报警

--- 第 24 楼来自 cla 的回复 (2026-04-24 17:41:32 PDT) ---

林啊,你等封号了再开下一个行吗?每次新号一眼露馅,还掩饰,是有啥x癖不

--- 第 25 楼来自 XACO 的回复 (2026-04-24 19:23:35 PDT) ---

/uploads/short-url/6uHkiP0z8QcbmInWZGjUkUQvXks.jpeg?dl=1 晚上起个床咋了

--- 第 26 楼来自 高壮男 的回复 (2026-04-24 21:05:25 PDT) ---

no pain no gain

--- 第 27 楼来自 土拨鼠工业发展促进会 的回复 (2026-04-24 21:11:12 PDT) ---

上次有个SB一点小事情凌晨4点半不知道哪个组的人过来ping我说要我关实验 我一看实验是组里P0的 我要是管了大家都得喝西北风 赶紧让他不要动手 然后这个SB还想让我关我们的权限 直接找director说这个人是二百五 他再也不敢找茬了

--- 第 28 楼来自 nadecantcode 的回复 (2026-04-24 23:58:42 PDT) ---

你找点正规公司吧 我oncall都是早8晚5 出问题第二天再修

--- 第 29 楼来自 normanbatesalienscow 的回复 (2026-04-25 00:25:54 PDT) ---

/uploads/short-url/6djC0IBSGDYRIT4OecrcnZDysnh.jpeg?dl=1