分享
定制
部分內(nèi)容僅限于 mysql。
0. 國內(nèi)呆不下了,趕緊出國
首先,不要選動車,要選最近的一班飛機,盡快出國,能走高速走高速,不然選人少的路線。
沒錯,我們 DBA 都是常備護照的。
切記,注意看高德地圖實時路況。
我們有個前輩就是刪庫之后開車就上二環(huán),下午五點鐘。
警察到的時候他還堵在路上。
1. 只不過是把數(shù)據(jù)干掉了
權限問題永遠是大問題,做好權限回收,開發(fā)數(shù)據(jù)庫和線上數(shù)據(jù)庫分離,線上數(shù)據(jù)庫管理權限(一般指修改表結構權限與刪表權限)禁止回收,也不提供給業(yè)務直接用。
不然參考 0。
公司管理上,最好有自己的 DB 運維產(chǎn)品,線上數(shù)據(jù)庫只允許查,改的話要有審批流程。
至于查數(shù)據(jù)要不要脫敏、導入導出流程,就看自己產(chǎn)品的規(guī)劃和排期了。
至于 DBA 怎么保證不手滑,這個每個人有每個人的習慣。
2. 刪庫什么的都是小 case
清理數(shù)據(jù)庫之前一定要檢查進程,是否存在數(shù)據(jù)庫進程,如果存在則寧愿不搞也不要深夜搞。
公司清理數(shù)據(jù)庫要有下線流程。
下線一定要走流程。
寧愿多租幾天機房也不要丟掉數(shù)據(jù)。
不然參考 0。
原則是:
rm 文件之前先檢查進程是否存在。
絕不手工 drop 庫表,如果非要 drop,則應該寫成 rename,truncate 也是類似,寫成 rename 和 create table like 兩條 sql。
刪表之前可以根據(jù)表文件的最后修改時間進行再次確認,不確認就找人 review,有下線流程則走下線流程。
3. 備份,備份,備在何處?
冷備,熱備都要有,一定要每天一備。
冷備便是應對這種情況。
公司應該有自己的 DB 備份方案,并且保證執(zhí)行到位。
4. 人算不如天算
關于這一點,可以單獨拉一個大專題出來了,核心內(nèi)容是 mysql 高可用。
簡單起見,推薦這篇文章:避免硬件故障的核心解決方案是冗余。
硬件層面的 raid,軟件層面的主從、熱備都是為了保證某一個節(jié)點宕機,其他節(jié)點仍然能繼續(xù)工作。
所有庫都要有主從備份,一方面做讀寫分離,一方面也是為了備份、高可用。
即便有半同步復制,有些極端情況下可以認為,mysql binlog 沒有同步到從庫上,仍然可能存在 binlog 丟失(數(shù)據(jù)丟失)的風險。
所以應對這點,比較好的開源解決方案有 2:TiDB 和 Mysql GR。
5. 升級也能失???
說起來很簡單,升級無非是:
準備升級
過程原理
手工升級后拓撲:
工具(mha)升級后拓撲:
6. 操作之前有個流程
一般自己操作的時候,都不會有太多的顧忌。
但是要是拿給別人看,就要考慮一下了。
如果別人不只要看,還要 review,那這樣就比較難犯重大的錯誤了。
如果有些操作需要夜間一個人搞,那么一定要提前列好準備,這個就比較正式了。
包括:
1. 梳理具體的執(zhí)行步驟、執(zhí)行命令和每個步驟的預計結果。
2. 如果某些步驟出錯,是否要求回滾、預先制定回滾方案。
3. 詳細記錄執(zhí)行記錄,每一步都要有反饋。
4. 事先梳理好收尾工作。
5. 強關聯(lián)業(yè)務要事先通知,考慮到時間段和別的業(yè)務高峰,盡量讓對方也安排人留守觀察。
6. 一定要嚴格按照步驟來進行操作。
寧愿延期,不要加戲。
7.我救了我同事
我是一個喜歡備份數(shù)據(jù)庫的人,騷操作之前還特別謹慎。
不過同事踩了,在群里說數(shù)據(jù)庫沒了,求救,我到現(xiàn)場看到同事就是坐地板上,很冷的地方,t恤全都濕了,一頭都是汗,頭發(fā)都濕了,說話帶抖的。
幾個大牛在討論數(shù)據(jù)恢復的事兒
然后我說我有上周的備份
同事兩眼放光,張開血盆大口跳起來抱住我……一身臭汗啊喂??!
然后賺了好幾頓飯
8.實習的時候刪過測試庫
實習的時候刪過測試庫,當時是全組的開發(fā)每人一個自己的測試庫,但是是放在同一個MySQL服務上的。
干昏了把組里一個QA的測試庫給干掉了~
后來組里的老司機教了我一個,對數(shù)據(jù)庫直接操作時養(yǎng)成習慣不管干啥都先敲個begin; 確認沒問題了再commit; 很多時候錯誤的SQL執(zhí)行的時候就意識到了,這時候rollback還來得及~ 線上還沒出過事故,有次上線時弄錯了還好rollback回來了~
教我的那個老司機現(xiàn)在已經(jīng)跳槽去別的公司了,但是我感覺這個習慣背后是有故事的,一直沒有機會問問他~
9.過度興奮刪庫
十年前吧,連續(xù)干了36小時,把存儲過程調(diào)試完很興奮,清理測試數(shù)據(jù)時順手就把主數(shù)據(jù)表truncate了。
那感覺天塌下來一樣!
抖了十分鐘,想起來還好有備份,但當時沒敢動。
把業(yè)務停了回去睡覺,怕一激動把備份truncate 了。
第二天找到兄弟陪著,把表恢復了。
10.我死了
記得去年在廣西,核心網(wǎng)新加一個硬盤。
按規(guī)范新硬盤上之前要先格式化一下,簡單的命令,一個回車下去搞定。
等格完,新硬盤安裝完畢。
回去睡覺,第二天一早炸了,幾十萬用戶掛了吧。
關鍵是還沒有備份,后面的事情圈內(nèi)人應該都知道了吧。
11.不小心沒做過,惡意的遇到過
不小心沒做過,惡意的遇到過,以前在某全球500強公司工作的時候,遇到過有人惡意把數(shù)據(jù)庫連同備份刪光光,發(fā)現(xiàn)后反饋給上級,花了巨資請很多公司恢復,還拿到專門的硬盤恢復機構,然后請了做安全方面的巨牛公司(好幾家)查兇手,最后的結果是失敗,既沒有恢復,也沒查出是誰干的,一來是內(nèi)部的人不好查,因為很多人知道管理員密碼,還記得密碼是:(此處省略,可能會暴露身份,哈哈),這個刪的人比較懂,應該是堵死所有能查他身份的路還有恢復備份的路(備份只有一份),我一直懷疑是某小哥哥干的,因為那天是他在公司的最后一天,轉天的飛機出國了,是移民不回來,大家估計都懷疑是他,但沒有證據(jù),也不知道誰怎么得罪他了。
也可能是其他人想栽贓他。
里面最重要的是該公司進入中國以來的所有財務數(shù)據(jù),好在有物理單據(jù),老大也有招兒,聯(lián)系本地高校,花小錢讓一批大學生來幫助重新錄入的。
錄了三個月才補好,后來就加強了安全措施和多份備份。
管理員密碼只有少數(shù)人知道了。
家賊難防。
end
來源:知乎https://www.zhihu.com/question/58802374
本文內(nèi)容來自互聯(lián)網(wǎng),如果侵犯了您的權益,請聯(lián)系管理員立即刪除(附上內(nèi)容地址)
錘子簡歷,名企精英都在用的專業(yè)簡歷,700萬優(yōu)秀人才選擇的智能簡歷工具,注冊即可免費領取簡歷模板!
【使用錘子簡歷小程序制作簡歷】
零經(jīng)驗實習簡歷模板
21254人用過
學生求職簡歷模板
52754人用過
申請研究生簡歷模板
2324人用過
經(jīng)典工作簡歷模板
6254人用過
投行咨詢簡歷模板
12465人用過
產(chǎn)品經(jīng)理簡歷模板
7532人用過
程序員簡歷模板
7457人用過
留學英文簡歷模板
4554人用過