求職意向
運(yùn)維主管 北京 薪資面議 隨時(shí)到崗
教育背景
2020.x -2020x 錘子簡(jiǎn)歷大學(xué) 計(jì)算機(jī)科學(xué)與技術(shù)
工作經(jīng)驗(yàn)
2020.x -2020x 錘子簡(jiǎn)歷信息技術(shù)有限公司 運(yùn)維主管
工作描述:
1.負(fù)責(zé)運(yùn)維團(tuán)隊(duì)的招聘,考核,和穩(wěn)定性管理。
2.為公司業(yè)務(wù)平臺(tái)的高可用、高性能、高并發(fā)提供運(yùn)維支撐保障。
3.負(fù)責(zé)和各組負(fù)責(zé)人溝通協(xié)調(diào)需求,資源合理規(guī)劃,保障運(yùn)維工作,開(kāi)發(fā)工作,測(cè)試工作高效進(jìn)行,高效生產(chǎn)。
4.公司網(wǎng)站架構(gòu)重組,持續(xù)演進(jìn)和優(yōu)化,提升公司提升整體業(yè)務(wù)的穩(wěn)定性。
5.完善監(jiān)控報(bào)警系統(tǒng),發(fā)現(xiàn)和改進(jìn)服務(wù)器的性能問(wèn)題,并對(duì)服務(wù)器性能指標(biāo)進(jìn)行監(jiān)控。
6.針對(duì)收集的服務(wù)器性能指標(biāo),對(duì)線上業(yè)務(wù)的出現(xiàn)的緊急問(wèn)題,做出合理的處理,并在前期對(duì)服務(wù)器資源做出合理的利用,對(duì)可能出現(xiàn)的問(wèn)題做出合理的規(guī)避。
7.完善高可用集群環(huán)境,負(fù)責(zé)codis集群/mysql讀寫(xiě)分離集群/es集群/mongodb分片集群的運(yùn)維調(diào)優(yōu)及故障應(yīng)急響應(yīng)和排除并制定數(shù)據(jù)出入規(guī)則,約束開(kāi)發(fā)人員對(duì)此類(lèi)數(shù)據(jù)集群的操作。
8.指導(dǎo)編寫(xiě)各種系統(tǒng)腳本,服務(wù)器部署架構(gòu)的研究和優(yōu)化,對(duì)業(yè)界的新技術(shù)持續(xù)學(xué)習(xí)
2020.x -2020x 錘子簡(jiǎn)歷信息技術(shù)有限公司 系統(tǒng)工程師
工作描述:
1. 鉆研、應(yīng)用、分享新技術(shù)。
2. 負(fù)責(zé)和各個(gè)項(xiàng)目開(kāi)發(fā)人員溝通與協(xié)調(diào)需求
3. 和相關(guān)項(xiàng)目開(kāi)發(fā)人員確定運(yùn)維需求,優(yōu)化系統(tǒng)架構(gòu)和流程。
4. 代碼發(fā)布的優(yōu)化與和相關(guān)開(kāi)發(fā)人員溝通項(xiàng)目需求做持續(xù)集成發(fā)布
5. 負(fù)責(zé)Linux常用軟件和服務(wù)的安裝和日常維護(hù),系統(tǒng)優(yōu)化,排查疑難問(wèn)題等。
6. 負(fù)責(zé)搭建業(yè)務(wù)所需系統(tǒng)和平臺(tái),升縮擴(kuò)展以及持續(xù)的調(diào)優(yōu)
2020.x -2020x 百度彩票 系統(tǒng)工程師
工作描述:
1. 公司內(nèi)網(wǎng)vpn的搭建、管理與維護(hù)。
2. 通過(guò)jenkins對(duì)項(xiàng)目代碼做日常的發(fā)布與管理。
3.公司的監(jiān)控系統(tǒng)的日常監(jiān)控及維護(hù)。
4.管理與維護(hù)Kickstart,同時(shí)按需求優(yōu)化無(wú)人值守安裝。
5.為公司的java、php項(xiàng)目提供環(huán)境的搭建、維護(hù)、優(yōu)化支持。
6.根據(jù)項(xiàng)目需求,搭建高可用的數(shù)據(jù)庫(kù)環(huán)境,分布式存儲(chǔ)環(huán)境。
7.根據(jù)業(yè)務(wù)流量的增加擴(kuò)展,為公司項(xiàng)目增加高可用的高并發(fā)的負(fù)載均衡環(huán)境。為單點(diǎn)項(xiàng)目提供集群支持。
項(xiàng)目經(jīng)驗(yàn)
2020.x -2020x 大錘數(shù)據(jù)庫(kù)主從切換 運(yùn)維主管
需求
公司數(shù)據(jù)庫(kù)磁盤(pán)報(bào)警,只剩余20%(20G),刪除binlog或者刪除歷史數(shù)據(jù)已經(jīng)無(wú)法緩解此磁盤(pán)壓力。
運(yùn)維方案:
手工切換數(shù)據(jù)集群主從,永久性解決此磁盤(pán)壓力,
1.其中主從切換,需要開(kāi)發(fā)和測(cè)試同學(xué)驗(yàn)證數(shù)據(jù)完整性
2.主從切換需要停止運(yùn)營(yíng)的業(yè)務(wù),和預(yù)估切換時(shí)間
3.匯總數(shù)據(jù)集群各節(jié)點(diǎn)的使用情況,和切換后恢復(fù)預(yù)案
4.匯總相關(guān)業(yè)務(wù)線使用該數(shù)據(jù)集群和需要修改的配置文件
5.經(jīng)領(lǐng)導(dǎo)同意后運(yùn)維發(fā)出主從集群遷移維護(hù)通告
6.新的主節(jié)點(diǎn)準(zhǔn)備
7.編寫(xiě)數(shù)據(jù)集群操作細(xì)節(jié),并反復(fù)與參與切換的運(yùn)維同學(xué)講解和了解不懂之處,確保切換無(wú)其它操作
8.與開(kāi)發(fā)組/測(cè)試組/大數(shù)據(jù)組/講解主從切換方案/各組同學(xué)自身的難點(diǎn)和需要大家配合之處
9.經(jīng)協(xié)商確定主從切換時(shí)間,再次發(fā)出郵件通知公司,停止運(yùn)營(yíng)通告
10.主從切換
2020.x -2020x 加密接口開(kāi)發(fā) 運(yùn)維主管
需求
由于公司經(jīng)營(yíng)的特殊性,大錘的數(shù)據(jù)會(huì)有身份三要素?cái)?shù)據(jù),而2019年國(guó)家對(duì)個(gè)人信息泄漏管理嚴(yán)格,公司需要將此類(lèi)數(shù)據(jù)加密或者脫敏處理,而數(shù)據(jù)的使用和加密都由開(kāi)發(fā)人員來(lái)處理,還是會(huì)有泄密的風(fēng)險(xiǎn),領(lǐng)導(dǎo)決定此加密由運(yùn)維實(shí)現(xiàn)
實(shí)現(xiàn):
1.和領(lǐng)導(dǎo)確定加密協(xié)議
2.確定調(diào)用方式為api接口方式。
3.自主決定開(kāi)發(fā)語(yǔ)言為python
4.在django中開(kāi)發(fā)加密接口。此加密分為加密接口和解密接口
5.編寫(xiě)dockerfile將此加密接口封裝為容器.方便部署和調(diào)用
6.發(fā)出提測(cè)郵件,由測(cè)試同學(xué)作性能壓測(cè),暫支持性能為1400的QPS,并且有上升空間
7.發(fā)出郵件,將此加密接口交付大數(shù)據(jù)組調(diào)用
2020.x -2020x 特殊名單各家機(jī)構(gòu)實(shí)際請(qǐng)求次數(shù)統(tǒng)計(jì) 運(yùn)維主管
需求:
特殊名單是公司一個(gè)24小時(shí)提供查詢的,在公司賬單核對(duì)時(shí)發(fā)現(xiàn)部分機(jī)構(gòu)的查詢賬單有出入,公司希望有個(gè)實(shí)際的生產(chǎn)數(shù)據(jù):項(xiàng)目入口處各家機(jī)構(gòu)實(shí)際請(qǐng)求次數(shù),業(yè)務(wù)代碼處理的各家機(jī)構(gòu)請(qǐng)求次數(shù),數(shù)據(jù)后段處理的各家機(jī)構(gòu)處理次數(shù)
1.項(xiàng)目入口處各家機(jī)構(gòu)實(shí)際請(qǐng)求次數(shù)數(shù)據(jù)由運(yùn)維統(tǒng)計(jì)提供,業(yè)務(wù)代碼處理的各家機(jī)構(gòu)請(qǐng)求次數(shù)由java開(kāi)發(fā)同學(xué)提供,數(shù)據(jù)后端的各家機(jī)構(gòu)處理次數(shù)由大數(shù)據(jù)同學(xué)提供。
2.經(jīng)過(guò)溝通后,此數(shù)據(jù)將在codis的hash表存儲(chǔ),name為機(jī)構(gòu)的名字和當(dāng)天的日期,對(duì)應(yīng)的dic中存儲(chǔ)著,項(xiàng)目入口處各家機(jī)構(gòu)實(shí)際請(qǐng)求次數(shù),業(yè)務(wù)代碼處理的各家機(jī)構(gòu)請(qǐng)求次數(shù),數(shù)據(jù)后段處理的各家機(jī)構(gòu)處理次數(shù)
3.大數(shù)據(jù)組將獲取此數(shù)據(jù)在監(jiān)控頁(yè)面中展示。
實(shí)現(xiàn):使用python為開(kāi)發(fā)語(yǔ)言
1.連接mysql使用sql語(yǔ)句查詢已經(jīng)儲(chǔ)存的各家機(jī)構(gòu)名和對(duì)應(yīng)的機(jī)構(gòu)白名單
2.獲取項(xiàng)目入口每天日志中業(yè)務(wù)接口查詢?nèi)罩緱l數(shù),并獲取這每條日志的ip,加入在線列表中
3.獲取每家機(jī)構(gòu)的ip在日志中出現(xiàn)的次數(shù),將數(shù)據(jù)寫(xiě)入codis(redis)中
2020.x -2020x 安全組件開(kāi)發(fā) 運(yùn)維主管
需求:
公司經(jīng)常受到國(guó)外公網(wǎng)異常流量攻擊
1當(dāng)攻擊發(fā)生時(shí),相關(guān)上聯(lián)接口下的業(yè)務(wù)都將受到影響,需要緊急聯(lián)系機(jī)房拉升機(jī)房帶寬確保業(yè)務(wù)的快速恢復(fù),
2.需要手工登陸服務(wù)器使用iftop查看大流量ip,并手工加入防火墻封禁處理。
實(shí)現(xiàn):
1.使用python調(diào)用iftop,獲取大流量的ip地址,并獲取此ip的流量實(shí)際大小
2.白名單獲取,讀取此組件的各項(xiàng)目日志,獲取日志中的業(yè)務(wù)相關(guān)ip,并將ip存儲(chǔ)到codis(redis)庫(kù)中
3.異常判定,此ip流量是否超過(guò)安全閥值,如不過(guò),放行,如超過(guò)閥值,和codis(redis)庫(kù)中的白名單做對(duì)比判斷,如此ip在白名單列表中,放行,如不在白名單列表中,并且還超過(guò)安全閥值,加入iptables封禁處理
2020.x -2020x 架構(gòu)演進(jìn)之es集群 運(yùn)維主管
需求:
公司將部分特殊的名單的數(shù)據(jù)加密和存儲(chǔ)交給大數(shù)據(jù)組維護(hù),而存儲(chǔ)選型為es
實(shí)現(xiàn):
1.采用3臺(tái)機(jī)器部署es集群,當(dāng)時(shí)的es版本為6.x,在不考慮最新版本的情況下,版本選型為5.6.5。
2.部署完成后的es集群運(yùn)維和維護(hù)全部交付給大數(shù)據(jù)組。
3.大數(shù)據(jù)組自己運(yùn)維和維護(hù)的es集群在初期取得了很大的項(xiàng)目成效。
4.隨著業(yè)務(wù)的QPS越來(lái)越大,es集群的壓力一樣增大,有一天es集群宕機(jī)啦,并且無(wú)法啟動(dòng),運(yùn)維組收到大數(shù)據(jù)組的幫助請(qǐng)求,在運(yùn)維組的幫助下,es重新啟動(dòng)完畢
5.大數(shù)據(jù)組單方面希望運(yùn)維組接手此時(shí)的es黑盒運(yùn)維。在雙方溝通,并且和領(lǐng)導(dǎo)溝通后,運(yùn)維組接手es的白盒運(yùn)維,大數(shù)據(jù)組需要交接es的數(shù)據(jù)存儲(chǔ)模式,數(shù)據(jù)修改周期,業(yè)務(wù)查詢的高峰期,資源的回收使用等等,并且有相關(guān)的開(kāi)發(fā)和存儲(chǔ)需要和運(yùn)維組溝通。不可單方面修改
6.在分析了大數(shù)據(jù)組的對(duì)es使用情況后,發(fā)現(xiàn)大數(shù)據(jù)組對(duì)es只有資源的使用開(kāi)發(fā),并沒(méi)有做任何的資源回收維護(hù),es宕機(jī)可能和這個(gè)狀態(tài)相關(guān)
7.運(yùn)維組開(kāi)發(fā)出es資源回收程序,在每日的es使用低峰期主動(dòng)對(duì)es集群的可回收資源進(jìn)行回收。
8.相關(guān)文檔整理,存檔,
2020.x -2020x 架構(gòu)演進(jìn)之mongodb分片集群 系統(tǒng)工程師
需求:
公司to c的催收系統(tǒng)和官網(wǎng)系統(tǒng)在承接生產(chǎn)流量時(shí),大量的sql查詢和寫(xiě)入,并且部分業(yè)務(wù)業(yè)務(wù)數(shù)據(jù)對(duì)實(shí)時(shí)的有效性要求較高,因此由于歷史原因有大量的慢查詢,主庫(kù)查詢,對(duì)讀寫(xiě)分離的mysql壓力很大,并且影響催收員和公司運(yùn)營(yíng)人員的工作效率,在經(jīng)過(guò)和領(lǐng)導(dǎo)的多次溝通下,將催收系統(tǒng)的部分實(shí)時(shí)性要求高的和部分其他數(shù)據(jù)由mysql遷入mongodb分片集群,再異步將數(shù)據(jù)同步到mysql。
實(shí)現(xiàn):
1采用3臺(tái)機(jī)器互為主備相互分片的模式,部署催收系統(tǒng)分片集群。
2.初期版本接入催收系統(tǒng)的mongdb分片集群效果很好,并且很快得到催收員/運(yùn)營(yíng)人員還有領(lǐng)導(dǎo)的認(rèn)可。
3.官網(wǎng)系統(tǒng)亦采用3臺(tái)機(jī)器的模式部署mongob分片集群。
3.而因?yàn)榇呤障到y(tǒng)的mongodb不單單是只進(jìn)行數(shù)據(jù)展示的查詢使用,而是主要是增刪改查的操作,在運(yùn)行一段時(shí)間后,在業(yè)務(wù)的高峰時(shí)段會(huì)出現(xiàn)延遲,頁(yè)面展示為轉(zhuǎn)圈。分析日志結(jié)果為mongodb數(shù)據(jù)導(dǎo)致
4.分析mogodb分布式文件存儲(chǔ)的數(shù)據(jù)庫(kù),那么mongodb對(duì)服務(wù)器的磁盤(pán)依賴(lài)很高。
5.獲取服務(wù)器的磁盤(pán)io監(jiān)控?cái)?shù)據(jù),在業(yè)務(wù)系統(tǒng)出現(xiàn)異常時(shí),mongodb分片集群所在的服務(wù)器,磁盤(pán)io飆升,讀的io和寫(xiě)的io都很高。
6.內(nèi)部數(shù)據(jù)分析,db中的單集合整體很大,而db本身是分片存儲(chǔ)的,發(fā)現(xiàn)集合本身不是隨著db分片而分片。集合的分片有基于范圍的分片和哈希的分片,分片依賴(lài)分片鍵,并且分片健分為遞增行,隨機(jī)行,混合型,在和開(kāi)發(fā)確認(rèn)了mongodb數(shù)據(jù)的存儲(chǔ)模式和實(shí)際的存儲(chǔ)內(nèi)容后,確定集合的分片采取分片鍵為隨機(jī)型的哈希型的分片是符合業(yè)務(wù)的時(shí)間情況的。
7.催收業(yè)務(wù)發(fā)展越來(lái)越好,催收系統(tǒng)對(duì)接的mongodb分片集群動(dòng)態(tài)擴(kuò)展升級(jí),官網(wǎng)暫無(wú)需升級(jí),
8.相關(guān)文檔整理,存檔
2020.x -2020x 架構(gòu)演進(jìn)之codis集群 系統(tǒng)工程師
需求:
公司to b的業(yè)務(wù)特殊名單查詢系統(tǒng)的面向用戶是承接各大甲方的24小時(shí)不間斷查詢,初期是最大的查詢方是微博,項(xiàng)目的初期查詢是以請(qǐng)求直接查詢mysql的讀寫(xiě)分離集群。這樣持續(xù)的查詢對(duì)項(xiàng)目的壓力過(guò)大,其中像項(xiàng)目的線程,和數(shù)據(jù)庫(kù)之間的連接,內(nèi)存等等都是考驗(yàn),為此,項(xiàng)目在研發(fā)正常的業(yè)務(wù)系統(tǒng)的同時(shí),同時(shí)研發(fā)了一個(gè)黑洞項(xiàng)目,此項(xiàng)目的功能就是快速接受請(qǐng)求并返回結(jié)果,業(yè)務(wù)系統(tǒng)正常查詢數(shù)據(jù)庫(kù)并返回查詢結(jié)果,兩者同時(shí)掛載在前端項(xiàng)目入口,其中黑洞項(xiàng)目承接60%的權(quán)重,正常的業(yè)務(wù)系統(tǒng),只承接40%的業(yè)務(wù)權(quán)重。特殊名單系統(tǒng)需要一個(gè)能夠承載大流量并且快速返回查詢的后端數(shù)據(jù)系統(tǒng)。
實(shí)現(xiàn):
1.選用codis集群,并沒(méi)有選用原版的redis集群,Codis由豌豆莢于2014年11月開(kāi)源,基于Go和C開(kāi)發(fā)。
2.項(xiàng)目初期codis集群部署在兩臺(tái)服務(wù)器上面,并且這兩臺(tái)服務(wù)器還有其他非codis的服務(wù)在運(yùn)行,因此此時(shí)的codis集群,穩(wěn)定性并不是特別樂(lè)觀,在和特殊名單系統(tǒng)對(duì)接后,在業(yè)務(wù)壓測(cè)的情況下,只能承載400的業(yè)務(wù)QPS查詢,但是此時(shí)的特殊名單系統(tǒng),依賴(lài)codis緩存集群,已經(jīng)可以脫離黑洞項(xiàng)目獨(dú)立承載甲方的查詢請(qǐng)求。
3.初版的codis集群本身的穩(wěn)定性和QPS不滿足后續(xù)的業(yè)務(wù)發(fā)展需求,新的codis集群,在服務(wù)架構(gòu)的時(shí),升級(jí)得到同意,以6臺(tái)服務(wù)器組成的集群,并且前端增加了haproxy+keelived,后端的codis各組接口件合理的拆分到各服務(wù)器上部署,并且單獨(dú)的單獨(dú)的codis本身的壓測(cè)已到達(dá)12k+的穩(wěn)定QPS,業(yè)務(wù)的壓測(cè)已是業(yè)務(wù)的代碼層崩潰,后端codis緩存層無(wú)異常。
4.項(xiàng)目文件的整理,存檔。現(xiàn)特殊名單系統(tǒng)承載的甲方已增加,其中還有銀行的查詢,codis集群現(xiàn)無(wú)異常。
2020.x -2020x 架構(gòu)演進(jìn)之大用戶下的openvpn系統(tǒng) 系統(tǒng)工程師
需求:
公司和國(guó)美有對(duì)接合作,由于業(yè)務(wù)的特殊性,國(guó)美的催收系統(tǒng)并未在公網(wǎng)暴露,需要將公司運(yùn)營(yíng)的催收機(jī)構(gòu)的流量轉(zhuǎn)接到國(guó)美的內(nèi)網(wǎng)催收系統(tǒng)工作,并且下游的催收業(yè)務(wù)員遠(yuǎn)超單實(shí)例的openvpn實(shí)例。
實(shí)現(xiàn):
1.采用國(guó)美的設(shè)備建議,公司與國(guó)美間的對(duì)接采用華為防火墻互為熱備部署IPsec VPN對(duì)接。
2.在公司服務(wù)器上部署按機(jī)構(gòu)部署openvpn實(shí)例,當(dāng)機(jī)構(gòu)本身的人數(shù)超過(guò)openvpn的實(shí)例所能承載的人數(shù)后,可以擴(kuò)增實(shí)例,有新的機(jī)構(gòu)亦可擴(kuò)增實(shí)例,滿足業(yè)務(wù)需求。
2020.x -2020x 錘子簡(jiǎn)歷信息技術(shù)有限公司 系統(tǒng)工程師
需求:公司機(jī)房升級(jí)擴(kuò)容,業(yè)務(wù)拆分和增加,其中增加to c的業(yè)務(wù),需要拆分to B的業(yè)務(wù)
實(shí)現(xiàn):
1.原來(lái)的公司業(yè)務(wù)都集中在有限的幾臺(tái)服務(wù)器上面,流量入口、web應(yīng)用,數(shù)據(jù)端,測(cè)試環(huán)境,混雜嚴(yán)重。
2.設(shè)計(jì)新的網(wǎng)站架構(gòu)圖,將to c催收系統(tǒng)。to c的vpn的服務(wù)端,to b的特殊名單查詢系統(tǒng),hadoop集群環(huán)境,官網(wǎng)及其他web組件的流量入口,web應(yīng)用端,數(shù)據(jù)端,物理獨(dú)立開(kāi)來(lái),互不影響。
3.前端流量入口采用nginx+keepalived的架構(gòu)模式,后面接入tomcat服務(wù),to b業(yè)務(wù),后面接入讀寫(xiě)分離的mysql和codis緩存,to c的業(yè)務(wù)后面接入讀寫(xiě)分離的mysql和monggodb分片集群,其中催收系統(tǒng)和官網(wǎng)的mysql和mongodb獨(dú)立隔離,互不影響。
4.to c的vpn的服務(wù)端采用多實(shí)例的部署方案,突破單實(shí)例用戶數(shù)限制,達(dá)到上千的用戶規(guī)模,并且還有動(dòng)態(tài)擴(kuò)展空間。
5.外網(wǎng)流量和各項(xiàng)目的獨(dú)立外網(wǎng)交換機(jī)連接,所有服務(wù)器的內(nèi)網(wǎng)流量在同一個(gè)內(nèi)網(wǎng)交換機(jī)下交互。
自我評(píng)價(jià)
我是一個(gè)技術(shù)人員,從事的是一個(gè)服務(wù)性的崗位,我必須用我手中所掌握的技術(shù)去去解決故障問(wèn)題,同時(shí)與公司同事的關(guān)系非常融洽,同時(shí)也能通過(guò)各種途徑學(xué)習(xí)新的技術(shù)知識(shí)。提高自己的能力
內(nèi)容來(lái)源說(shuō)明:本文章來(lái)自網(wǎng)絡(luò)收集,如侵犯了你的權(quán)益,請(qǐng)聯(lián)系QQ:2772182309進(jìn)行刪除。
http://90xin.cn/article/51638.html