算法工程師簡歷范文
求職意向
算法工程師 湖南長沙 薪資面議 隨時到崗
教育背景
2020.x -2020x 錘子簡歷大學 地球信息科學與技術(shù)
相關(guān)課程:線性代數(shù)、微積分、概率論與統(tǒng)計、復變函數(shù)與積分變換、數(shù)理方程、計算機基礎(chǔ)、
微機原理與匯編語言、C++程序設(shè)計、MATLAB程序設(shè)計、數(shù)字信號處理、地球信息數(shù)據(jù)處理與反演等
2020.x -2020x 錘子簡歷大學 地球探測與信息技術(shù)
相關(guān)課程:數(shù)值分析、計算地球物理、地震資料數(shù)字處理、地球物理反演等
自學課程:Machine Learning (Andrew Ng)、自然語言處理綜論 (馮志偉)、統(tǒng)計學習方法 (李航)、統(tǒng)計自然語言處理基礎(chǔ) (苑春法)、統(tǒng)計自然語言處理 (宗成慶)、Python自然語言處理等
工作經(jīng)驗
2020.x -2020x 錘子簡歷信息技術(shù)有限公司 算法工程師
- 負責開發(fā)文本相關(guān)的算法,維護數(shù)據(jù)質(zhì)量,為科研數(shù)據(jù)平臺建設(shè)和產(chǎn)品服務提供基礎(chǔ)
- 參與開發(fā)智匯云科研數(shù)據(jù)檢索和分析功能
2020.x -2020x 錘子簡歷信息技術(shù)有限公司 物探數(shù)據(jù)工程師
- 對野外采集的彈性波數(shù)據(jù)進行信號處理、圖像處理、反演(信息預測)等,重現(xiàn)地下三維空間
- 跟進學習行業(yè)前沿新算法,應用于實際生產(chǎn)項目
項目經(jīng)驗
2020.x -2020x 智匯云-科技論文數(shù)據(jù)服務類產(chǎn)品 負責算法研發(fā)
項目描述:開發(fā)科技論文數(shù)據(jù)去重、標注、檢索排序算法,建立科研數(shù)據(jù)檢索和分析服務平臺
1. 數(shù)據(jù)去重算法
獨立完成開發(fā)
- 方法: 提取作者、標題、關(guān)鍵詞和摘要文本,經(jīng)過分詞、TF-IDF加權(quán)、hash計算、合并和降維處理,將文本轉(zhuǎn)換為SimHash代碼,通過Hamming distance計算文本相似度, 去除不同采集來源的重復數(shù)據(jù)
- 效果: 計算效率26秒/100萬條,較原字符級別算法(0.8秒/100萬條)提高32倍,準確率94%
2. 機構(gòu)標注算法
獨立完成開發(fā)
- 方法: 分詞、詞形還原預處理,提取特征項(學校名、院系名、作者、地址、郵編),統(tǒng)計各學校詞典,剔除無用高頻詞和停用詞,使用詞袋模型向量化各特征項,基于樸素貝葉斯方法對期刊數(shù)據(jù)標注學校ID
- 效果: 在人工維護詞表基礎(chǔ)上,統(tǒng)計出更多的匹配模式(如英文簡寫、別名、學校合并前的名稱等),大幅提高了機構(gòu)標注效率和數(shù)據(jù)量
3. 學者標注算法
獨立完成開發(fā)
- 方法: 歸類同姓名學者,基于ElasticSearch引擎快速提取同名侯選集,以同姓名、同學校、同院系的數(shù)據(jù)為正樣本,使用邏輯回歸訓練模型,對期刊數(shù)據(jù)標注到學者ID
- 效果: 結(jié)合搜索引擎和邏輯回歸算法,大幅提高運算效率
4. 檢索排序算法
參與開發(fā)中
- 方法: 從搜索引擎的大量日志中挖掘用戶點擊行為, 構(gòu)建用戶畫像,基于Listwise算法排序,為用戶返回個性化的檢索排序列表
2020.x -2020x 天津石油學會創(chuàng)新創(chuàng)效 - 巖相自動識別技術(shù) 負責算法研發(fā)、項目匯報
- 目標:通過彈性波測量得到的地下速度、密度信息,預測地下巖石類型
- 方法:建立從巖石類型至速度、密度的數(shù)學模型關(guān)系,以鉆井區(qū)域的速度、密度和巖石類型為訓練數(shù)據(jù),通過貝葉斯判別算法預測未鉆井區(qū)域的巖石類型。同時引入馬爾克夫鏈模型,使巖相預測結(jié)果在深度方向連續(xù)變化,并且排除了不合理的預測結(jié)果
- 效果:較傳統(tǒng)的色標融合方法,該技術(shù)的識別效率及準確率得到顯著提升, 后期鉆井證實預測準確率84%,獲得天津石油學會優(yōu)秀科技成果一等獎
自我評價
- 理解機器學習的基礎(chǔ)理論(降維、回歸、分類、聚類、推薦等),熟悉求解算法及參數(shù)調(diào)優(yōu)
- 理解深度學習原理和基本模型(CNN/RNN),熟悉 Tensorflow 深度學習框架
- 熟悉Spark分布式計算平臺,熟悉ElasticSearch分布式檢索服務器
- 掌握Java/Matlab/Python語言,有較強的算法分析和實現(xiàn)能力
- 學習能力強,能快速閱讀中英文文獻,較好的語言、書面表達和溝通能力
內(nèi)容來源說明:本文章來自網(wǎng)絡收集,如侵犯了你的權(quán)益,請聯(lián)系QQ:2772182309進行刪除。
http://90xin.cn/article/313907.html