實習基本資訊
實習期間: 2023/07/03~2023/08/31
實習地點: 富邦金融中心大樓(富邦金控),台北市大安區仁愛路四段169號
實習月薪: 詳見企業招募網路公告
上班時間: 8:30~17:30
培訓內容: 兩次跨部門實習生團體課程,一周數據赋能安排課程讓我迅速了 解部門工作內容
部門特色
充滿溫度的團體
這邊會遇到許多非常照顧人的哥哥姐姐,有任何工作、職涯或者任何其他的問題都可以向他們請教,他們都很樂意跟我分享。還認識了數個MA學姊,平常很照顧我,請我吃東西和幫我一起訂飲料。
除此之外也有許多團隊活動,溫暖的安排同仁生日慶生,下班後大家還一起去KTV歡唱,在實習的最後一天有快樂聚餐
勇於發言、參與度高
數據赋能中心是一個平均年齡很年輕的部門,跟上司之間沒有隔閡,在不同team與科之間互動頻繁,大家的感情都蠻好的。實習生如果遇到自己有興趣的會議或活動都可以主動提出想參與的想法,在部門中的會議中有想法也可以隨時提出,即使是與數位長的會議也可以提出自己的意見與想法。
中午拳擊時間
中午會有許多人在健身房運動,還可以約人打拳擊互毆,快樂的舒壓時間
實習心得
這邊的實習比較Hardcore 會要求實習生做事,可以從中學到很多
一開始 mentor Ethan Wu安排我們兩個月要完成初版,但是不知不覺間我們兩周就做出來了,因此科長開始幫我們安排程式上線流程,安排多個跨部門會議,最終我們程式進入公司系統,每天自動運行,成為落地的案子,也有同仁開始使用我們的產出,讓我很有成就感。
感謝科長幫我和partner安排一個完整的實習專案,讓我可以完整接觸銀行實際在運行的案子,從理解痛點到程式邏輯發想,最後有實際產出。而不是進來都在打雜,讓我在這過程當中收益良多。
實習內容: 信用卡特店資料清洗+Bert 特店類別貼標
主要內容-信用卡特店資料清洗
清整信用卡帳單店家名稱資料,去除分店與雜訊部分,並且設計成function base 的方式,並且只要修改一個config(參數檔)就可以操控整個程式碼,使後續人員容易維護。
example:
家樂福桂林店,家樂福三重店 -> 家樂福 (這邊要小心不能讓石二鍋家樂福店變成家樂福)
富邦產物失業險,富邦產物火災險第9期 -> 富邦產物
簡易流程示意圖
成效
資料筆數:近五億筆資料
準確度:99.78% 成功覆蓋99.99%資料
過程中的難點
由於資料筆數過多,難以用正/負面表列的方式進行,因此需要透過演算法來排除大部分的資料,在運算的過程當中也遇到時間過久的問題,因此做這專案需要具有時間複雜度的觀念優化程式運算性能,運算時間從三天也跑不完進步到12小時左右。
主要內容2 -Bert 特店類別貼標
現今特店類別為多年前做的類別標籤,因此有許多新興型態的特店沒有正確的類別標籤 (Ex:熊貓、kkbox這類的新興產業),所以必須擴展類別標籤,我選擇利用Bert模型進行特店辨識
簡易流程示意圖
成效
資料筆數:完成1276間
Vaild Set準確率:82.5% Test Set:83.1%
過程中的難點
爬取特店資料的過程中,會一直被google判斷為機器人阻擋,因此使用Selium的方式騙過機器,但是爬取與人工貼標過程費時,且訓練Bert模型時缺少GPU設備耗費許多時間
所需具備能力:
1.SQL程式
2.Python撰寫
3.基礎演算法和資料結構概念
4.熟悉Machine Learning / Deep Learning模型理論與應用場景
5.基礎NLP概念
6.基礎金融知識
建議準備方向:
- Leetcode python基本題
- Kaggle 競賽經驗
感謝所有在實習中照顧我的人
感謝 Ellen 、Sarah 、Olivia部門主管對我實習的安排與照顧讓我有一個完整的學習之旅
感謝 partner Jerry雖然中間有遇過意見不同的時候,但經過一陣子的磨合期後變得默契極佳,兩個人的專長也互補,讓我們快速且良好的完成工作的內容,原本預計兩個月完成的初版竟然兩週就搞定了,不知不覺間參與多個跨部門會議後就正式上線進入公司系統,而且還有人正在使用讓我有滿滿的成就感
感謝Mentor Ethan Wu教導我許多Data science所需知識,與思考一個案子如何規劃程式架構的邏輯
感謝 Cynnie、 Claire、Joyce、 Andrew、 @Poweipaul、Tim、和所有數據賦能中心的同仁感謝 過程中帶給我許多歡樂和教我許多事情
感謝企金海外金融的好夥伴,快了的午餐時光