設計、實現和部署機器學習模型,用於搜尋引擎和推薦系統
開發創新的對話式搜尋解決方案,提升使用者互動體驗
分析使用者行為數據,持續改進搜尋和推薦算法
優化機器學習模型的效能和延遲
與產品、工程和資料科學團隊緊密合作
進行特徵工程和模型實驗
監控模型效能並進行即時調整
技術技能
機器學習演算法:協同過濾、排名模型、推薦系統
深度學習:神經網路架構、注意力機制、知識蒸餾技巧、圖嵌入向量、微調技巧 (PEFT等)、量化壓縮等
自然語言處理:查詢理解、語意相似度
大數據技術:Spark、Hadoop
版本控制:Gitub
資料庫:PostgreSQL、MongoDB 等
碩士或博士學位 (機器學習、人工智能、資料科學或相關領域)
3-5年以上機器學習模型開發經驗
精通Python和機器學習框架(如TensorFlow、PyTorch)
深入了解搜尋和推薦系統架構
具備以下技術的實務經驗:
機器學習演算法
自然語言處理
深度學習模型
特徵工程
大規模分散式系統
對話式AI和語意搜尋相關經驗
已發表相關領域的學術論文
開源專案貢獻經驗
熟悉雲端平台(AWS、GCP)
具備多語言搜尋系統開發背景
MLOps 和資料工程實務經驗
我們期待您精熟或者是熟悉以下不同型態工具的使用
模型版本控制與實驗追蹤,例如:
MLflow
Weights & Biases
DVC (Data Version Control)
持續整合與部署 (CI/CD),例如:
Kubeflow
Airflow
Jenkins
GitHub Actions
模型監控與可觀測性,例如:
Prometheus
Grafana
Evidently AI
Seldon Core
模型部署平台,例如:
Kubernetes
Docker
KServe
SageMaker
Vertex AI
資料品質檢查工具,例如:
Great Expectations
Deequ
Pandera
ETL 與資料流工具,例如:
Apache Spark
Apache Beam
Prefect
Luigi
資料清整技術
異常值偵測
遺失值處理
特徵縮放
編碼分類變數
資料驗證與稽核流程
建立資料血緣關係
確保資料一致性
實施資料治理策略