(Ken Cen出品)Generative AI第19部 DeepSeek如何 Fine-tune (微調)大語言模型

關於DeepSeek，Tokenizer，Chain of Thought，Reinforcement Learning，LoRA，量化，GRPO，PEFT ，CoT，SFT，HuggingFace，Fine-tuning

4.93 (7 reviews)

Udemy

platform

中文

language

Data Science

Why take this course?

🚀 【DeepSeek Fine-tune Mastery】

🧠 深入掌握Generative AI的微調✨

是時候提升您對Generative AI的理解水平！這個由Ken Cen出品的課程，將基於先前的第18部課程，進一步深入探討如何利用DeepSeek來微調（Fine-tune）大型語言模型。我們將搭载最新技術，包括Huggingface的Transfermer庫、AutoTokenizer，以及超參數設定、模型訓練與評估等前沿知識。

課程亮點：

✅ Huggingface Transfermer & AutoTokenizer： 快速開始您的微調之旅。
✅ 超參數設定： 找到最適合您模型的參数。
✅ 模型訓練與評估： 學習如何有效地訓練和測試您的模型。
🎯 LoRA & QLoRA： 了解低秩適應（Low-Rank Adaptation）的最佳實踐。
🎯 SFT (Supervised Fine-Tuning)： 運用監督學習進行模型微調。
🎯 Reinforcement Learning (RL) - 強化學習： 從Proximal Policy Optimization（PPO）到Generalized Reward Policy Optimization（GRPO），掌握策略迭代的最新進展。
🎯 PEFT (Parameter-Efficient Fine-Tuning)： 實現模型微調的高效方法。
🎯 Reward Model & TRL（Trained Reward Learner）： 開發有效的獎勵機制，提升您的模型表現。
🎯 CoT (Chain of Thought)： 研究連鎖思維推理如何提高NLP任務的準確性。
🌟 實戰操作與應用！

🔥 不少於19個關鍵技術，一道 door-to-door 引導您成為DeepSeek微調能手！

立即報名，開啟您的AI未來之旅！🚀

Loading charts...

6445795

udemy ID

05/02/2025

course created date

16/03/2025

course indexed date

Bot

course submited by