(Ken Cen出品)Generative AI第19部 DeepSeek如何 Fine-tune (微調)大語言模型
關於DeepSeek,Tokenizer,Chain of Thought,Reinforcement Learning,LoRA,量化,GRPO,PEFT ,CoT,SFT,HuggingFace,Fine-tuning
4.92 (6 reviews)

111
students
8 hours
content
May 2025
last update
$19.99
regular price
Why take this course?
🚀 【DeepSeek Fine-tune Mastery】
🧠 深入掌握Generative AI的微調✨
是時候提升您對Generative AI的理解水平!這個由Ken Cen出品的課程,將基於先前的第18部課程,進一步深入探討如何利用DeepSeek來微調(Fine-tune)大型語言模型。我們將搭载最新技術,包括Huggingface的Transfermer庫、AutoTokenizer,以及超參數設定、模型訓練與評估等前沿知識。
課程亮點:
- ✅ Huggingface Transfermer & AutoTokenizer: 快速開始您的微調之旅。
- ✅ 超參數設定: 找到最適合您模型的參数。
- ✅ 模型訓練與評估: 學習如何有效地訓練和測試您的模型。
- 🎯 LoRA & QLoRA: 了解低秩適應(Low-Rank Adaptation)的最佳實踐。
- 🎯 SFT (Supervised Fine-Tuning): 運用監督學習進行模型微調。
- 🎯 Reinforcement Learning (RL) - 強化學習: 從Proximal Policy Optimization(PPO)到Generalized Reward Policy Optimization(GRPO),掌握策略迭代的最新進展。
- 🎯 PEFT (Parameter-Efficient Fine-Tuning): 實現模型微調的高效方法。
- 🎯 Reward Model & TRL(Trained Reward Learner): 開發有效的獎勵機制,提升您的模型表現。
- 🎯 CoT (Chain of Thought): 研究連鎖思維推理如何提高NLP任務的準確性。
- 🌟 實戰操作與應用!
🔥 不少於19個關鍵技術,一道 door-to-door 引導您成為DeepSeek微調能手!
立即報名,開啟您的AI未來之旅!🚀
Loading charts...
6445795
udemy ID
05/02/2025
course created date
16/03/2025
course indexed date
Bot
course submited by