(Ken Cen出品)Generative AI第19部 DeepSeek如何 Fine-tune (微調)大語言模型

關於DeepSeek,Tokenizer,Chain of Thought,Reinforcement Learning,LoRA,量化,GRPO,PEFT ,CoT,SFT,HuggingFace,Fine-tuning
4.92 (6 reviews)
Udemy
platform
中文
language
Data Science
category
instructor
(Ken Cen出品)Generative AI第19部 DeepSeek如何 Fine-tune (微調)大語言模型
111
students
8 hours
content
May 2025
last update
$19.99
regular price

Why take this course?

🚀 【DeepSeek Fine-tune Mastery】

🧠 深入掌握Generative AI的微調✨

是時候提升您對Generative AI的理解水平!這個由Ken Cen出品的課程,將基於先前的第18部課程,進一步深入探討如何利用DeepSeek來微調(Fine-tune)大型語言模型。我們將搭载最新技術,包括Huggingface的Transfermer庫、AutoTokenizer,以及超參數設定、模型訓練與評估等前沿知識。

課程亮點:

  • Huggingface Transfermer & AutoTokenizer: 快速開始您的微調之旅。
  • 超參數設定: 找到最適合您模型的參数。
  • 模型訓練與評估: 學習如何有效地訓練和測試您的模型。
  • 🎯 LoRA & QLoRA: 了解低秩適應(Low-Rank Adaptation)的最佳實踐。
  • 🎯 SFT (Supervised Fine-Tuning): 運用監督學習進行模型微調。
  • 🎯 Reinforcement Learning (RL) - 強化學習: 從Proximal Policy Optimization(PPO)到Generalized Reward Policy Optimization(GRPO),掌握策略迭代的最新進展。
  • 🎯 PEFT (Parameter-Efficient Fine-Tuning): 實現模型微調的高效方法。
  • 🎯 Reward Model & TRL(Trained Reward Learner): 開發有效的獎勵機制,提升您的模型表現。
  • 🎯 CoT (Chain of Thought): 研究連鎖思維推理如何提高NLP任務的準確性。
  • 🌟 實戰操作與應用!

🔥 不少於19個關鍵技術,一道 door-to-door 引導您成為DeepSeek微調能手!

立即報名,開啟您的AI未來之旅!🚀

Loading charts...

6445795
udemy ID
05/02/2025
course created date
16/03/2025
course indexed date
Bot
course submited by