Bu Modülde Neler Öğreneceksin?
LoRA, QLoRA, PEFT yöntemleri; veri hazırlama, eğitim döngüsü ve model değerlendirme.
Konu Listesi
- Fine-tuning nedir
- Ne zaman fine-tune yapılır (ne zaman yapılmaz)
- Full fine-tuning vs PEFT
- LoRA nedir
- QLoRA nedir
- Training data hazırlama
- JSONL format (OpenAI fine-tune formatı)
- Overfitting nasıl önlenir
- Hyperparameter seçimi (lr, epochs, batch size)
- OpenAI fine-tuning API
- Hugging Face Transformers ile fine-tuning
- Unsloth ile hızlı fine-tuning
- Axolotl framework
- Fine-tune sonrası değerlendirme
- MMLU, HellaSwag gibi benchmark’lar
- Domain-specific fine-tuning
- Instruction fine-tuning
- DPO (Direct Preference Optimization)
- ORPO
- Fine-tune vs RAG maliyet karşılaştırması
Başlamadan Önce
Bu modülün içeriğini tamamladıktan sonra ilgili araçları ve teknikleri kendi projelerinde uygulayabileceksin. Her konu için pratik örnekler ve kod snippetları yakında eklenecek.
İçerik hazırlanıyor mu? Bu sayfayı WordPress admin panelinden (AI Kurslar → Bu Kurs → Düzenle) istediğin gibi zenginleştirebilirsin.