← AI Eğitim / Modül 09
🧪

Değerlendirme & Test

İLERİ

RAGAS, LLM-as-judge, benchmark kurulumu, regression testi ve kalite güvencesi.

Konu Listesi

  • LLM eval nedir
  • Human eval vs automated eval
  • LLM-as-a-judge pattern
  • G-Eval framework
  • RAGAS (RAG evaluation)
  • TruLens
  • Elytra / Braintrust
  • Regression testing LLM apps için
  • A/B testing prompt’lar
  • Golden dataset oluşturma
  • Benchmark vs production eval farkı
  • Latency ölçümü
  • TTFT (Time to First Token)
  • Throughput ölçümü
  • Hallucination detection

AI Kariyerine Bugün Başla

15 modül, yüzlerce ders ve Türkiye'nin en aktif AI topluluğu seni bekliyor.