Öğrenme Aktarımı (Transfer Learning)
Araç kavramlarıÖğrenme Aktarımı nedir?
Transfer learning, devasa veriyle önceden eğitilmiş bir modelin öğrendiklerini alıp yeni bir göreve aktarma yöntemidir. Mantık basit: bir model dili (ya da görüntüyü) genel olarak çözmüşse, senin spesifik işin için her şeyi sıfırdan öğrenmesine gerek yok. Hazır temelin üstüne küçük bir kat ekliyorsun.
Nasıl çalışır?
İki aşama var. Önce bir model genel bir görevde, çok büyük veriyle eğitilir — buna pretraining denir. Bu aşamada model dilin yapısını, kelimeler arası ilişkileri, dünya bilgisini içselleştirir. Sonra bu hazır modeli alıp senin küçük, göreve özel verinle ince ayara sokarsın — bu da fine-tuning.
Pratikte birkaç yol var: tüm modeli yeniden eğitmek, sadece son katmanları güncellemek, ya da peft ve lora gibi tekniklerle modelin sadece minik bir parçasını oynatıp gerisini dondurmak. Sonuncusu bugün en yaygını çünkü ucuz ve hızlı.
Neden önemli?
Çünkü sıfırdan model eğitmek milyonlarca dolar ve devasa veri ister. Transfer learning bu maliyeti yıkıyor: birinin harcadığı o devasa pretraining bütçesinin meyvesini, sen birkaç saatlik fine-tuning ile toplayabiliyorsun. Açık kaynak model ekosisteminin bütün mantığı buna dayanıyor — Hugging Face'teki binlerce model aslında "al, kendi işine aktar" daveti.
Kullanım alanları
Bir hukuk firmasının kendi sözleşmelerine göre özelleştirdiği LLM, bir hastanenin radyoloji görüntülerini okuyan model, bir markanın kendi ürün kataloğunu tanıyan görüntü sınıflandırıcı — hepsi transfer learning. Az veriyle, kısa sürede, makul maliyetle özel çözüm üretmenin standart yolu.