Atoms ile kod yazmadan uygulama kur — AI ekibin senin için planlasın, kodlasın, deploy etsindene →

Top-k Örnekleme (Top-k Sampling)

Araç kavramları
Ing: Top-k SamplingGuncellendi: 15 Haziran 2026
Modelin sıradaki kelimeyi seçerken sadece en olası k adaya bakmasını sağlayan örnekleme yöntemi. Top-p'nin sabit sayılı kuzeni.

Top-k örnekleme nedir?

Top-k sampling, bir dil modelinin sıradaki tokenmetnin model tarafından işlenen en küçük parçası• için aday havuzunu sabit bir sayıyla sınırlayan örnekleme yöntemidir. Model her adımda binlerce olası token'a olasılık atar; top-k bunlardan sadece en olası k tanesini tutar, gerisini eler ve seçimi bu küçük havuzdan yapar. k=40 ise model her adımda yalnızca en güçlü 40 adayı değerlendirir.

Nasıl çalışır?

Sıralama olasılığa göre yapılır: en yüksek olasılıklı token'dan başlanır, k'inci adaya kadar inilir, kalanların olasılığı sıfırlanır. Ardından havuz yeniden normalize edilip içinden rastgele seçim yapılır. k küçükse çıktı güvenli ve tahmin edilebilir olur; k büyüdükçe düşük olasılıklı, sürpriz adaylar da işin içine girer ve metin çeşitlenir — ama bir noktadan sonra tutarsızlaşır.

Top-k'nin bilinen sınırı şu: sabit sayı her duruma uymaz. Bazen tek bir token bariz doğrudur, 40 aday tutmak gereksiz risktir; bazen onlarca makul devam vardır, 40 yetmez. Top-polasılık eşiğine göre havuzu dinamik daraltan yöntem• bu yüzden geliştirildi: havuzu sabit sayıyla değil, kümülatif olasılıkla belirler.

Neden önemli?

Top-k; temperature ve top-p ile birlikte üretilen metnin karakterini belirleyen ayarlardan biri. Çoğu yerel model arayüzünde ve API'de karşına çıkar. Genelde top-p ile birlikte ya da onun yerine kullanılır; ikisini aynı anda agresif kurcalamak öngörülemez sonuç verir.

Kullanım alanları

Doğruluk isteyen işlerde (kod, veri çıkarma) düşük k tercih edilir. Yaratıcı yazımda yüksek k çeşitliliği artırır. Pratikte birçok kişi top-k yerine top-p'yi varsayılan bırakır; yine de top-k, davranışı kafada canlandırması en kolay örnekleme yöntemi olduğu için anlamaya değer.

mindi
mindi'nin notu
Top-p varken top-k'yi çoğu zaman varsayılan bırakabilirsin. Ama mantığı en sezgisel örnekleme bu — "en olası 40 kelimeden seç" kadar basit. İkisini aynı anda kurcalama, biri yeter.