Varlık İsmi Tanıma (Named Entity Recognition)
Araç kavramlarıVarlık ismi tanıma nedir?
Varlık ismi tanıma (NER), bir metindeki özel isimleri bulup kategorilere ayıran NLP görevidir. "Mustafa Kemal 1923 yılında Ankara'da Cumhuriyet'i ilan etti" cümlesinde NER, Mustafa Kemal'i kişi, Ankara'yı yer, 1923'ü tarih olarak etiketler. Yani serbest metni, makinenin anlayıp işleyebileceği yapılı bilgiye çevirir.
Nasıl çalışır?
NER teknik olarak bir token sınıflandırma görevidir: metin önce token'lara bölünür, sonra her token'a bir etiket atanır. Yaygın format B-/I-/O şemasıdır — B bir varlığın başlangıcını, I aynı varlığın devamını, O ise varlık olmayan token'ı gösterir. Eski sistemler elle yazılmış kurallara ve sözlüklere dayanırdı; bugünün çözümleri transformer tabanlı modellerle (örneğin BERT türevleri) çalışıyor. Model, bir token'ın hem kendisine hem de etrafındaki bağlama bakarak karar verir; böylece Ankara kelimesinin bir şehir mi yoksa bir marka adı mı olduğunu cümleden çıkarabilir.
Neden önemli?
Dünyadaki metnin büyük kısmı yapısız: e-postalar, haberler, sözleşmeler, sosyal medya. NER bu yığından "kim, nerede, ne zaman, hangi kurum" gibi kritik bilgileri otomatik çeker. Bu da arama, özetleme, soru-cevap ve bilgi grafiği oluşturma gibi pek çok sistemin temel taşıdır.
Kullanım alanları
Arama motorları, haber etiketleme, müşteri destek sistemleri, hukuki ve tıbbi doküman analizi, özgeçmiş tarama ve sohbet asistanları NER kullanır. RAG sistemlerinde de doğru belgeyi bulup bağlama yerleştirmek için sıkça devreye girer.
Ilgili terimler
