Cosine Similarity Euclidean Distance Manhattan DistanceBu üç kavram, özellikle veri bilimi, makine öğrenimi, doğal dil işleme (NLP)ve benzerlik aramaları gibi alanlarda yaygın olarak kullanılır. Hepsi, iki vektör arasındaki benzerliği veya mesafeyi ölçmek için kullanılan matematiksel metriklerdir. Şimdi bu üç metriğin ne olduğunu, nasıl kullanıldığını ve her birinin avantajlarını detaylıca inceleyelim.1. Cosine Similarity (Kosinüs Benzerliği)Cosine Similarity, iki vektör arasındaki açıyı ölçerek benzerliği hesaplar. Bu, genellikle metin karşılaştırmaları ve belge benzerliği için kullanılır. Cosine similarity’nin ana avantajı, verilerin büyüklüğünden bağımsız olarak yönelimi ölçmesidir. Yani, uzunlukları farklı olsa da iki vektör arasındaki yönelimin ne kadar benzer olduğunu belirler.
Cosine Similarity Aralığı:• 1: İki vektör tam olarak aynı yönü gösteriyor, yani aynı.• 0: İki vektör tamamen farklı yönlere sahip, yani birbirine ortogonal.-1: İki vektör zıt yönlerde.Kullanım Alanları:• Metin benzerliği: İki metnin benzerliğini ölçmek (belge arama, arama motorları).Belge veya cümle karşılaştırma.
Vectör Yönü nedir dediğinizi duyar gibiyimVektör Yönü (Vector Direction), bir vektörün hangi doğrultuda olduğunu ifade eder. Matematiksel anlamda, bir vektörün yönü, o vektörün başlatıldığı noktadan (veya orijinalinden) nereye doğru uzandığını gösterir.Vektörler büyüklük (magnitude) ve yön olmak üzere iki bileşenden oluşur:• Büyüklük: Vektörün uzunluğunu (veya şiddetini) gösterir. Örneğin, bir hız vektörünün büyüklüğü, bir cismin hızını ifade eder.• Yön: Vektörün nereden nereye gittiğini (yani doğrultusunu) belirtir. Bu, genellikle vektörün bileşenlerinin oranıyla ölçülür.Vektör Yönü Nedir?Vektörün yönü, genellikle açı ile ifade edilir. Örneğin:• İki boyutlu uzayda bir vektörün yönü, vektörün yatay (x) ve dikey (y) eksenlerle oluşturduğu açıdır.• Üç boyutlu uzayda ise, vektörün yönü, üç eksen (x, y, z) ile ilişkili bir açıyla belirlenir.Vektör yönü, özellikle cosine similarity gibi benzerlik ölçümlerinde önemli bir rol oynar, çünkü burada vektörlerin yönleri ne kadar birbirine yakınsa, aralarındaki benzerlik de o kadar yüksek olur.
2. Euclidean Distance (Öklid Mesafesi)Euclidean Distance, iki nokta arasındaki doğrudan mesafeyi ölçen en klasik mesafe metriğidir. Bu metrik, genellikle geometrik mesafe olarak da bilinir. İki vektör arasındaki farkları dik doğrultularla ölçer.Euclidean Distance Aralığı:• 0: İki vektör tamamen aynı, yani mesafe sıfır.• Daha büyük değerler: Vektörler arasındaki mesafe arttıkça değer büyür.Kullanım Alanları:• Veri kümesi arasındaki mesafeleri ölçme.• Kümeleme algoritmaları (örneğin K-Means).• Görüntü karşılaştırmaları ve genetik veri gibi yerlerde kullanılır.
3. Manhattan Distance (Manhattan Mesafesi)Manhattan Distance, iki nokta arasındaki mesafeyi hesaplamak için kullanılan bir ölçüdür ve genellikle “city block” mesafesi olarak da bilinir. Adını, New York City’deki sokak düzeninden alır, çünkü şehirdeki sokaklar dik açıyla birbirine bağlıdır ve bir noktadan başka bir noktaya gitmek için sadece yatay ve dikey yollar kullanılabilir.Özellikleri:• Dikey ve yatay mesafelerin toplamı olduğundan, her iki eksende de mesafeleri göz önünde bulundurur.• Düzgün yollarla ilerler: Yani bir noktadan başka bir noktaya ulaşmak için sadece dikey ve yatay yollar kullanılabilir.Karmaşık olmayan bir mesafe ölçüsüdür ve genellikle grid tabanlı sistemlerde, sokak düzeni gibi yapılarla çalışırken kullanılır.Ne Zaman Kullanılır?• Şehir haritası, yol ağı ve sokak planlaması gibi durumlarda sıklıkla kullanılır.• Veri kümeleri arasındaki basit mesafeleri hesaplamak için de uygun bir yöntemdir.