Pagerank nasıl hesaplanır ?

GOOGLE'NİN BİLİNMEYEN YÖNÜ

Bir sayfanın Pagerank’ini hesaplamak için, onun bütün gelen linkleri hesaba katılır. Bu linkler site içerisinden ve site dışından olan linklerdir.

PR(A) = (1-d) + d(PR(t1)/C(t1) + ... + PR(tn)/C(tn))

Bu eşitlik bir sayfanın PageRank’ini hesaplar. Bu eşitlik, PageRank geliştirildiğinde yayınlaşmış olan orijinal eşitliktir, ve muhtemelen Google bunun bir varyasyaonunu kullanmakta; fakat ne olduğunu anlatmıyorlar. Sorun değil; çünkü bu eşitlik yeterince iyi.

Eşitlikte 't1 - tn' , A sayfasına bağlanan sayfaları, ‘C' bir sayfanın giden linklerinin sayısı ve ‘d’ bir indirim (damping) faktörüdür ki genellikle 0,85 değeri atanır.

Basitçe şu şekilde düşünebiliriz:

bir sayfanın PageRank’i = 0.15 + 0.85 * (sayfaya bağlanan her sayfanın PageRank’inin “share”i (payı))

“share” (pay) = bağlanan sayfanın PageRank’inin, sayfanın giden bağlantılarının sayısına bölümü.

Bir sayfa bağlandığı her bir sayfaya PageRank miktarı oylar. Oylaması gereken PageRank miktarı, kendi PageRank değerinden biraz daha azdır (kendi değeri * 0.85). Bu değer, bağlandığı tüm sayfalar arasında eşit olarak paylaşılır.

Buradan, PR4 olan bir sayfadan gelen bir bağlantı ve 5 giden bağlantı, PR8 olan bir sayfadan gelen bir bağlantı ve giden 100 bağlantıdan daha değerlidir sonucuna varabiliriz. Sizin sayfanıza bağlanan bir sayfanın PageRank’i önemlidir; fakat o sayfa üzerindeki bağlantı sayısı da aynı zamanda önemlidir. Bir sayfa üzerindeki bağlantı sayısı ne kadar fazla olursa, sizin sayfanız ondan o kadar az PageRank değeri alır.

Eğer PR1, PR2,…PR10 arasında değişen PageRank değerleri eşit olsaydı, bu sonuç rafa kalkabilirdi; fakat çoğu kişi PR1 ve PR10 (maximum) arası değerlerin logaritmik bir skalada (ölçekte) ayarlandığına inanıyor ve buna inanmak için çok da iyi bir nedenleri var. Google dışında hiç kimse kullanılan yöntemden emin değil; fakat skalanın (ölçeğin) logaritmik veya benzeri olma şansı yüksek. Eğer öyleyse, bu demektir ki, bir sayfanın bir sonraki PageRank seviyesine çıkabilmek için, bir önceki seviyeden çıkmak için aldığından daha fazla ek PageRank alması gerekir. Sonuç olarak bu daha önceki sonucu tersine çevirmiştir, dolayısıyla PR8 olan ve çok fazla giden bağlantısı bulunan bir sayfadan gelen bir bağlantı, PR4 olan ve sadece birkaç giden bağlantısı bulunan bir sayfadan gelen bağlantıdan daha değerlidir.

Google hangi skalayı (ölçeği) kullanırsa kullansın, emin olabileceğimiz bir şey var. Bir başka siteden gelen bir bağlantı, bizim sitemizin PageRank’ini arttırır. Sadece ‘link farm’ lardan gelen bağlantılardan sakınmamız gerektiğini hatırlamalıyız.

Bir sayfa kendi PageRank değerini diğer sayfalara oyladığında, kendi PageRank değeri oylamadan dolayı azalmaz. Oylamayı yapan sayfa kendi PageRank’inden bir şey kaybetmez. Bu bir PageRank transferi değildir. Sayfanın PageRank değerine göre basit bir oylamadır. Bu durum, tutulan hisselerin sayısına göre her bir hissedarın oy verdiği; fakat kendi hisselerinden hiçbir şey kaybetmedikleri bir yönetim kurulu toplantısına benzetilebilir. Öyle olmasına rağmen, bu durumda sayfalar ileriki konularda göreceğimiz gibi dolaylı yoldan biraz PageRank kaybeder.

Şimdiye kadar tamam mı? Güzel. Şimdi de hesaplamaların gerçekten nasıl yapıldığına bakacağız.

Bir sayfanın hesaplaması için, sayfanın mevcut PageRank’i (eğer varsa) tamamen göz ardı edilir ve sayfanın en son hesaplanan PageRank’inin hesaplanış tarihinden itibaren değişme ihtimali dolayısıyla, yalnızca sayfanın mevcut gelen bağlantıları tarafından sayfa için yapılan PageRank “oylaması”na dayanan yeni bir hesaplama yapılır.

Eşitlik bir sayfanın PageRank’ine nasıl ulaşılabileceğini açıkça göstermekte.Fakat hemen açıkça görülemeyen şey ise hesaplama sadece bir kez yapıldığı takdirde eşitliğin çalışmıyor olması durumu. Birbirine bağlı ve hiçbir şekilde başka hiçbir bağlantı içermeyen, A ve B şeklinde 2 sayfamız olduğunu düşünelim. Bu durumda:

Adım 1: Sayfa A nın PageRank’ini gelen bağlantılarının değerinden hesapla.

Şimdi Sayfa A yeni bir PageRank değerine sahip. Hesaplama Sayfa B den gelen bağlantının değerini kullandı. Fakat Sayfa B, gelen bir bağlantı içeriyor (sayfa A dan) ve onun yeni PageRank değeri henüz elde edilmedi, dolayısıyla sayfa A nın yni PageRank değeri hatalı veriye dayanıyor ve doğru olamaz.

Adım 2: Sayfa B nın PageRank’ini gelen bağlantılarının değerinden hesapla.

Sayfa B yeni bir PageRank değerine sahip; fakat doğru değer olamaz çünkü hesaplama, sayfa A dan gelen bağlantının hatalı olan, yeni PageRank değerini kullandı. Bu bir Catch 22 durumu. B nin PageRank ini bilene kadar A nın PageRank ini elde edemeyiz ve A nın PageRank ini bilene kadar da B nin PageRank ini elde edemeyiz.

Şimdi her iki sayfa da yeni hesaplanmış PageRank değerlerine sahip, doğru değerlere ulaşmak için hesaplamaları tekrar yapmamız yeterli olmaz mı? Hayır. Yeni değerleri kullanarak hesaplamaları tekrar yapabiliriz ve böylece değerler daha doğru olacaktır; fakat hesaplamalar için her zaman hatalı verileri kullanıyor olacağız, dolayısıyla sonuçlar her zaman hatalı olacaktır.

Hesaplamalar defalarca tekrar edilerek bu problemin üstesinden gelinebilir. Her defasında biraz daha doğru değerler elde edilir. Aslında, tam doğruluğa hiçbir zaman ulaşılamaz; çünkü hesaplamalar her zaman hatalı değerlere dayanır. 40- 50 arası iterasyon, daha fazla iterasyonun kayda değer bir değer değişikliği yapamayacağı bir noktaya ulaşmak için yeterlidir. Google’ın özet olarak her update de yaptığı şey budur ve bu da updatelerin uzun sürme nedenidir.

Hatırlanması gereken bir konu da hesaplamalardan aldığımız sonuçların oranlar şeklinde olduğudur. Dolayısıyla, her bir sayfanın gerçek PageRank’ine ulaşmak için rakamlar daha sonra bir ölçeğe göre (yalnızca Google tarafından bilinen) ayarlanmış olmalıdır. Öyle olmasına rağmen, hesaplamaları, bir site etrafındaki sayfalarına, belli sayfalar diğerlerine göre daha fazla pay alacak şekilde PageRank kanalı açmak için kullanabiliriz.

NOT:

İçinde aynı eşitliğin yer aldığı; fakat hesaplamanın her bir iterasyonunun sonucunun sayfanın mevcut PageRank değerine eklendiği bazı PageRank açıklamalarıyla karşılaşabilirsiniz. Yeni değer (sonuç + mevcut PageRank değeri), PageRank’i diğer sayfalarla paylaşırken kullanılır. Bu açıklamalar, aşağıdaki sebeplerden ötürü yanlıştır:

1. Onlar da aynı yayınlanmış eşitliği alıntı yapmışlar; fakat sonra bu eşitliği

PR(A) = (1-d) + d(......) dan PR(A) = PR(A) + (1-d) + d(......) a değiştirmişlerdir.

Bu doğru değil ve gereksizdir.

2. Belli sayfaların diğer sayfalara göre daha büyük PageRank oranıyla sonlanması için, bağlantıları nasıl organize edeceğimize bakacağız. Sayfanın mevcut PageRank ine iterasyonlar aracılığıyla ekleme yapmak, eşitliğin yayınlandığı gibi kullanımına nazaran farklı oranlar üretir. Ekleme yapmak, yayınlanmış eşitliğin bir parçası olmadığından, sonuçlar yanlış ve oranlama doğru değildir.

Yayınlanmış eşitliğe göre, hesaplanmakta olan sayfa her bir iterasyonda başlangıçtan başlar. Hesaplama yalnızca sayfanın gelen bağlantılarına dayanır. ‘Mevcut PageRank e ekleme yapma’ yöntemi bunu yapmaz, dolayısıyla sonuçları mutlaka yanlıştır.

Sitemizden en iyi şekilde faydalanmanız için çerezler kullanılmaktadır.