SEO e fattori di ranking: sono costanti?

Immagine dawata1219.Cercando di approfondire i concetti impostati nel precedente articolo 'Fare SEO con l'acqua calda' tramite una analisi più approfondita cerco in questo articolo di verificarne le conclusioni.

A che punto eravamo?

L'articolo citato parlava dei fattori di ranking, ed in particolare dell'importanza di avere link dai social network per migliorare la posizione nei risultati di ricerca (SERP).Si era giunti alla conclusione che per ottimizzare un contenuto per ricerche relative a termini generici è necessario essere presenti in social network generalisti, mentre se l'oggetto dell'ottimizzazione è un contenuto specifico è meglio avere link da social network più specifici: la scoperta dell'acqua calda, si concludeva.Ciò che si vuole fare oggi è indagare ulteriormente l'argomento:allargando il campo di indagine ad altri fattori di ranking diversi dai 'social signals'utilizzando una serie di keyword palesemente diverse per promuovere contenuti di diverso tipoGli obbiettivi che si vogliono raggiungere:verificare se i fattori di ranking sono costanti per diversi tipi di contenutinel caso che lo siano, cercare se esiste un pattern di distribuzione dei fattori di ranking sulla tipologia di documenti.La strada che si vuole percorrere per raggiungere gli obbiettivi è composta da questi passi:Definizione keyword: definire diversi ambiti specifici nei quali scegliere tra le keyword più gettonate; per ogni ambito viene scelta una keywordAnalisi del corpus dei risultati: per ognuna delle keyword vengono analizzati i primi 100 risultati derivanti dalla ricerca google anonima; vengono scaricate le 100 pagine relative che costituiscono il corpus sul quale eseguire analisi lessicali e semantiche.Analisi della correlazione tra keyword e posizionamento: dagli URI e dal corpus vengono ricavati i parametri che verranno indagati come potenziali fattori di ranking, verificando i valori di correlazione tra posizionamento e fattore in analisi. I parametri vengono divisi in tre gruppi: social signals, backlinks, content signals.Comparazione delle correlazioni: vengono confrontati i valori di correlazione tra le diverse keyword per verificare se sono concordi o se, cambiando la keyword, vengono anche a cambiare i fattori di ranking

1 - Definizione delle keyword

Per definire quali keyword utilizzare in diversi ambiti faccio riferimento a google Suggest e google Trends; queste le keyword scelte:settorekeywordecommerceabito lungosoftwaresviluppo appnewssituazione siriascienzaagricoltura biologicasportUS open 2015  

2 - Analisi del corpus dei risultati

L'elaborazione, per ogni keyword, viene fatta in due passaggi: prima cercando i significati semantici ed i parametri lessicali (come nell'esempio dell'articolo "seo e psiche"), quindi ricercando i parametri relativi all'indicizzazione dei tre parametri principali relativi ai 'ranking factors': backlinks, social signals, tipo di contenuti.Trovate in  'googlekeys.zip' il primo passaggio per la keyword 'abito lungo'; trovate invece a http://www.linkomm.net/knime/demos/ l'esempio delle due analisi per un'altra keyword 'rider cup 2015';L'elaborazione richiede circa 30 minuti per ogni keyword; è stata effettuata utilizzando la piattaforma Knime, le API messe a disposizione dai social network e sistemi di analisi, da alcuni script creati ad hoc per questa analisi.I risultati utili ai fini di questa ricerca sono presenti soprattutto nel secondo passaggio per ogni keyword.I parametri considerati per cercarne la correlazione sono (in ordine sparso):  parametrovalore sul graficoposizione assoluta nei risultati google italiapositionNumero di shares su linkedinLinked In SharesLunghezza del titololengthTitleNumero di immagini nel documentoimagesNumberNumero di backlinksBacklinks Pagepresenza del campo H1h1Alexa RankAlexa RankPresenza di protocollo httpshttpsGoogle Plus LikesGoogle Plus LikesLunghezza del testo del documentolengthFacebook SharesFacebook SharesFacebook Likes+Shares+CommentsFacebook Likes+Shares+CommentsFacebook LikesFacebook LikesSomma di tutti i parametri socialallSocialFacebook CommentsFacebook Commentspresenza della kw nel testoalternativo dell'immagineimageAltKeynumero di volte in cui la kw è presente nei linknumKeyInLinkTextnumero di volte in cui la kw è presente nel testokeyInTextNumero  di Pinterest PindPinterest PinsBacklink verso ildominioBacklinks DomainTweetsTwitter Tweetspresenza della kw nel titlekeyInTitlevisite giornaliereDaily Page Viewsvisitatori giornalieriDaily Visitorspresenza della km nel href dei linklinkKeypresenza della kw nel 'title' dell'>IMG>imageTitKeypresenza della kw in H1keyInH1presenza dell'indirizzo in DMOZDMOZ Acceptedvalore  in WebOfTrustWeb of Trust Trustworthinesspresenza della kw nel SRC dell'immagineimageSrcKey  Ad esempio, per la prima delle keyword considerate, 'abito lungo', ecco alcuni parametri che risultano dall'elaborazione:URL"Facebook Likes""Facebook Shares""Facebook Comments""Facebook Likes+Shares+Comments""Twitter Tweets""Linked In Shares""Backlinks Domain""Backlinks Page""DMOZ Accepted""Web of Trust Trustworthiness""https""Alexa Rank""Daily Visitors""Daily Page Views""Google Plus Likes""Pinterest Pins"http://www.missoni.com/it/missoni/donna/abiti2150261003790 000060http://www.tezenis.it/en/collections/donna/maglieria/abiti/42598919000174,4107161022,5621,11746,45740http://www.wordreference.com/iten/abito15105304011,023,5013068000000http://www.huffingtonpost.it/2014/02/12/kate-middleton-abito-lungo-collier-diamanti-regalo-regina_n_4772606.html0000002,706,358,47901931952,934,266116,455,38500http://www.ebay.it/sch/Vestiti-/63861/i.html0000001,264,689,841019203158,802,798349,366,155490http://shop.elisabettafranchi.com/it/abiti/product-stdview/?idContent=90000003,365,903,174018912238,204,197524,049,23320http://www.twinset.com/ita/category/pe15/twin-set/most-loved0000003,365,903,174018912238,204,197524,049,23300http://shop.stefanel.com/fr_en/shop/abito-lungo-a-righe.html03030048000 0442,2691,0772,36900http://www.pronovias.it/abiti-cerimonia/lasira000000220 000000http://www.zara.com/it/it/donna/trends/boho/vestito-lungo-stampato-c763516p2776286.html470111048000 0442,2691,0772,36900http://store.robertocavalli.com/it/justcavalli/donna/vestiti000000800110 0000300http://www.youtube.com/watch?v=prlMBBiwbU4106016102,313,717,278219411476,408,3941,048,098,466660http://www.youtube.com/watch?v=opzzadsCWng0000006,676,773519202,376200,508441,11700http://www.husk.com.au/dresses/nicolas-mark-abito-lungo-dress000000325,238,779009211434,029,17174,864,17600http://it.shein.com/women-dresses-c-1727.html000000325,238,779009211434,029,17174,864,17600http://www.choies.com/product/choies-limited-edition-stripe-high-waist-maxi-skirt_p260650000004,15500 016,499,290286100https://www.pinterest.com/weddinglaperla/abito-lungo-semplice/000000325,238,779019311434,029,17174,864,17600http://it.aliexpress.com/popular/long-wool-dress.html0303403,80901 03,682,43612928300http://www.pullandbear.com/it/it/donna/vestiti-c29016.html00000049,028018801,803,35426458010http://www.vogue.it/encyclo/cinema/l/lungo-di-giorno000010210 000000http://www.oxforddictionaries.com/us/translate/italian-english/abito000000515006011,281,9133718160 

3 - Analisi delle correlazioni tra keyword e posizionamento

A questo punto possaimo mettere in relazione l'andamento di ogni parametro con la posizione dell'url nei risultati della SERP.La relazione tra il parametro considerato ed il posizionamento può essere definita dall'indice di correlazione di Pearson, valore che +1 quando c'è correlazione tra l'andamento del parametro e quello del posizionamento, vale 0 quando non c'è correlazione, -1 quando la correlazione è inversa.Per poter ottenere dei valori utili il valore di posizionamento viene trasformato dal risultato diretto dei motori di ricerca, dove 1 è il risultato in prima posizione e 100 quello in centesima, in un indice di posizionamento che risulta massimo quando il risultato è al primo posto (es 100) e minimo quand'è in ultima posizione (es.1 su 100 risultati).Nei grafici è definito come 'position SERP' il primo dei valori e 'position' il secondo.Vediamo, ad esempio, una correlazione positiva di valore 0.28; si riferisce al parametro della media delle pagine viste e dei visitatori quotidiani per la keyword 'agricoltura biologica':Sull'asse delle ascisse sono riportati i valori di 'position', quindi è un valore che aumenta da 0 a 100, dove 0 corrisponde all'ultimo dei siti indicizzati e 100 quello del sito in prima posizione; andando da sinistra verso destra, quindi, migliora il posizionamento del sito/pagina considerati,Si può vedere che c'è correlazione positiva perchè i siti che sono verso le prime posizioni hanno i parametri considerati via via sempre più grandi.Allo stesso modo possiamo vedere, per la stessa keyword, la correlazione con i segnali facebook:In questo caso la correlazione è positiva e vale 0.211 (Likes + Shares + Comments).Ordinando i parametri a seconda del loro indice di correlazione otteniamo quelli più positivamente correlati al loro posizionamento; ad esempio per la keyword 'abito lungo' la scala è la seguente:In questo caso la correlazione positiva più alta rispetto al posizionamento è quella data dal valore su  WebOfTrust (directory indicizzata con valori dati ai siti dagli utenti), seguito dalla presenza della keyword nel'H1 e quindi dal fatto di essere presenti su dMoz (altra directory indicizzata).Il fatto che esista questa correlazione positiva non vuol dire obbligatoriamente che inserendo il sito nelle directory indicizzate citate e la keyword in H1 automaticamente il sito vada nelle prime posizioni, semplicemente si registra che i siti che lo hanno fatto sono arrivati in cima alla SERP. Correlation is non causality: per una migliore spiegazione è utile leggere l'articolo.Cercando di raggruppare in una scala le tipologie di fattori di ranking possiamo dire che, per la keyword 'abito lungo', l'ordine di importanza dei fattori da considerare potrebbe sommariamente essere questo:backlinks / valutazionicontenutisocial networkIn seguito compareremo gli stessi parametri utilizzando diverse keyword, in questo modo potremo raggiungere lo scopo di questa ricerca, cioè verificare se i parametri di ranking sono sensibili al tipo di keyword oppure no.Possiamo dividere nelle tre zone i risultati:Prima di proseguire possiamo curiosare tra i dati ed estendere la ricerca correlando un parametro con qualsiasi altro parametro, ottenedo così una matrice di correlazione; invece di indicare i valori numerici utilizziamo una scala di colori, facendo corrispondere il -1 al blu scuro ed il +1 al giallo:Da questa 'heatmap' possiamo ricavare alcune considerazioni:gli ultimi due valori, position SERP e position, sono inversamente correlati; quando uno è al massimo l'altro è al minimo, com'è logico che sia per un parametro che in un caso vale 1 per il primo e 100 per l'ultimo sito posizionato e viceversa per l'altro;c'è una diagonale gialla, in quando è logico che ogni parametro sia positivamente correlato al massimo grado con sè stesso;si vede un rettangolo giallo di 6x6 in alto a sinistra; esprime la correlazione tra facebook, G+ e Twitter; all'aumentare di uno aumenta anche l'altro; come si vede Linkedin è, in questo caso 'fuori dal coro', così come pinterestil valore imgSrcKey presenta una riga vuota, significa che non ci sono valori utili per questo parametro (keyword nel nome del file delle immagini).tutti i valori che contengono 'Key' sembrano in qualche modo correlati tra loro, segno che quando viene messa l'attenzione sull'uso delle keyword lo si fa in tutti gli ambiti dove è possibile applicarlo.

4 - comparazione delle correlazioni

A questo punto abbiamo i dati necessari per raggiungere lo scopo del documento: confrontare le correlazioni dei paramentri con il posizionamento in ambiti semantici diversi.Per questo utilizziamo le keyword prima definite; per ognuna di esse eseguiamo le analisi descritte e sistemiamo tutto su un foglio di calcolo per visualizzare i risultati della ricerca, raggruppando i tre settori principali.Calcoliamo la media per ognuno dei fattori principali e per ogni keyword, riportandole nella tabella dove, finalmente, possiamo visualizzare i risultati.In questa prima tabella correliamo i risultati dell asezione 'social signals' dei parametri.Guardando i colori possiamo già effettuare alcune analisi; per esempio la grande macchia blu nel settore news (situazione siria) porterebbe a concludere che gli shares di facebook, twitter e pinterest non sono in correlazione positiva con le news, mentre il contrario si può dire per la scienza e lo sport (agricoltura biologica e US open 2015), dove il peso dei social signals sembra essere molto più accentuato (tutti colori chiari; sullo sport, tutti in correlazione positiva).L'ultima riga, che riporta le medie verticali, ci porta a concludere che l'importanza dei social signals sia, a decrescere, per:US open 2015 (sport)Agricoltura biologica (scienza)situazione Siria (news)Abito lungo (ecommerce)Sviluppo App (software)Mentre dalle medie orizzontali (ultima colonna) possiamo desumere che per queste 5 keyword la migliore correlazione con il posizionamento sia data da Facebook, la minore da Linkedin.A questo punto possiamo aprire l'analisi agli altri fattori di ranking: la situazione cambia per quanto riguarda i segnali da backlinks e dal contenuto, in questo modo:per quanto riguarda i backlinks:sembrano avere la mssima importanza nel settore scienza e sport, minima in software e ecommerceil fattore in maggiore correlazione positiva è la valutazione di WebOfTrustper quanto riguarda il contenuto:la maggiore correlazione è nel settore scienza; la minore nell enewsil fattore in maggiore correlazione positiva con le 5 keyword è la presenza della keyword nel campo H1ecco il dettaglio dei risultati, completo della tabella riepilogativa:Si può notare subito che i tre tipi di fattori cambiano notevolmente passando da un ambito di ricerca all'altro.Guardando solo la media, riportata a destra in verde, sembrerebbe che i backlinks abbiano importanza fondamentale, appena sotto ci sarebbe la scrittura dei contenuti ed avrebbero un'importanza molto minore, quasi nulla, i social signals presi per le 5 keyword come media, mentre nei singoli settori possono avere anche alta importanza (sport).Allo stesso modo la redazione dei contenuti sembra avere più importanza in alcuni settori (scienza) e minore in altri (news).

Conclusioni

I fattori di ranking cambiano a seconda delle keyword considerate; nei 5 esempi considerati la variazione risulta palese.Pur considerando che la correlazione non sia una causalità, nel promuovere un sito o pagina per una determinata keyword può essere utile premettere un'analisi come quella corrente per indirizzare le risorse a disposizione ottimizzandone l'efficacia.Questo studio andrebbe naturalmente ampliato considerando più keyword significative per ogni settore e d ampliando il numero di settori considerati; sarebbe utile anche trovare un legame tra i diversi settori che definisca un continuum tra loro in modo da trovare possibili leggi di variazione tra i fattori di ranking ed i settori; questo studio va molto al di là delle competenze di chi scrive, potrebbe essere affrontato in futuro con opportuni sostegni.

Riferimenti

http://blog.searchmetrics.com/us/2015/09/11/ranking-factors-infographic-correlation-vs-causality/,  un buon articolo per capire il significato delle correlazioni in ambito SEO.Knime, piattaforma di business intelligence con cui sono state effettuate alcune delle analisi.