Quando si parla di TF-IDF si parla di comprensione del linguaggio da parte delle macchine. I sistemi di comprensione del linguaggio sono in gran parte basati su dati liberamente disponibili, come ad esempio la Penn Treebank, forse la risorsa linguistica più diffusa mai creata. Anche Google,...
vai all'articolo
Sei stanco dello SPAM sul tuo blog? Stai cercando un metodo semplice per ridurre i commenti indesiderati sui tuoi articoli? Come rimuovere il campo URL dai commenti di WordPress A volte lo SPAM può diventare un serio problema sul nostro amato blog WordPress, in una guida pubblicata il mese...
vai all'articolo
…Arieccomi! L’unica ed originale Fidanzata del SEO, scrittrice per diletto e Santa di professione (come del resto ogni donna che al Suo fianco abbia un uomo computerizzato dalla testa ai piedi!). Il tema di questo articolo è il solo che potrei toccare nelle vesti di simil-nerd o per...
vai all'articolo
Akismet è il miglior plugin per difendersi dai commenti spam ma non sempre è sufficiente. A volte capita che un blog sia preso d’assalto da qualche spammer e si riempia velocemente di molti commenti indesiderati. In altri casi basta dimenticarsi del blog per qualche giorno e al...
vai all'articolo
Premessa: l’hotlinking è stata una pratica a lungo usata dagli spammer, Google negli anni ha imparato a riconoscerla rendendola meno efficace. Cosa vuol dire fare Hotlinking Facciamo un esempio. Sul tuo sito hai delle belle immagini, ottimizzate ed originali che sono state indicizzate...
vai all'articolo
Indice Information Retrieval, cos’è? IR e Web Search Problemi della Web Search Indicizzazione full-text: inverted indexes Processo di indicizzazione Modelli per IR Limiti del modello booleano Il modello vettoriale TF/IDF Valutazione IR IR avanzata Probability ranking LSI Relevance...
vai all'articolo
Hai mai sentito parlare del Trust flow e del Citation flow? Sono due metriche usate da MajesticSEO, il famoso tool per l’analisi dei backlink. Mi capitano spesso domande di chiarimento sul significato di questi due parametri quindi colgo la palla al balzo. Cosa rappresentano il Citation...
vai all'articolo
Attraverso il file .htaccess si possono custimizzare i webserver Apache o Nginx (due open source HTTP server software) abilitando e disabilitando i diversi moduli disponibili. Uno dei moduli più famosi di Apache, e che oggi vediamo nel dettaglio, è senza dubbio il mod_rewrite ovvero il modulo...
vai all'articolo
Quando si parla di TF-IDF si parla di comprensione del linguaggio da parte delle macchine. I sistemi di comprensione del linguaggio sono in gran parte basati su dati liberamente disponibili, come ad esempio la Penn Treebank, forse la risorsa linguistica più diffusa mai creata. Anche Google,...
vai all'articolo
Oggi facendo il mio solito crawling abitudinario del sito ho notato la segnalazione di alcuni link rotti su un articolo. Non serve che ti spieghi quanto mi irritano i broken links, sono quindi corso subito su quella pagina per sistemarli e correggerli. Lo zampino di Microsoft Word Passando il...
vai all'articolo
StudioPress Genesis è un framework per WordPress molto diffuso ed apprezzato soprattutto per la sua semplicità e leggerezza del codice che rendono i suoi temi grafici molto veloci da caricare. Genesis è sviluppato seguendo gli ultimi standard nell’industria del web design e già da molto...
vai all'articolo
Quest’anno il file Robots.txt ha compiuto 20 anni, fu infatti implementato la prima volta nel 1994 ed ancora è largamente usato. Prima di entrare nei dettagli degli errori più comuni da evitare è importante capire perchè fu necessario sviluppare questo protocollo ed il suo standard....
vai all'articolo
La sitemap.xml di un sito web è un elemento molto importante da tenere curato, verificarne la correttezza sintattica e la completezza è un’attività necessaria quando si svolge un SEO Audit. Per quanto riguarda il formato e la sintassi corretta della sitemap.xml ti rimando a questa guida,...
vai all'articolo
A fianco di ogni commento ricevuto WordPress inserisce un link per rispondere, questo link ha il parametro replytocom. In alcuni casi questo parametro può generare problemi di crawling ed indicizzazione. Che problemi genera il parametro replytocom? Un problema di crawling è ad esempio è...
vai all'articolo
Il termine RegEx, in Inglese “Regular Expressions” indica una metodologia per filtrare e confrontare stringhe di codice (essenzialmente pezzetti di testo). Puoi creare espressioni regolari che sono combinazioni di caratteri e meta-caratteri, vediamo le differenze ed il...
vai all'articolo
Siamo nel 2014 e la domanda corretta da farsi non è se sia giusto o meno fare un sito mobile ma “come posso ottimizzare il mio sito mobile?“. Questo è l’anno in cui è stato previsto il pareggio tra il traffico desktop e il traffico mobile e ci sono molti aspetti da considerare...
vai all'articolo
Google ha dichiarato più volte che il design responsive è la soluzione migliore per la gestione dei portali mobile. Come al solito, tuttavia, la maggior parte degli sviluppatori lavora di testa sua seguendo idee e best-practices personali per poi ritrovarsi con un sito mobile non indicizzato o...
vai all'articolo
Le piattaforme di Cloud Storage si stanno diffondendo sempre di più grazie alla loro indubbia utilità e facilità di utilizzo. Salvare i propri dati online mette in sicuro i dati dai possibili danni al proprio hardware, come dischi fulminati o non più accessibili (a me è capitato molto spesso!)....
vai all'articolo