Semalt: een supergids voor het blokkeren van verwijzende spam in uw Google Analytics

Nik Chaykovskiy, de expert van Semalt , verzekert dat verwijzingsspam een van de problemen is waarmee webmasters momenteel worden geconfronteerd. De situatie is in de loop van de jaren erger geworden, wat betekent dat iemand ergens veel geld verdient met het maken van verwijzingsspam.

Spook- en verwijzingsspam

Spam heeft nu zijn weg gevonden naar Google Analytics-rapporten. Spammers zoeken naar kwetsbaarheden in het systeem zodat ze kunnen verschijnen in de gegevensrapporten van de website. Ze doen dit in de hoop dat ze genoeg nieuwsgierigheid wekken tot het punt dat de webmaster hun website bezoekt om te zien waarom ze in het rapport staan. Het probleem is dat ze niet meer verkeer genereren. Ze halen het niet eens omdat ze bots zijn. Ze gebruiken de JavaScrip-trackingcode die door Google Analytics wordt gebruikt om een melding te maken dat er een bezoek was. Ze verdraaien essentiële statistieken zoals bouncepercentages en andere elementen die worden gebruikt om de betrokkenheid te analyseren. Het is absoluut noodzakelijk om verwijzingsspam te blokkeren als u nauwkeurige gegevens nodig heeft, vooral als u erop vertrouwt om marketingbeslissingen te nemen.

Het wordt moeilijk om verwijzingsspam te blokkeren, vooral omdat de spammers erg snel werken, waardoor zowel spamhits als de bronnen toenemen. Het betekent dat webmasters hun inspanningen moeten verbeteren om deze bronnen te elimineren en op de zwarte lijst te zetten. Het is vooral lastig voor mensen die nieuwe sites hebben die niet veel legitiem verkeer ontvangen. Een stijging van de spampercentages op dergelijke sites zou meer scheefheid vertonen, wat zelfs meer zou kunnen zijn dan de dagelijkse hits die het ontvangt.

Hoe gemakkelijk is het?

Eén pagina laadt records als één bezoek. Spookspammers gebruiken de trackingcode van Google Analytics en sturen verkeersgegevens rechtstreeks naar de rapporten, waardoor een bezoek wordt vervalst. Het kan 0,001 seconden duren om ergens een pagina op een server te laden. Het is echter mogelijk dat ze meer dan 100 van deze vervalste bezoeken hebben geforceerd naar de Google-accounts van veel andere sites overal. Het is vrij eenvoudig om een enkele host te kopen. Zolang de spammers zeker zijn van ROI, kunnen ze er veel schade mee aanrichten.

Oplossingen die tekortschieten

Sommige technieken zijn soms zo geavanceerd dat de oplossingen die worden gebruikt om verwijzingsspam te blokkeren niet werken. Een daarvan is de mysterieuze online service genaamd Darodar. De volgende methoden hebben dit niet uit GA gewist.

  • Het .htaccess-bestand. Het werkt niet omdat spookspam de site niet raakt
  • De lijst met verwijzingsuitsluitingen. Het mist updates.
  • Uitsluitingsfilters. Het is een verouderde methode omdat het zich alleen richt op toekomstige spam en niet met terugwerkende kracht voor eerdere spamdatabases.

Het uitsluitingsfilter kwam bijna in de buurt van het elimineren van de verwijzingsspam van Darodar. De enige beperking was dat het geen constante en consistent bijgewerkte verwijzingsspammerlijst heeft.

Het ontbrekende puzzelstuk

Een bruikbare oplossing om verwijzings- en spookgegevens te identificeren en te blokkeren, moet zeer actueel zijn, afkomstig zijn uit een bredere database en terugwerkende kracht hebben op informatie uit het verleden. Gebaseerd op de drie elementen voor een optimale oplossing, hier is er een die werkt.

Stap 1: Segmenten gebruiken om spam uit te sluiten

Het is beter om segmenten te gebruiken omdat ze de gegevens niet permanent wijzigen. Als men per ongeluk echte verwijzers eruit filtert tijdens het gebruik van filters, is er geen manier om ze terug te krijgen. Ondanks segmenten is het mogelijk om op basis van segmenten op oude data te bouwen. Men kan ze ook met terugwerkende kracht toepassen.

Stap 2: Onderhoud van de uitsluitingslijst

Slack is een tool die webmasters kunnen gebruiken om verwijzingsbronnen te controleren. Het informeert de gebruiker over nieuwe verwijzingen en geeft een prompt: of een verdachte verwijzingsbron op de witte of zwarte lijst moet worden geplaatst.

1. Slack ontvangt alle verwijzingen, en

2. Het gebruikt een PHP om alle resultaten op volgorde van telling te sorteren, en geeft vervolgens de uiteindelijke lijst door aan de webmaster om te zien of de resultaten er bekend uitzien. Als niet,

3. Het stuurt alle verdachte spam door naar een slack-kanaal dat de gebruiker de keuze biedt tussen een witte lijst of een zwarte lijst. Welke optie ze ook kiezen, het leidt naar stap 4,

4. Het verwijst naar een pagina die het oordeel verifieert als selectiebevestiging.

5. Slack slaat vervolgens alle geïdentificeerde spammers op en vergrendelt ze in de database

6. De laatste weergave van schone gegevens zal in regex-formaat zijn. Kopieer en plak het in Google Analytics.

Met Slack kunnen de webmasters de uitsluitingslijst minimaal vijf keer per dag bijwerken.

In werkelijkheid kunnen verschillende oplossingen werken:

Ondanks dat dit een bewezen methode is, zou het nog beter werken als de webmaster het zou aanvullen met andere technieken, om er zeker van te zijn dat ze alle bases dekken. Naast de genoemde oplossing:

  • Klik op het selectievakje dat Google Analytics vraagt bekende bots en spiders uit te sluiten,
  • Pas een "include hostname filter" toe
  • Gebruik cookies

Het hierboven genoemde inclusieve filter is soms efficiënt, maar op lange termijn niet de beste oplossing omdat:

  • Hostnaam-spoofing is niet moeilijk te doen en analytics-spammers gebruiken het steeds vaker als kwetsbaar.
  • Als de setup niet goed is, kan het ertoe leiden dat echte verwijzers worden uitgefilterd.