Algemeen forum ontrent de ontwikkelng, design en hosting van weergerelateerde websites (dit laatste om een beetje on topic te blijven)
Door Heersje
#71186
hbot 46.229.168.0
mbot 2a02:598:2::164...0
spider 180.76.15.0
obot 54.36.148.0

is het niet mogelijk om een captcha te zetten op de history page als ze die zo interessant vinden?
Door wvdkuil
#71187
Heersje schrijft:
hbot 46.229.168.0
mbot 2a02:598:2::164...0
spider 180.76.15.0
obot 54.36.148.0

is het niet mogelijk om een captcha te zetten op de history page als ze die zo interessant vinden?


Helaas vinden ze de pagina niet interessant, hun algoritme loopt gewoon alle links met alle mogelijke waardes af.Dus ook met 30 februari.
En omdat het links zijn en geen "button" die geklikt moet worden, kan er geen reCaptcha tussenkomen.

Ik heb op het template forum een nieuwe versie gezet zonder links, zonder $-GET
http://weather-template.info/smf/index. ... sg1214#new
Als het nodig zou zijn kan er ook een "hidden reCaptcha" gebruikt worden.

Maar de eerste test wijzen uit dat er geen bezoekers meer zijn die langer dan 1 of 2 keer op die historie pagina blijven.

Wim
Door wvdkuil
#71213
Na nog wat zoeken op "google" heb ik een aantal zaken aangepast.
En dan nog de franse "OVH" en duitse "Host Europe" bots die iedere dag honderden WU-history pagina's aflopen.
Code: Selecteer alles
?p=mnu_wu_hist&ID=IVLBRABA2&month=11&day=4&year=2017&mode=2&units=&units=M

Voor hen geldt "god noch gebod"

Het oude script met alleen "URL-links" is vervangen door een nieuw script met alleen een post en javascript links. Er is ook de mogelijkheid van "reCaptcha" ingebouwd, maar dat blijkt na een week testen echt niet nodig. Geen enkele OVH of HE bezoeker meer gezien.

Bezoekers die zeker niet met goede bedoelingen mijn sites bezoeken:
Code: Selecteer alles
?p=34&lang=fr&wp=MB%22%20or%20(1,2)(select*from(select%20name_const(CHAR(111,108,111,108,111,115,1 . . .

?p=wsForecast'A=0&lang=en&wp=MB

Daar bleek googleeen hele handige oplossing voor te hebben.

Ik had op proef al mijn index.php hernoemd naar een andere naam, bijvoorbeeld index2.php
En een vrijwel lege index.php gemaakt die, als alles goed is, de index2.php laadt.
Dat geeft mij de gelegenheid wat extra controles toe te voegen voordat de zwaardere scripts beginnen.

Ik had daar de volgende stukjes code in gezet:
[ul][li]debug aanzetten als dat via de url wordt doorgegeven[/li][li]is er maintenance op de site actief => boodschap en breek af[/li][li]worden er illegale aanroepen gedaan naar de wu-hist pagina => redirect naar externe pagina[/li][li]wordt er een oude pagina opgevraagd die niet meer bestaat, verander dan de pagina naar de nieuwe naam en ga door[/li][/ul]Nu heb ik dus ook het stuk code zoals in de link erbij gezet. En inderdaad geen vreemde aanroepen meer.

Als voorbeeld de nu op proef draaiende index.php van weerstation-herent.be
Het kost wat extra resources, maar het vermindert alle onnodige aanroepen van de "script-kids".
De bezoekers aantallen gaan wel drastisch naar beneden natuurlijk, maar nu zijn het alleen nog bezoekers die echte informatie willen zien.

Wim
Door T.J.
#71218
Hallo Wim.

Ik heb ook de index.php uit de download erop, mijn oude index.php hernoemd naar index2.php
Mocht het problemen geven dan kan ik simpel terug naar de oude situatie.

Gr. Tjeerd
Door Heersje
#71224
Ik heb de site in een map weather28 staan en in de map er boven een meta refresh, ook al is dat niet zo elegant. Zou het niet te combineren zijn door het nieuwe script in de bovenliggende map te plaatsen en dat indien de aanvraag door de ballotage komt je dan naar weather28/index.php gaat?
Door herent
#71225
Heersje schrijft:
Ik heb de site in een map weather28 staan en in de map er boven een meta refresh, ook al is dat niet zo elegant. Zou het niet te combineren zijn door het nieuwe script in de bovenliggende map te plaatsen en dat indien de aanvraag door de ballotage komt je dan naar weather28/index.php gaat?

Bezoekers zullen vaak bladwijzers vastleggen van interessante pagina's. In uw geval bijvoorbeeld
http://weer.heerschap.net/weather28/ind ... #data-area

Als ze dus deze bladwijzer in hun browser kiezen komen ze rechtstreeks in de map weather28/ en gaan ze niet meer eerst langs een "meta refresh" of andere index.php in een andere bovenliggende map.

Ook script kids die handmatig achter een werkende url allerlei extras code zetten komen niet meer in de bovenliggende map maar gaan rechtstreeks naar weather28/index.php

Zet de WAF (Web-App_Firewall) code in het script waar iedere externe bezoeker ALTIJD langs komt.
In Saratoga dus in common.php
In Leuven in de index.php van de weatherxx/ map
Ook bij andere templates zal er zo'n "altijd langs hier" script zijn.

@ALL => Waarom die mappen, alles in de root werkt toch ook?
Als een nieuwe gebruiker met een template begint is er al een website, vaak in de root. De Saratoga template staat meestal ook in de root maar kan heel goed vanuit een lager liggende map werken

Nieuwe releases testen werkt ook makkelijker als alles in een aparte map staat.
Dan kan stap voor stap oud met nieuw vergeleken worden.

Ook een test-site op dezelfde server werkt makkelijker met alles te kopiëren in een aparte map.
Dan kan je veilig testen met ...herent.../test/ terwijl de bezoekers ...herent.../weather2/ blijven gebruiken

Om mijn scripts in Saratoga te testen heb ik https://www.weerstation-herent.be/saratoga/
Om in de beginperiode Brian te helpen was er een map /pws/
enzovoort.

Ik zelf heb hier de map nog steeds weather2/ genoemd, en bij een nieuw release test ik eerst met weather28/ en als alles OK is dan hernoem ik weather28/ naar weather2/

Nu vinden de meeste gebruikers die map-naam in de url niet mooi.
Bijvoorbeeld bij sluispark is er een subdomain weer.sluispark.be die wijst rechtstreeks naar de laatste versie map maar die map is niet zichtbaar in de url.
Ook daar kan ik testen met nieuwe en oude releases door het subdomain weg te laten en wel de map-naam te gebruiken.

Er zijn gelukkig meerdere wegen die naar Rome leiden,

Wim
Door Heersje
#71226
bedankt voor de uitleg Wim,
mensen die een pagina opslaan hoeven ook niet perse gecheckt te worden door dit nieuwe script maar ik ging er ten onrechte vanuit dat scriptkids beginnen bij de root en dan stelselmatig alle links laten aflopen.
Mijn luchtkwaliteit pagina die je hierboven aanhaalt heb ik een klein beetje aangepast (veel inzichtelijker die code, proficiat) maar ik kwam gisteren nadat ik de index en index2 in de weather28 had aangepast wel in een soort loop terecht die niet tot een einde kwam bij het aanroepen van juist die pagina (anderen werkten wel), dus de standaard index.php maar weer even teruggezet tot ik tijd heb het nog eens te bekijken.

groet Jean-Paul
Door Oebele
#71245
Hallo

Via htaccess kan het ook zo als je de user agent weet.

Code: Selecteer alles
RewriteEngine on 
RewriteCond %{HTTP_USER_AGENT} ^(.*)hbot(.*) [NC]
RewriteRule .* - [F,L]