English | Magyar
JS ki | CSS ki | Ékezetek ki | HiContrast
Lapozó:  (0 - 1467) 
<== | ==>
Ugrás a végére | Összes megjelenítése | Utolsó oldal
OpenOpera patches | Opera-SSL patches | Opera 12.15 source (Git repository) | Opera 12.15 source (Torrent) | Opera internal pages | Otter Browser Linux x64 - Qt5.15.2/QtWebKit5.602.1 (2026.04.01. 00:26)
OS for MC680x0 | OS for PPC | OS for Sparc64 | besztofbégéaefcé | CSÉNDZSLOG | WebToolz | DDG Shit Filter | Google Shit Filter | Progz | Fast CSS Box | Browser | OS | Agent | Statisztika | BBCode
Monospace font-family: Courier New | Browser default monospace
Email értesítő / Email notification ===> 
Keresés
Σ: 1 post

TCH  (statz) Főfasz
#1, Főfasz (10794)
5511 | #5bae | ^ | Idézet | Sun, 29 Mar 2026 19:20:20 +02
178.164.*.* Linux x86 Opera Classic Hungary *.pool.digikabel.hu
Közben a Geminivel összeszenvedtem az Nginxben a normális szűrést, ami az access.log-ból is kivágja a sok szar robotot. Szóval kell egy olyan blokk, hogy
map $http_user_agent $allow_user {
        "~*AITCSRoboti" 0;
        "~*Accoona" 0;
        "~*AhrefsBot" 0;
        "~*Amazonbot" 0;
        "~*Arachnophilia" 0;
        "~*AspiegelBot" 0;
        "~*AwarioBot" 0;
        "~*AwarioSmartBot" 0;
        "~*BLEXBot" 0;
        "~*BLEXbot" 0;
        "~*BackDoorBot" 0;
        "~*BackRub" 0;
        "~*Baidu" 0;
        "~*Barkrowler" 0;
        "~*BecomeBot" 0;
        "~*BlowFishi" 0;
        "~*BomboraBot" 0;
        "~*CCBot" 0;
        "~*CatchBot" 0;
        "~*CherryPicker" 0;
        "~*Clickagy" 0;
        "~*Cliqzbot" 0;
        "~*ConveraCrawler" 0;
        "~*CrowdTanglebot" 0;
        "~*CyberSpyder" 0;
        "~*DataForSeoBot" 0;
        "~*DotBot" 0;
        "~*EchoboxBot" 0;
        "~*EmailCollector" 0;
        "~*Exabot" 0;
        "~*Eyeotabot" 0;
        "~*Foobot" 0;
        "~*Genieo" 0;
        "~*GetURL" 0;
        "~*Gigabot" 0;
        "~*GrapeshotCrawler" 0;
        "~*GumGum" 0;
        "~*HTTrack" 0;
        "~*Huaweisymantecspider" 0;
        "~*IAScrawler" 0;
        "~*Java" 0;
        "~*JikeSpider" 0;
        "~*Jobboerse" 0;
        "~*Jyxobot" 0;
        "~*Leikibot" 0;
        "~*LinkScan" 0;
        "~*LinkisBot" 0;
        "~*LivelapBot" 0;
        "~*MAZBot" 0;
        "~*MBCrawler" 0;
        "~*MJ12bot" 0;
        "~*MauiBot" 0;
        "~*MojeekBot" 0;
        "~*NTENTbot" 0;
        "~*NerdyBot" 0;
        "~*Nimbostratus-Bot" 0;
        "~*Offline Explorer" 0;
        "~*Onespot-ScraperBot" 0;
        "~*Openbot" 0;
        "~*OutclicksBot" 0;
        "~*PaperLiBot" 0;
        "~*PlurkBot" 0;
        "~*Proximi" 0;
        "~*Quantcastboti" 0;
        "~*Qwantify" 0;
        "~*SEOkicks" 0;
        "~*SEOkicks-Robot" 0;
        "~*SERankingBacklinksBot" 0;
        "~*ScholarBot" 0;
        "~*Scrap" 0;
        "~*Screaming Frog SEO Spider" 0;
        "~*Semantici" 0;
        "~*Semrush" 0;
        "~*SemrushBot" 0;
        "~*SentiBot" 0;
        "~*SerendeputyBot" 0;
        "~*SeznamBot" 0;
        "~*SirdataBot" 0;
        "~*SiteCheck-sitecrawl" 0;
        "~*SiteSnagger" 0;
        "~*Snooper" 0;
        "~*Sogou" 0;
        "~*Sosospider" 0;
        "~*SuperBot" 0;
        "~*TTD-Content" 0;
        "~*Taboolabot" 0;
        "~*TeleportPro" 0;
        "~*TkBot" 0;
        "~*TweetmemeBot" 0;
        "~*URLSpiderPro" 0;
        "~*Vagabondo" 0;
        "~*VelenPublicWebCrawler" 0;
        "~*VoilaBot" 0;
        "~*VoluumDSP-content-bot" 0;
        "~*WebCopier" 0;
        "~*WebReaper" 0;
        "~*WebStripper" 0;
        "~*WebZIP" 0;
        "~*Xaldon_WebSpider" 0;
        "~*YaK" 0;
        "~*ZGrab" 0;
        "~*ZoominfoBot" 0;
        "~*adbeat_bot" 0;
        "~*admantx" 0;
        "~*admantx-usaspb" 0;
        "~*aiHitBot" 0;
        "~*bingbot" 0;
        "~*coccocbot" 0;
        "~*contxbot" 0;
        "~*findlinks" 0;
        "~*httplib" 0;
        "~*linkdexbot" 0;
        "~*linkfluence.com" 0;
        "~*meta-externalagent" 0;
        "~*mtbot/1.1.0i" 0;
        "~*proximic" 0;
        "~*python" 0;
        "~*serpstatbot" 0;
        "~*weborama-fetcher" 0;
        default 1;
}
(Igen, ezt fel lehetne regexel írni egy sorba is, de a Gemini azt mondta, hogy az a leglassabb, így gyorsabb és egyébként áttekinthetőbb is.) Aztán a szerverek blokkjaiba meg mehet ez:
        access_log /var/log/nginx/access.log combined if=$allow_user;
        if ($allow_user = 0) {
                return 444;
        }
És itt szeretném megjegyezni, hogy a bingbot-ot amúgy nem akartam kivágni, mert miért csesszek ki a bing userekkel, de sajnos kiderült, hogy a bing botja már rohadtul nemcsak a keresési indexeket gyártja, hanem a Copilot nevű emberiségellenes bűncselekményhez is scrapel. Mondjuk még ezt is lenyeltem volna, de amikor épp kurwára örülvén, hogy végre nem lesz több GB az access.log állandóan, elrotáltam az Nginx logjait, majd megrökönyödve néztem, hogy rögtön elkezdett hízni, mert a bingbot scrapelt, akkor úgy döntöttem, hogy ez viszont már pofátlanság, szóva a májkiszoft megint csak kapja be. Kedves bingjúzerek, sajnálom. Így jártatok. Tanulság (megint csak): ne használj mikrofos termékeket (binget se), mert nem azt csinálja, amire neked van szükséged, hanem amit a mikrofoszt akar. Ez van. Ha nem szórta volna tele a logot, akkor nem baszom ki, de így kabbefasz van.


English | Magyar
JS ki | CSS ki | Ékezetek ki | HiContrast
Lapozó:  (0 - 1467) 
<== | ==>
Ugrás a végére | Összes megjelenítése | Utolsó oldal
OpenOpera patches | Opera-SSL patches | Opera 12.15 source (Git repository) | Opera 12.15 source (Torrent) | Opera internal pages | Otter Browser Linux x64 - Qt5.15.2/QtWebKit5.602.1 (2026.04.01. 00:26)
OS for MC680x0 | OS for PPC | OS for Sparc64 | besztofbégéaefcé | CSÉNDZSLOG | WebToolz | DDG Shit Filter | Google Shit Filter | Progz | Fast CSS Box | Browser | OS | Agent | Statisztika | BBCode
Monospace font-family: Courier New | Browser default monospace
Email értesítő / Email notification ===> 
Keresés

Név: (max 255 byte)

Email: (max 255 byte) Nem kötelező!

Üzenet: (max 65536 kar.) 65536-0=65536




crap_vkn v4.35.1 by TCH
Thx to saxus for the escaped string decoder function (PHP), the realIP function (PHP) & the SQL handle layer (PHP), to thookerov for the int_divide function (PHP), to Jeff Anderson for the getSelText function (JS), to Alex King for the insertAtCursor function (JS), Flood3r for the new CSS styles, Pety for the spamprotection idea and some design and comfort ideas, MaxMind (2011-2026) and IPLocate (2026-) for the IP2Country database, famfamfam for the flags of countries and an unknown PHP programmer for the removeAccents function.



Kecskebaszók ide!