Wielu użytkowników zgłasza obciążenia serwera przez „tajemnicze adresy IP” :)
Z przesłanych zgłoszeń wynika, że są to adresy powiązane z crawleraami AI. Przykładowe IP ze zgłoszeń:
20.171.207.xxx, czyli np.:
20.171.207.150
20.171.207.151
20.171.207.178
20.171.207.169
20.171.207.125
Połączenia, które wykonują adresy IP podpisują się jako: Mozilla/5.0 AppleWebKit/537.36 (KHTML, like Gecko; compatible; GPTBot/1.2; +https://openai.com/gptbot)
Dla całego serwera:
Dla domeny:
Decyzja należy do użytkowników , poniżej podajemy przegląd robotów OpenAI:
"OpenAI używa robotów indeksujących („robotów”) i agentów użytkownika do wykonywania działań dla swoich produktów, automatycznie lub na żądanie użytkownika. OpenAI używa następujących tagów robots.txt, aby umożliwić webmasterom zarządzanie sposobem, w jaki ich witryny i treści współpracują ze sztuczną inteligencją. Każde ustawienie jest niezależne od pozostałych – na przykład webmaster może zezwolić OAI-SearchBot na wyświetlanie się w wynikach wyszukiwania, jednocześnie nie zezwalając GPTbot na wskazywanie, że przeszukana treść nie powinna być używana do trenowania generatywnych modeli bazowych sztucznej inteligencji OpenAI. W przypadku wyników wyszukiwania należy pamiętać, że dostosowanie się naszych systemów może potrwać około 24 godzin od aktualizacji pliku robots.txt witryny."
Agent użytkownika |
Opis i szczegóły |
---|---|
OAI-SzukajBota |
OAI-SearchBot służy do wyszukiwania. OAI-SearchBot służy do łączenia się z witrynami i wyświetlania ich w wynikach wyszukiwania w funkcjach wyszukiwania ChatGPT. Nie służy do indeksowania treści w celu trenowania generatywnych modeli bazowych AI OpenAI. Aby zapewnić wyświetlanie witryny w wynikach wyszukiwania, zalecamy zezwolenie na OAI-SearchBot w pliku robots.txt witryny i zezwolenie na żądania z naszych opublikowanych zakresów IP poniżej. |
ChatGPT-Użytkownik |
ChatGPT-User jest przeznaczony do działań użytkownika w ChatGPT i Custom GPT . Gdy użytkownicy zadają pytanie ChatGPT lub CustomGPT, może on odwiedzić stronę internetową z agentem ChatGPT-User. Użytkownicy ChatGPT mogą również wchodzić w interakcje z aplikacjami zewnętrznymi za pośrednictwem GPT Actions . ChatGPT-User reguluje, do których witryn można kierować te żądania użytkownika. Nie jest on używany do automatycznego przeszukiwania sieci ani do przeszukiwania treści w celu generatywnego szkolenia AI. |
GPTbot |
GPTBot jest używany, aby uczynić nasze generatywne modele bazowe AI bardziej użytecznymi i bezpiecznymi. Jest używany do indeksowania treści, które mogą być używane do trenowania naszych generatywnych modeli bazowych AI. Niedozwolone GPTBot oznacza, że treść witryny nie powinna być używana do trenowania generatywnych modeli bazowych AI.
|
Źródło: https://platform.openai.com/docs/bots/
* Modyfikacja pliku htaccess:
Blokada wszystkich adresów IP
Blokada wszystkich adresów IP z wyjątkiem wybranych
Blokada wybranych adresów IP
W miejsce XX.XXX.XX.XX o powinieneś wstawić adresy IP, którym chcesz ograniczyć dostęp. Dodając kolejne wpisy „Deny from XX.XXX.XX.XX„ masz możliwość blokady dowolnej ilości adresów IP.