La technologie évolue rapidement, et avec elle, la manière dont les entreprises interagissent avec les intelligences artificielles. Une tendance récente montre que 26% des 100 sites web les plus populaires ont décidé de bloquer GPTBot. Pourquoi cette décision ? Cet article vous donnera une perspective détaillée.
Évolution du blocage de GPTBot par les sites majeurs
Selon les dernières analyses, au moins 26 des 100 sites web les plus populaires, et 242 des 1 000 premiers, bloquent désormais GPTBot. C’est une augmentation significative de 250% par rapport au mois dernier, où seulement 69 des 1 000 sites principaux avaient pris cette décision. Cette statistique a été confirmée par une étude mise à jour d’Originality.ai, un service spécialisé dans le contenu AI et la détection de plagiat.
La raison principale : la citation et la liaison
La principale préoccupation des propriétaires de sites web et des spécialistes du référencement est que ChatGPT, la technologie derrière GPTBot, ne cite pas ou ne fait pas de lien vers ses sources. Historiquement, les moteurs de recherche ont été autorisés à parcourir le contenu car il y avait un bénéfice potentiel pour les sites : obtenir du trafic via des liens directs ou des citations. Cependant, de nombreux sites populaires ont décidé de bloquer GPTBot, probablement parce qu’ils ne souhaitent pas qu’OpenAI utilise leurs données pour former ses modèles sans une forme de compensation.
Les grands noms qui ont rejoint le mouvement
Parmi les sites les plus populaires qui ont récemment décidé de bloquer GPTBot, la majorité publie des actualités et des informations. Voici quelques-uns de ces sites :
- pinterest.com
- indeed.com
- theguardian.com
- sciencedirect.com
- usatoday.com
- stackexchange.com
- alamy.com
- webmd.com
- dictionary.com
- washingtonpost.com
- npr.org
- cbsnews.com
Il convient de noter que Foursquare, qui bloquait GPTBot le mois dernier, ne le fait plus.
Et qu’en est-il de CCbot ?
CCbot, le web crawler de Common Crawl, est toujours moins bloqué, avec seulement 130 sites qui le bloquent actuellement. Rappelons que Common Crawl fournit une partie des données d’entraînement utilisées par OpenAI, Google et d’autres. À ce jour, 109 des 1 000 premiers sites bloquent à la fois GPTBot et CCbot.
La décision de bloquer ou non ChatGPT est un débat majeur parmi les spécialistes du SEO. Les enjeux sont clairs : d’un côté, il y a le potentiel d’attirer du trafic grâce aux liens directs et aux citations, et de l’autre, la crainte que des entreprises comme OpenAI exploitent le contenu sans compensation. Seul l’avenir nous dira comment cette dynamique évoluera.
[Source]
Lien rémunéré par Amazon, dernière mise à jour le 2024-09-03 . En tant que Partenaire Amazon, je réalise un bénéfice sur les achats remplissant les conditions requises.