Dupliquer un site avec l'IA
Depuis peu, l'outil Same.new fait parler de lui en proposant de répliquer intégralement des sites web existants en seulement quelques clics. Initialement présenté comme un accélérateur de prototypage pour les designers et développeurs, cet outil pose cependant des questions éthiques et juridiques majeures.
Présentation de Same.new
Same.new se distingue par une promesse simple : cloner entièrement un site internet existant, en reprenant à la fois le design, la mise en page et souvent même les contenus originaux. Destiné à simplifier le processus créatif ou à accélérer le prototypage, l'outil permet à des utilisateurs sans compétences techniques poussées de disposer rapidement d'une copie fonctionnelle de n'importe quel site.
Les problématiques soulevées par la duplication
Bien que séduisante sur le plan pratique, cette capacité soulève des préoccupations sérieuses :
- Violation des droits de propriété intellectuelle : la réplication intégrale de contenus textuels, graphiques ou photographiques est souvent réalisée sans l'autorisation des créateurs originaux. De nombreux professionnels dénoncent cette pratique comme du plagiat manifeste.
- Atteinte à l'image et à la réputation : la multiplication de copies identiques ou légèrement modifiées peut diluer la notoriété d'une marque ou créer de la confusion chez les internautes.
- Risques SEO : les contenus dupliqués nuisent au référencement naturel des sites originaux, créant des conflits dans les résultats des moteurs de recherche comme Google.
- Risques de sécurité et fraude : l'outil pourrait être détourné pour créer rapidement des sites de phishing ou d'autres arnaques, imitant des sites légitimes pour tromper les utilisateurs finaux.
Des cas concrets et jurisprudence
Plusieurs outils similaires, comme HTTrack ou Website Copier, ont par le passé soulevé des débats et des litiges, notamment dans des cas de détournements de contenus à grande échelle. Par exemple, le plagiat massif de contenus de sites d'information ou d'e-commerce a déjà entraîné des poursuites judiciaires avec des condamnations lourdes à la clé.
Protéger votre site contre l’indexation par des agents automatisés
Il n’est pas possible de bloquer directement le site Same.new, dans la mesure où ce service ne consulte pas votre site comme un utilisateur classique identifiable par une adresse IP ou un domaine spécifique. En revanche, vous pouvez restreindre l’accès aux agents automatisés (bots) susceptibles d’être utilisés par ce type de plateforme, notamment grâce à deux moyens complémentaires : le fichier .htaccess
(sur les serveurs Apache) et le fichier robots.txt
.
Blocage via .htaccess
Si vous avez identifié un User-Agent suspect dans vos logs serveur (par exemple un bot comme SameNewBot
), vous pouvez bloquer son accès en ajoutant la règle suivante dans votre fichier .htaccess
à la racine de votre site :
RewriteEngine On
RewriteCond %{HTTP_USER_AGENT} SameNewBot [NC]
RewriteRule .* - [F,L]
Important : remplacez SameNewBot
par le nom exact du User-Agent utilisé par l’outil en question. Celui-ci peut être trouvé dans vos journaux d’accès (access logs) lorsqu’un bot visite votre site.
Blocage via robots.txt
Pour les bots respectueux des conventions (comme ceux des moteurs de recherche), vous pouvez également leur indiquer les zones de votre site à ne pas explorer à l’aide du fichier robots.txt
:
User-agent: SameNewBot
Disallow: /
User-agent: *
Allow: /
Cependant, gardez à l’esprit que cette méthode repose sur la bonne foi des agents, et qu’un bot malveillant peut très bien ignorer ces directives.
Blocage par adresse IP (hébergeur Vercel)
Le site Same.new étant hébergé sur la plateforme Vercel, il est possible que les requêtes automatisées effectuées depuis leur service proviennent d'adresses IP appartenant à cette infrastructure. Dans ce cas, une stratégie complémentaire au filtrage par User-Agent consiste à bloquer certaines plages d'adresses IP connues de Vercel.
Pour cela, vous pouvez :
- Consulter les plages d’IP utilisées par Vercel (disponibles sur leur documentation technique ou par analyse de vos logs serveur)
- Les bloquer via votre pare-feu, votre CDN (comme Cloudflare), ou encore dans le fichier
.htaccess
si vous utilisez Apache
Voici un exemple très simple de blocage d’IP dans un fichier .htaccess
:
<RequireAll>
Require all granted
Require not ip 76.76.21.0/24
</RequireAll>
⚠️ Attention : bloquer intégralement les plages IP de Vercel peut également empêcher l’accès à votre site pour des utilisateurs légitimes hébergés sur cette même plateforme (comme des développeurs, startups ou prestataires). Il est donc fortement conseillé de surveiller votre trafic avant toute mise en œuvre trop restrictive.
En fait, cette méthode peut être efficace en complément d’un filtrage par User-Agent, mais elle doit être appliquée avec discernement.
L'équilibre entre innovation et éthique, mis à mal
Si Same.new présente des avantages en matière d'inspiration et de prototypage rapide, il reste essentiel de rappeler la responsabilité de chaque utilisateur vis-à-vis des droits de propriété intellectuelle et des règles éthiques du web. Face à l’essor de tels outils, chacun doit réfléchir à l’équilibre entre facilité d’accès technologique et respect des créateurs originaux.