Content spinning : The French Spinner
Bon cela fait un petit moment que je n’avais pas posté d’article sur mon blog, non pas par manque d’envie, mais plus par manque de temps….
En effet, ces derniers temps, je suis très occupé par différents projets, et notamment un sur lequel je travaille en binôme avec Tiger. Vous en avez certainement déjà entendu parler sur le blog de Rudy, qui a annoncé quelques projets qui allaient voir le jour sous peu, et qui au passage lance un nouveau blog à caractère didactique : SEO Guide.
Bref, voici pour la petite histoire….
Content spinning, à la mode en ce moment
Vous en entendez parler partout, c’est un mot qui revient sur de nombreux blogs, et pour cause, cette technique permet de faire gagner énormément de temps pour un référencement de bonne qualité.
Le white hat pourrait très bien s’en servir, il n’y a rien de profondément dark dans cette technique, à part le côté automatisation.
Il est très important de noter qu’en français, le content spinning 100% automatique est impossible (ou presque).
Comment faire du content spinning ?
L’idée est assez simple en elle-même, mais difficile à mettre en place.
Il faut, pour un texte donné, ajouter des synonymes, des expressions, sur un ou plusieurs niveaux, afin d’obtenir un texte unique une fois celui-ci passé dans une moulinette à contenu.
Prenons un exemple…
Texte de départ
1 | Un texte simple à convertir en texte spinné |
Texte spinné
1 | Un {texte|écrit} {{très|ultra} simple|facile|simpliste} à {convertir|transformer} en {texte|contenu} spinnable |
Vous remarquerez que les synonymes sont entourés d’accolades et séparés par des pipes (le signe |). On peut fonctionner sur plusieurs niveaux, comme dans cette portion {{très|ultra} simple|facile|simpliste}, où l’on remarquera la présence d’un sous-groupe dans le groupe parent.
Une fois le contenu spinnable passé dans le script générateur de texte, vous obtiendrez autant de textes uniques que les synonymes le permettent.
Il est clair que sur un échantillon comme celui que je vous ai donné, les résultats seront pauvres, mais sur un extrait de 300 ou 500 mots, les résultats sont très appréciables.
The French Spinner
Le content spinning en français est assez délicat, car on connaît tous les difficultés de notre langue.. Je me suis donc penché un peu sur le problème pour arriver à une solution assez fiable, qui permet de faire le gros du travail en amont et donne une assistance au spinning en aval pour obtenir un résultat plutôt satisfaisant.
Il s’agit d’un script de content spinning que j’ai développé, qui apprend les expressions et permet d’accélérer le travail.
Le script n’en est qu’à ses débuts, mais il est assez prometteur… Je vous laisse voir la démo ci-dessous
Conclusion sur le content spinning en français
J’espère que cela vous a plu !
L’outil n’est pas encore complètement finalisé ni opérationnel, mais je peux déjà vous annoncer qu’il fera partie des services proposés dans le cadre de notre projet.
Imaginez simplement la facilité avec laquelle vous pourrez créer des descriptions uniques pour les annuaires pour vos opérations de netlinking… Des communiqués de presse qui ne seront pas refusés pour cause de duplicate content et la joie de tous ces webmasters qui auront du bon contenu pour leurs sites… Tout le monde y gagne !
Cet outil apprend au fur et à mesure que des textes lui sont soumis afin de le rendre de plus en plus pertinent.
Je suis très preneur de vos suggestions si vous en avez, alors n’hésitez pas
Tags: content spinning, script, spinner, spinning
juin 8, 2010 à 10:43
Il y a quelques temps, suite à une discution sur WRI (http://forum.webrankinfo.com/creer-des-descriptions-uniques-solution-t123024.html), j’ai fait une ‘tite fonction php dans ce genre.
Elle est moins évoluée que l’outil présenté ici mais pourra peut-être interresser quelqu’un.
Demo : http://labs.seebz.net/divers/synonymizer.php
function synonymizer($text)
{
$callback = function($in)
{
$all = $in[0];
$words = explode(’|', $in[1]);
$rand_keys = array_rand($words);
return $words[$rand_keys];
};
echo preg_replace_callback(
‘`\{([^{}]+)\}`U’,
$callback,
$text
);
}
juin 8, 2010 à 10:45
Hello, bien vu pour le prog’
pas vu la vidéo mais je me doute que ce petit script pourrait m’intéresser.
sera t’il mis à dispo gratuitement ? payant ? si payant, une idée du tarif ?
bonne journée
juin 8, 2010 à 10:51
Est ce que ce script permettra de mettre en commun (centraliser depuis tous les users) les synonymes pour un mot donné, comme le fait TBS ?
juin 8, 2010 à 10:53
Bonne approche du spinning automatique, quand j’y avais “réfléchis” j’étais pas partie sur une idée comme ça… c’est beaucoup mieux
Si tu supprime une correspondance dans la pop-up c’est supprimé de la base des synonymes ou juste pour ce spinning là ? Sinon je pense que ça va devenir chiant quand tu auras XX correspondances pour un mot et qu’il faudra tous les supprimer un par un…
Beau travail en tout cas
juin 8, 2010 à 11:07
première réaction : c’est impréssionant.
pour faire des suggestions pertinantes il faudrait pouvoir “tester” la bête.
de la démonstration j’aurais une question (ou suggestion si ce n’est pas le cas) :
- doit on sélectioner tout le “spin” pour l’éditer ?
- qu’elle est la limite de profondeur du niveau pour le spin ?
- pourrait on penser à une insertion + rapide encore ? ( mettre un bouton par exemple [de] qui inclus en spin toute les déclinaitons de [de] directement ?
j’aurais d’autre choses à dire mais j’attends la réponse au 2 premieres questions
juin 8, 2010 à 11:28
Excellent !! une première automatisation du spinning pour facilité le travail mais il faut quand même avoir un dictionnaire de synonyme de qualité en amont (tâche difficile dût à notre langue si complexe comme tu l’évoque si bien). La fonction d’amélioration du champs lexical à la mano est indispensable ceux à quoi tu as pensé !
Pour l’instant je suis ravi de cette première ébauche et j’ai hâte de voir le résultat final.
Proposition : aller plus loin en proposant une série de tag ou catégorie correspondant à chaque texte spinner => facilité l’inscription dans les annuaires par exemple
juin 8, 2010 à 11:43
Ton outil a l’air très intéressant et comme tu le dis n’est pas black hat, il permet un gain de temps non négligeable pour générer du texte propre (que cela soit pour les CPs, annuaires, splogs…) selon la couleur du chapeau et la volonté des utilisateurs.
Bravo.
juin 8, 2010 à 13:48
@Niko: Merci
Ce script devrait être diffusé comme un service en ligne, accompagné d’autres offres connexes qui devraient en intéresser pas mal
@Slate: Oui, mais pas de façon aussi “bête” que TBS car en français il y a de nombreuses subtilités qu’il faut prendre en compte.
Pour le moment, seuls les admins peuvent ajouter des expressions dans la base, mais à terme, elles seront enregistrées puis filtrées et retravaillées pour correspondre au mieux et améliorer la pertinence des synonymes.
@Michael: dans la démo, tu as dû voir qu’il y a 2 boutons, l’un est pour supprimer du texte, l’autre pour supprimer de la base de données, mais le concept va être fortement améliorer dans quelques temps
@Blackat: pour une expression déjà spinnée, il suffit de cliquer pour que les synonymes s’affichent dans la popup, ensuite, si tu veux faire du multi-niveaux, il faut sélectionner l’endroit où tu veux l’insérer. J’ai volontairement pris toute l’expression dans la démo pour que les visiteurs voient bien la démarche.
Concernant la limite de profondeur, pour le moment, je n’ai testé que sur 3 niveaux, mais on peut aller bien plus loin
Pour l’insertion plus rapide, j’ai déjà une bonne idée, un vieux script que j’avais codé il y a maintenant 2 ans, mais que je pense intégrer si l’aspect utilisateur s’en trouve amélioré.
@Mikiweb: merci On réfléchit à proposer des thématiques pour les synonymes afin d’obtenir des résultats encore plus précis. ça mâche bien le travail, mais c’est assez complexe à mettre en place, notamment avec PHP/MySQL
@Aurélien: Merci
juin 8, 2010 à 15:31
Ce script a l’air ultra prometteur mais pour les gros paresseux comme moi, il lui manque l’automatisation complète
Très bon boulot en tout cas
juin 8, 2010 à 16:03
Malheureusement, c’est impossible (peut-être quasi-impossible) en français…
Le résultat serait tout à fait désastreux…
En anglais, je dirais qu’il y a plus de chances, mais n’étant pas linguiste, je ne vais pas m’avancer…
juin 8, 2010 à 16:26
Super le script, j’ai très hâte d’essayer ça ….. va y’avoir de l’achalandage sur ton site héhé …
Seebz, c’est pas un script de spinning normal?
juin 8, 2010 à 17:12
Script très sympa et prometteur. Je déteste juste la complexité de notre langue qui nous empeche d’être bourrin
juin 8, 2010 à 17:31
@BlackMelvyn : Il n’y aurait pas une version en ligne histoire que je ne pause pas de questions inutile ?
ou possibilité de le tester en local ?
pas mal d’idée, mais pas le temps autant que je les donnes si ca t’interesse merci de me contacter par mail directement
juin 8, 2010 à 20:26
Argh, j’ai envie d’hurler quand je vois les effets JQ, c’est tout ce qui me manque pour le mien
En revanche, je suis parti ailleurs moi … Pas de BDD, seulement une pioche sur des dico de synonymes. J’ai fait cette petite machine pour mon serial blogueur, les utilisateurs ayant la flemme de tout rédiger, il faut l’avouer c’est fastidieux.
Ils sont à présent rassurés
Les effets Js ça fait de suite tout pour l’interaction et l’intuitivité.
Et je confirme, la langue Française est réellement difficile à manier
En tout cas bravo, c’est zoli…
juin 8, 2010 à 20:37
Vraiment interessant Cependant cet outil ne sera disponible que via votre service en ligne ou on pourra acheter le script…?
juin 9, 2010 à 1:47
J’ai hâte de pouvoir tester l’outil.
Bravo à toi.
juin 14, 2010 à 1:48
“Ce script devrait être diffusé comme un service en ligne, accompagné d’autres offres connexes qui devraient en intéresser pas mal ;)”
Genre…
En vrai il n’ose pas vous dire que des milliers de web masters vont mouiller leur petite culotte de l’outil proposé ! ^^
juin 24, 2010 à 15:21
Script très intéressant qui permet l’automatisation des descriptions et qui nous fait gagner du temps, ce qui n’est pas négligeable. Il est clair que l’optimisation de son temps est primordial. Reste à voir comment Google positionne un article naturel par rapport à un article spinner.
juin 26, 2010 à 19:14
ça a l’air vraiment intéressant, peut-on enregistrer son dictionnaire de synonymes pour une utilisation ultérieure|future|nouvelle|prochaine dans un autre texte ?
juillet 5, 2010 à 17:21
Bravo pour cet article, les ressources en anglais sont nombreuses mais le français se fait rare !
Quelques suggestions :
Et si en plus, on ajoutait un bouton media (photos, videos, …) qui va piocher un media au hasard en fonction des mots clés choisis dans une recherche de medias libres de droits (ccsearch par exemple) et l’intègre à l’article généré ?
Et si on pouvait également avoir accès à une liste de liens (favoris, affiliations, …) rentrés au préalable par l’intermédiaire d’un menu contextuel lorsque on clique sur un mot dans le texte ?
Et si on pouvait enfin avoir un bouton pour automatiser la soumission aux plateformes de blogs que l’on a crées ?
Avec des si…
juillet 15, 2010 à 14:53
Bonjour Blackmelvyn tous d’abord super boulot comment participé et utiliser ton script ?
Cordialement Laurent
août 31, 2010 à 0:05
Ouuuuuuuuuuu p’tain comment je suis a la bourre sur ce post! Bel outil en effet qui pourra etre utile a nombre d’entre nous. J’avoue aussi etre particulierement interesse par le projet de Guide SEO juste histoire de voir sous quel angle tu vas l’attaquer!
septembre 11, 2010 à 22:46
Votre outil a l’air nickel, bien ergonomique, alors qu’est ce que vous attendez pour le sortir :p ? On est déjà le 11 Septembre ;-))))) Le problème avec l’anglais est le nombre de mots impressionnants soit un vocabulaire (en nombre) supérieur à 4 ou 5x plus riche que le français avec forcement les non sens et les difficultés qui vont avec.
septembre 22, 2010 à 11:05
Salut,
Une fois le script en place ou même en test, je suis prêt à faire un retour.
A bientôt.
novembre 3, 2010 à 16:34
Bonjour,
Excellente idée, même si les résultats sont largement meilleurs qu’en scrapant et passant sous hugeshake ou en faisant du scraping de google translate, certains des synonymes de votre exemple permettent de se rendre compte que le texte est généré par un soft et non humain.
Ex : {champignon|accélérateurs}, synonymes mais pas dans ce contexte.
En tous cas excellent boulot merci.
novembre 16, 2010 à 23:51
Bravo Melvyn, ton outil me parait excellent.
La démo est vraiment sympa.
Bon courage pour la suite
janvier 25, 2011 à 2:59
Des news de ce superbe script ?
janvier 26, 2011 à 12:24
Oui, script très intéressant. Ou en est-on pour la commercialisation?
février 4, 2011 à 18:02
impossible de travailler par champs lexicaux?
Inclure un dictionnaire de synonyme par champ, connotation, niveau de langage?
Définir des profils d’user utilisant tel ou tel niveau de langage, telle ou telle expression de classe?
Génération de fautes de frappes, d’orthographe ou d’abréviations de manière automatique?
inclure un effet “téléphone arabe” avec déformation légère et progressive du contenu au fil des rebonds?
Du point de vue linguistique, la CIA avait mis au point un truc pour détecter les taupes… Des modifications légères des tons du texte, qui permettaient par l’analyse de faciliter l’identification de la version du texte, et donc de la personne en sa possession.
Si, en français c’est “possible”, mais c’est un sacré challenge.
mars 26, 2011 à 23:10
Bonjour Blackmelvyn,
Dans l’idéal il faudrait pouvoir mixer cet outil avec un dictionnaire de synonymes comme celui développé ici: http://www.crisco.unicaen.fr/cgi-bin/cherches.cgi dommage qu’ils n’autorisent pas l’utilisation automatisée…
Je bosse aussi sur un projet similaire en JS/ruby pour (semi)automatiser le spinning.
Olivier
avril 7, 2011 à 23:52
très intéressant ce spin! félicitation
je suis a la recherche d’un spin francais, comment ont peut ce le procurer?
merci
mai 17, 2011 à 0:13
Tout d’abord un grand merci a toi Blackmelvyn,
ensuite je voulai savor si tu avais connaissance d’un content spinner automatique ? bati sur des base de synonyme thematique ou alors sur des base d’expression ?
Merci
août 22, 2011 à 17:50
Script très sympa et prometteur.merci pour cet article très utile.
septembre 6, 2011 à 15:53
Un spinner performant en français manque cruellement, quand penses-tu sortir le tien? C’est définitivement un outil qui ferait un malheur, surtout s’il venait avec sa base de synonymes incluse
Ceci dit, un bon spinning suppose de toutes façons un gros travail manuel pour trouvers des alternatives de parties de phrase et pas seulement des synonymes. Mais cela en vaut la peine, une fois que c’est fait.
septembre 30, 2011 à 18:42
c’est tres utile comme software, mais quand est ce que tu pourras le mettre à dispo?..
octobre 6, 2011 à 22:31
Très bon script très prometteur. J’ai hâte qu’il soit disponible !
janvier 8, 2012 à 20:03
Alors c’est dispo?