Blog them all

Fabien Penso’s blog

Indexation de buzz

6 comments

(note: message envoyé d’abord sur LinuxFr)

J’ai envie de prototypes rapidement un système pour me permettre de suivre les tendances et les buzz. Je m’explique.

J’ai passé quelques heures ce week-end sur des sites par exemple sur celui là ou en gros on peut voir une personne en vidéo vous expliquer ce qu’est un geek, que pour être efficace il faut faire une réunion tous les soirs, et que pour se sécher après la douche il faut une serviette…

Il y a toujours les mêmes d’un microcosme Parisien qui font les mêmes soirées (en général à la Cantine) en ayant l’impression d’avoir inventé le monde (hier soir à une soirée DreamApero que je ne conseille à personne, un mec m’a parlé de son innovation de cartes de visite vidéo super à destination du B2B et dont une version est visible à http://itsmecard.com/berndhofstoetter). Je voudrais pouvoir suivre ces personnes et les cartographier pour voir que ce sont toujours les mêmes qui parlent de leur potes mais qu’au final rien n’en ressort.

Donc j’ai l’idée de faire un crawler de site qui irait prendre 10 ou 20 blogs connus en France (techcrunch) plus les blogs de quelques zigotos, de suivre les liens à +2 (ça ferait déjà beaucoup de pages) et d’indexer toutes les occurrences des mots, en notant le moment ou ils sont apparus.

Ensuite je pourrais faire des schémas qui indiquent jour après jour les tendances et les termes qui reviennent, pour retomber très rapidement ensuite éventuellement, et noter les sources ou ont été vu les termes et faire des bulles en fonction de leur origine. Je pourrais voir par exemple que le terme “DreamApero” a été évoqué sur les X blogs habituels mais pas ailleurs.

Je dis une connerie, vous avez des idées pour faire quelque chose d’efficace dans le genre ?

Written by Fabien Penso

November 21st, 2008 at 8:45 am

Posted in Uncategorized

6 Responses to 'Indexation de buzz'

Subscribe to comments with RSS or TrackBack to 'Indexation de buzz'.

  1. Ce qui serait efficace, c’est que le gars sur la vidéo arrête de boire déjà. Ton système intégrera un business loto ou pas, ça pourrait rapporter je pense ;-)

    Je m’abonne de suite à ta thématique.

    Olivier

    21 Nov 08 at 11:50 am

  2. La solution technique et la resultat des buzz m’interesse fortement !
    Cassoulet power !

    Xav

    21 Nov 08 at 2:16 pm

  3. Franchement tu fustiges les geeks du microcosme Parisien, mais rappel toi que tu en as fais parti et tu en fais tjrs parti d’un certaine manière vu que tu participes à ces réunions de nombrilistes :)
    Ceci dit ça peut être marrant cette notion de cartographie de l’information, mais quitte à cartographier des buzz, autant prendre des trucs marrants, insolites, technologiques, novateurs, que suivre des trucs inutiles (pour en rigoler dans d’autres réunions underground :) )).
    Moteurs de recherche de blogs & c° indexation tu peux voir avec Renaud sur la base du crawler et moteur de recherche qu’il a monté sur le sujet : http://www.blogdimension.com
    Tchuss, Yann

    deejOnKt

    21 Nov 08 at 4:08 pm

  4. Non ces réunions de nombrilistes j’y vais une fois par curiosité. Bon maintenant c’est un site qui me ferait beaucoup rire.

    Fabien Penso

    22 Nov 08 at 12:38 am

  5. @deejOnKt : nah, les gens de itsmecard n’ont pas l’allure des geeks; ils ont payé probablement un programmeur lambda pour leur faire le site

    @fabien: des sites de tracking de buzz existent depuis longtemps, il y en a pas mal déjà, (just google it)

    Daniel

    28 Nov 08 at 10:49 am

  6. Daniel : bah non justement, je n’ai rien trouvé de bien, mais il y a quelques pistes sur le lien linuxfr du haut (vers un truc fait par une boite française sur les soucis iPhone/Orange bridage 3G). Il y a bien le labs de digg.com mais sinon je ne vois pas.

    Fabien Penso

    28 Nov 08 at 10:53 am

Leave a Reply