Nœuds & Réseau: webographie
1. HYPHE:
Présentation de la démarche de crawling et du protocole de curation
La webographie permet d'étudier les liens entre les différents acteurs que nous avons recensés. Pour cette étape de notre analyse, nous avons utilisé l'outil développé par le MédiaLab de l’École Science Po : HYPHE.
Hyphe est un outil de crawling et de curation permettant de constituer un corpus à partir de sites internet.
L'analyse a porté sur 90 sites internet enserrant l'acteur Air France (Voir annexe: site internet constituant le corpus web). Ces 90 sites internet ont été regroupés par catégorie :
Organisations internationales;
Instance en lien avec l’État français;
ONG;
Compagnie aérienne;
Association;
Calculateur d'émissions;
Société de conseil/ compensation;
Programme de plantation;
Presse Grand public;
Presse spécialisée;
Autres acteurs;
Instances de certification.
Remarque:
La version de HYPHE disponible sur le site du MédiaLab ne permet que de crawler à plus d'un clic, limitant le champ et la profondeur de cette analyse (c'est-à-dire les liens susceptibles d'être fait avec d'autres sites internet).
Pour constituer le corpus, nous avons délibérément choisi de retirer toutes les références susceptibles de sur-représenter certains sites internet/écosystèmes/métamoteurs de recherche:
Google/Yahoo/Mozilla...
Microsoft/Skype/Outlook/Apple/adobe
Twitter/Linkedin/Facebook/Instagram
Youtube/flickr/vimeo
Wikipedia...
Ces derniers seront donc classés en OUT.
Représentation de l'écosystème de la controverse à travers le prisme de l'outil Hyphe:
Le premier visuel obtenu sous Hyphe, sans qualification et ni scénarisation des liens nous a permis d'obtenir la représentation ci-dessous permettant un positionnement de l'acteur Air France dans sa représentation web. Les liens en rouge montre la forte interaction entre les sites internet à un clic. Il existe nécessairement un biais, puisque la partie développement durable du site Air France possède nécessairement plus de liens (pointe) vers les sites figurant dans l’écosystème des acteurs étudiés, que le site https://www.airfranceklm.com/fr/groupe
Ce second visuel, montre que le site Air France est clairement sous pondéré dans la représentation que nous souhaitons faire de notre écosystème (90 sites). En effet, les sites de type média (presse spécialisé, grand public...) sont naturellement surreprésentés dans notre écosystème sans pour autant entretenir de liens directs avec le site internet d'Air France et donc notre sujet de controverse. Les sites "Média" pointent les uns vers les autres créant leur propre système, sans pour autant faire nécessairement référence au site Air France comme source de la controverse étudiée. L'usage de Seealsology va aussi nous apporter des résultats similaires pour le système wikipedia.
2. Seealsology
L'utilisation de Hyphe nous permet d'exclure l'univers Wikipedia susceptible d'amorcer trop de boucles autocentrées. Pour regarder l'univers wikipedia, nous avons utilisé l'outil Seealsology qui permet d'obtenir une cartographie des liens relatifs à des thèmes, mots recherchés sur ce portail.
En utilisant la liste de mots figurant ci-dessous :
Une première recherche de niveau 1 nous permet de constater que les univers sont sensiblement disjoints.
A ce stade, le site Air France semble totalement dissocié du reste des thématiques recherchées.