Données fleuries #6
En vedette
Dis-moi où tu me plais est un projet d’amour. J’avais déjà apprécié l’atlas des connexions manquées pas plus tard que la semaine dernière, mais ce projet-là est juste mille fois mieux, il est interactif, puissant et il est français môssieur. Le principe ? Pomper la (grosse, 10 000 annonces en 4 ans) base de données du site de rencontres furtives Croisé dans le métro et joliment cartographier tout ça.
Le résultat obtenu par Pierre Jullian de la Fuente, le développeur de cette charmante application (D3.js + mapbox.js pour les mécaniciens), est sobre, léger, intuitif comme on les aime.
D’un côté, une carte permet de lire, station par station, les messages laissés par ces utilisateurs anonymes qui ont cru trouver l’amour, souvent, au cours d’un seul regard ou sourire échangé. On peut effectuer un filtrage sensé et classique (hétéro et homo dans les tous les sens rendus possibles par les mathématiques), ou encore filtrer par mot(s)-clé(s). D’un autre côté, un gros boulot d’analyse de contenu permet l’affichage d’une carte heuristique (appelée « graphe » pour l’occasion) ou chaque type de « rencontre » exhibe son gros champ lexical à la vue de tous.
Rapidement, toutefois, la flânerie et les lectures aléatoires, poétiques, désespérée, souvent drôle, l’emportent sur les fonctionnalités. Et c’est sans doute son principal attrait.
***
Est-ce que le Congrès des Etats-Unis craint ? (via) est la question posée par cette application (jQuery + CSS + data GovTrack) développée par Nilkanth Patel, qui – par ailleurs – fait des trucs de JavaScript et de design pour la célèbre revue « New-Yorker ». Ce projet « Does Congress Really Suck » a été développé dans le cadre d’une datafest organisée le mois dernier (entre autres) par Google et la Sunlight Foundation.
En clair, cette application a pour objectif principal d’évaluer l’efficacité de la Chambre des réprésentants et du Sénat et comparer cette efficacité aux législatures précédentes, et de mettre au clair les relations croissantes entre les « donateurs » (les lobbyistes pour ne pas les nommer) et le vote de lois liées plus ou moins directement avec les intérêts défendus par ces donateurs. Un projet qui rappelle donc – dans l’esprit, et non dans la forme – l’application LobbyPlag dont je parlais le mois dernier. Tiens, par exemple, l’actuel président de la Chambre des représentants, le Républicain John Boehner, est tout proche du lobby pétrolier. Marrant !
La minute carto
Average Commute Times (via) est une impressionnante application cartographique réalisée par John Keefe et qui s’appuie sur un rapport du bureau du recensement américain sur les « megacommuters », c’est-à-dire ces citoyens qui habitent à plus de 90 minutes (ou 80 kilomètres) de leur lieu de travail – soit, par exemple, 2% des New-yorkais. Une infographie officielle du recensement (pdf) super moche et assez informative est d’ailleurs disponible, hurle ta joie.
Cette cartographie chatoyante est l’énième démonstration de l’intérêt indiscutable d’ouvrir les données publiques. Au-delà de la jolie carte informative et de la performance technique, l’enjeu ici est évidemment de pouvoir s’emparer de ces données (comme l’a fait également le « Boston Magazine » en s’inspirant du boulot de Keefe) afin d’améliorer la vie quotidienne des citoyens, en simplifiant à l’extrême des données complexes, ou juste en offrant un rendu sexy à des données a priori rébarbatives à la consultation. Pari gagné.
***
atNight (via) est un autre projet barré comme je les aime, qui veut « soulever les questions de la configuration de l’identité nocturne », notamment en comparant la ville plongée dans l’obscurité (c’est beau une ville la nuit, dit le poète) avec la perception que nous en avons le jour. Ici, les différents aspects de Barcelone et de son organisation et la compréhension de ces organisations permettent « une approche de la structure des paysages nocturnes ». Un projet fait de multiples comparaisons, oppositions pompées dans l’observation de la donnée recueillie par autant de moyens que nécessaires à la réalisation de l’étude.
Soutenu par le gouverment de Catalogne et dirigé par une chercheuse-architecte flanquée d’un designer-architecte et d’un développeur, « atNight » (@atnightmaps) souhaite notamment proposer de « nouvelles stratégies urbaines collaboratives » en utilisant la visualisation de données pour « expliquer la relation de sens, de cause et de dépendance établie entre les citoyens et leur environnement ». Les données géolocalisées de Flickr, Twitter, Instagram, ont notamment été utilisées pour réaliser ce projet mixant art, sociologie et data.
La minute D3
The Beautiful Table (via) est un projet parfait. Non seulement Jonathan Ferry pose des questions liées à la mise en valeur de la donnée, mais il y répond. Et Jon parle de foot aussi. Data + Foot : sautons sur l’occasion.
Tout amateur de football sait que les informations centrales de son championnat préféré n’existent bien souvent que de manière déconnectée les unes par rapport aux autres. Jon s’est donc fixé un cahier des charges simple : fournir le classement, les résultats et le calendrier sous la forme d’un travail unique et cohérent ; ne pas perdre de fonctionnalités par rapport aux modes de visualisation existants ; révéler des informations supplémentaires qui soient immédiatement compréhensibles ; ne pas faire du design gratuitement, mais uniquement s’il est essentiel pour comprendre l’information.
Jon explique toute son travail de design pas-à-pas : un document immanquable pour comprendre la démarche derrière cette brillante mise en valeur la donnée.
La minute R&D
Identifying and Visualizing Viral Content (via) est une vidéo captivante publiée par Microsoft Research qui présente un gros projet de R&D appelé « ViralSearch ». Le projet part de l’idée selon laquelle la phrase « être viral » a désormais imprégné la culture populaire, mais que le concept de viralité, en soi, demeure très illusoire au vu de l’incapacité à définir – voire simplement démontrer – l’existence de contenu viral sur Internet.
Ils ont donc analysé et étudié un milliard d’informations – notamment sur Twitter, potentiellement Facebook dans le futur – en les structurant de manière à pouvoir véritablement comprendre (et afficher) la façon dont un contenu devenait (ou pas) viral entre différentes générations de bruits. Le résultat de cette distribution d’échanges sur les réseaux sociaux est plutôt impressionnant. Et si une passion pour ce sujet surgit, soudainement, on pourra également regarder la vidéo (de 7 minutes) mise en ligne par « GeekWire ».
La minute Open Data
Le Tableau de Bord de la RATP élaboré par « Data Publica » surgit un peu comme un rêve éveillé pour ceux, nombreux, qui militent depuis des années pour la libération des données à la Régie autonome des transports parisiens. « Petit geste un peu militant » comme François Bancilhon le rappelle dans les colonnes de « La Tribune » (Pourquoi la RATP rechigne à dévoiler ses secrets), ce tableau de bord va un peu plus loin que les visualisations élaborées en début d’année (par Alexandre Léchenet ou Marie Coussin, pour ne citer qu’eux) à partir du matériel gracieusement mis à disposition par la RATP elle-même.
Outre les données froides classiques sur la topologie du réseau ou liées au trafic, ou une carte (faite avec D3.js elle aussi) du trafic annuel entrant par station à Paris réalisée par Samuel Charron, ce tableau de bord fournit des informations inédites sur les violences, les accidents et les décès, sur les mesures de confort, ou encore de consommation énergétique qui n’étaient pas forcément communiquées de bon gré par le passé. Un premier pas en attendant une libération… plus enthousiaste.
***
Et à défaut d’enthousiasme, peut-être un jour, toutes ces données devront être libérées manu militari. Le trait est un peu forcé, mais pourtant, comme le titre Romain Mazon : l’ouverture des données publiques devient une obligation pour les collectivités locales, comme le prévoit l’article 111 du projet de loi de décentralisation transmis au Conseil d’Etat que s’est procuré « la Gazette des communes ». Il y aura encore des débats, des consultations, des rapports, mais à coup sûr la question de l’Open Data en France est désormais une question de temps et non de volonté politique, comme le dévoilait à demi-mots la feuille de route du Gouvernement présentée fin février. Reste à voir, de la carotte ou du bâton, celui qui aura les faveurs des pouvoirs publics.
Veilleries
Un petit truc sympa passé dans le radar récemment et qui mérite sans doute de figurer ici – même s’il commence un peu à dater :
- Visualizing the major causes of death in the 20th Century du camarade McCandless, énorme (6 mètres sur 2) datavision pondue en 2012 pour une exposition londonienne intitulée « La Mort, un auto-portrait ». Où l’on apprend qu’au 20e siècle, les idéologies (Hitler, Mao, Staline…) ont causé trois fois plus de morts que le cancer du foie, mais trois fois moins de victimes que la variole (données source).