L’éducation aux données pour les phobiques des données : 7 choses que les débutants doivent savoir

By Lydia Hooper, Feb 03, 2022

data literacy blog header
De nos jours, les données font partie de notre vie à tous, quel que soit le secteur dans lequel nous travaillons, la quantité de technologie que nous utilisons et la manière dont nous nous informons sur ce qui se passe dans le monde.

Mais comprenons-nous pleinement ces données ? En outre, savons-nous comment les utiliser au mieux et les partager avec d’autres ?

Dieu merci, les visualisations de données existent. Les visualisations de données aident à traduire les chiffres en informations significatives que vous pouvez utiliser pour prendre des décisions, même si vous êtes encore un peu phobique des données. Et si vous l’êtes, vous n’êtes pas seul. Bien que la maîtrise des données soit une compétence essentielle sur le lieu de travail, la plupart des organisations sont à la traîne, selon Gartner.

Pour être en mesure de créer et, parfois, de comprendre pleinement les visualisations de données, nous devons surmonter nos craintes éventuelles et devenir plus avertis en matière de données. Je ne suis pas statisticienne, loin de là, mais mes connaissances et mes compétences en matière de données me sont très utiles en tant que conceptrice et rédactrice d’informations chez Venngage Infographics. J’ai hâte de partager avec vous quelques notions de base afin que vous puissiez aider votre équipe à accroître ses prises de décision fondées sur les données et, par conséquent, ses performances.

Table des matières :

Qu’est-ce que la maîtrise des données ? Une définition

data literacy definition: reading data, working with data, communicating with data.

 

La maîtrise des données est la capacité de lire des données, de travailler avec des données et de communiquer sur des données en les plaçant dans un contexte approprié.

Il ne s’agit pas seulement de comprendre et de travailler avec des chiffres, ou de savoir calculer. La maîtrise des données comprend la compréhension :

  • Comment évaluer les sources de données et les méthodes de collecte
  • Quelles sont les différentes applications pour un ensemble de données donné ?
  • L’intérêt de travailler avec des données compréhensibles

Relié : Qu’est-ce que la visualisation des données ? (Définition, exemples, meilleures pratiques) 

Pourquoi la maîtrise des données est-elle importante ?

La maîtrise des données est importante car lorsque nous prenons des décisions fondées sur des données, nous pouvons améliorer nos résultats, y compris dans un contexte commercial.

“La culture des données est devenue importante, pour presque tout le monde. Les entreprises ont besoin d’un plus grand nombre de personnes capables d’interpréter les données, d’en tirer des enseignements et de poser les bonnes questions en premier lieu. Ce sont des compétences que tout le monde peut développer, et il existe désormais de nombreuses façons pour les individus de se perfectionner et pour les entreprises de les soutenir, de renforcer leurs capacités et de conduire le changement. En effet, les données elles-mêmes sont claires à ce sujet : La prise de décision basée sur les données améliore nettement les performances des entreprises.”

– Josh Bersin et Marc Zao-Sanders dans Harvard Business Review 

Même si la maîtrise des données devient de plus en plus importante sur le lieu de travail, la plupart des organisations ne disposent pas de ces compétences. Les employés qui maîtrisent les données sont plus susceptibles de dire qu’ils sont très performants. Si vous vous demandez comment vos propres compétences se situent, consultez cette évaluation.

“Jusqu’à récemment, les gens pouvaient facilement ignorer les données dans leur travail quotidien. Les “têtes pensantes” et les “quants” de l’entreprise étaient isolés dans des départements spécialisés, les techniciens s’occupaient des tâches banales, et les responsables pouvaient ignorer les avantages d’une meilleure qualité des données en disant : “Nous nous en sortons très bien. Pourquoi s’en préoccuper ? Mais tout cela est en train de changer. Le résultat principal de mon dernier “scan” de l’espace des données est que la peur a remplacé l’apathie comme ennemi numéro un des données … Vous pouvez devenir un leader crédible et dissiper la peur des données dans votre équipe ainsi que votre propre peur en augmentant vos capacités et en inspirant l’ensemble du département à adopter les données.”

– Thomas C. Redman dans la Harvard Business Review 

De nombreuses personnes cherchent également à visualiser et à communiquer des données (y compris dans des infographies), et la maîtrise des données est essentielle pour bien faire. Par exemple, ce rapport de projection financière comprend des chiffres bruts, des tableaux et des graphiques. Lorsque vous comprenez bien ce que disent les données, vous êtes mieux préparé à mettre en évidence les principaux éléments à retenir pour votre public.

Modern Financial Projection Report Template for Data Literacy

 

Vous avez peut-être commencé à visualiser les données que vous avez recueillies par le biais d’enquêtes et vous voulez maintenant savoir quelles autres données sont disponibles pour étayer les résultats des enquêtes. Ou encore, vous n’avez étudié que les données relatives aux clients actuels et vous voulez maintenant examiner les données qui pourraient vous aider à cibler de nouveaux clients.

Dans ces deux cas et dans bien d’autres, vous aurez besoin de collecter et d’analyser des données, mais vous voudrez probablement aussi les partager avec d’autres. L’outil Chart Maker de Venngage est plus facile à utiliser que la plupart des plateformes d’analyse de données et de BI, de sorte que vous pouvez facilement commencer à visualiser des données tabulaires (données que vous trouvez dans des tableaux).

data literacy

 

Les compétences en matière de littératie des données sont-elles difficiles à acquérir ?

Si elle est si importante, pourquoi est-elle absente sur le lieu de travail ?

L’une des principales raisons est que les dirigeants ne possèdent pas toujours ces compétences eux-mêmes. Le fait que les employés qui maîtrisent les données soient généralement isolés dans les équipes informatiques ou de BI n’aide pas non plus les collègues à partager et à diffuser ce savoir-faire.

Bien sûr, certaines personnes ne se sont pas encore remises de cet horrible cours de mathématiques au lycée. Elles peuvent penser qu’elles sont tout simplement mauvaises en mathématiques.

D’autres peuvent se débrouiller ou même être bons en mathématiques, mais ne veulent pas que leurs erreurs aient des conséquences potentiellement très graves, y compris une perte de réputation.

Tous ces défis sont compréhensibles, et ils peuvent être surmontés. De nombreuses personnes compétentes en matière de données s’efforcent de garder les bases pour les débutants. Mon objectif est donc de vous aider à appréhender lentement certaines bases afin de gagner en compétences et en confiance.

Sept choses que les débutants doivent savoir sur la maîtrise des données

Data Literacy 7 things to know

 

1. L’incertitude est inévitable

Vous vous dites peut-être : “Je croyais que les données concernaient des faits et des chiffres précis.” N’importe quel statisticien vous dira que tout ensemble de données est incomplet, que les statistiques consistent en fait souvent à expliquer des niveaux d’incertitude. Par exemple, nous pouvons être sûrs à 95 % que notre déjeuner d’aujourd’hui a 87 à 91 % de chances d’être super délicieux.

Il est important de garder cela à l’esprit, surtout si nous communiquons des données. Si nous utilisons des éléments visuels, tels que des infographies, pour ce faire, ils risquent de masquer le désordre de la réalité et de faire paraître nos déclarations plus factuelles. Nous pouvons être des communicateurs responsables en comprenant bien les données et, si possible, en expliquant ce que nous ne savons pas encore.

Voir aussi : Comment utiliser la visualisation des données dans vos infographies 

2. Il existe différents types de données

En raison de toutes les incertitudes à pondérer, la collecte de données peut être un processus laborieux et détaillé. Si vous ne les collectez pas vous-même, le plus important est de savoir qu’il existe plusieurs types de données qui peuvent être collectées, et que chacune d’entre elles est adaptée à des situations différentes.

Il y a de fortes chances que lorsque vous pensez à des données, vous pensiez à des données quantitatives, qui sont basées sur des mesures précises et souvent analysées à l’aide de méthodes statistiques.

Les données quantitatives, également appelées données numériques, peuvent se présenter sous différentes formes.

Les données discrètes peuvent être comptées et divisées en groupes plus petits, comme le nombre de personnes dans une foule. Par contre, les données continues existent sur un continuum, par exemple la longueur. Il existe deux types de données continues : les données d’intervalle n’ont pas de véritable “zéro”, comme la température, alors que les données de rapport en ont un, comme le poids. Les données continues sont souvent visualisées dans des graphiques linéaires, comme les rapports de croissance des bénéfices.

Data Literacy Line Chart Template

 

Les données qualitatives, quant à elles, sont descriptives, basées sur des observations qui ne peuvent être mesurées, comme le sexe ou la langue parlée. L’analyse de ce type de données implique souvent une catégorisation en thèmes ou en modèles basés sur des caractéristiques. Les données qualitatives peuvent être qualifiées de données catégorielles.

Il existe également deux types de données catégorielles. Les données nominales peuvent être utilisées pour mesurer des fréquences et des pourcentages et peuvent être affichées dans un diagramme circulaire ou un diagramme à barres. Si les données sont placées dans une sorte d’ordre logique (comme le petit-déjeuner, le déjeuner et le dîner), elles sont considérées comme des données ordinales.

Parfois, des données à la fois qualitatives et quantitatives sont collectées et analysées – c’est ce qu’on appelle les méthodes mixtes. Elles peuvent être mélangées et interprétées de différentes manières, ce qui peut valoir la peine d’être examiné si vous utilisez ce type d’ensemble de données.

Tout cela pour dire que comprendre le type de données sur lequel vous travaillez vous aidera à déterminer la meilleure façon de les communiquer, qu’il s’agisse de choisir l’ordre dans lequel les données doivent être présentées ou le type de graphiques pour les visualiser.

3. Les sources de données sont importantes

Vous avez probablement déjà entendu parler de la plupart, sinon de la totalité, des principales méthodes de collecte de données :

  • Enquêtes ou questionnaires
  • Interviews
  • Observations
  • Expériences

Si les données sont collectées de première main par un chercheur, elles sont considérées comme des données primaires. Les données secondaires sont des données qui ont déjà été collectées et qui ont été mises à la disposition d’autres personnes pour être analysées et partagées.

Il est fort probable que vous utilisiez des données secondaires. Voici donc quelques questions rapides que vous pouvez vous poser pour vous assurer de la qualité des données :

  1. Les données proviennent-elles d’une source réputée ? Cette source partage-t-elle des informations sur la manière dont les données ont été recueillies (ces informations peuvent être incluses dans des documents appelés métadonnées) ? En d’autres termes, sont-elles transparentes ?
  2. Sont-elles ouvertes, restreintes ou non disponibles ? Les données ouvertes ou publiques peuvent être mises à disposition par des entités gouvernementales ou des organisations intergouvernementales, mais certaines données peuvent être restreintes. La protection de la vie privée est une question importante, et de nombreuses lois empêchent le partage de données susceptibles de porter atteinte aux droits ou à la dignité des personnes.
  3. L’ensemble de données est-il adapté à la tâche à accomplir ? L’évaluation de cette question nécessite une réflexion logique et prudente. Par exemple, si je veux dire quelque chose sur les lycéens vivant en Amérique, je dois m’assurer que je peux trouver des données qui représentent les nombreux jeunes vivant dans tous les États. Si ce n’est pas le cas, je devrais préciser que je me réfère aux lycéens de New York, ou plus précisément de Buffalo.
  4. Sont-elles agrégées et/ou normalisées ? Les données agrégées ont été résumées de manière à ce que vous ne puissiez pas identifier les caractéristiques au niveau individuel. Les données de Google Analytics en sont un exemple courant : Vous savez combien de personnes ont visité une page Web spécifique, et vous pouvez même savoir dans quelles villes elles vivent, mais vous ne connaissez pas leurs noms. Les données normalisées nous aident à comparer des chiffres en utilisant une échelle commune. Un exemple courant est celui des taux par habitant : Il est moins significatif de connaître le nombre d’accidents de voiture dans les villes de votre État, et plus significatif de savoir si certaines villes ont un nombre d’accidents étonnamment élevé compte tenu de la taille de leur population.

Une fois que vous avez les données en main, vous êtes prêt à commencer à les utiliser.

data literacy working with data

 

4. Il est important de garder les données organisées

Vous vous dites peut-être que cela fait beaucoup de choses à gérer. La gestion des données n’est pas à prendre à la légère. Elle exige une grande attention aux détails et un suivi rigoureux.

Si vous travaillez avec un ensemble de données relativement petit, comme les réponses à une enquête, vous pouvez probablement utiliser une ou plusieurs feuilles de calcul.

data literacy

 

Si vous téléchargez des ensembles de données publiques, comme les chiffres du recensement, vous risquez d’en avoir plus sur les bras que nécessaire. Certains ensembles de données peuvent même avoir besoin d’être nettoyés, ce qui signifie que les données incorrectes ou en double doivent être supprimées. Parfois, les données doivent même être reformatées. Par exemple, si les chiffres sont lus comme du texte par un logiciel d’analyse, les calculs seront impossibles (le texte et les chiffres sont des types de champs différents).

La gestion des données peut être un travail d’équipe. Si vous ne savez pas comment vous y prendre, cherchez quelqu’un qui puisse vous aider.

5. Les données peuvent souvent raconter beaucoup d’histoires différentes

Lorsque vous analysez des données, vous recherchez généralement des modèles. Ces modèles peuvent raconter une histoire sur ce qui s’est passé, ou ce qui est le plus courant, ou autre chose.

En lien : Comment raconter une histoire avec des données (Guide pour les débutants) 

La plupart des modèles se résument aux relations entre deux ou plusieurs variables, qui sont les “choses” que l’on compte, mesure ou décrit. En voici quelques exemples :

  • Les personnes qui font partie d’une ligue de bowling et celles qui font partie d’une équipe de tennis.
  • Épiceries dans les quartiers à faibles revenus et épiceries dans les quartiers à hauts revenus (remarque : les données géographiques ou liées au lieu comprennent les coordonnées cartographiques en plus d’autres variables).
  • Ce que les gens pensent des chats par rapport à ce qu’ils pensent des chiens

Data literacy dogs vs cats comparison infographic

 

Pour n’importe lequel de ces exemples, vous pouvez découvrir dans les données une variété de modèles. Prenons le dernier exemple cité. En examinant les différents sentiments des gens, vous pourriez découvrir que les personnes âgées préfèrent les chats, ou que les personnes ayant des enfants préfèrent les chiens.

Le fait est que les données seules ne disent rien. Ce n’est que par l’analyse que vous pouvez commencer à découvrir des idées. Et comme il peut y en avoir beaucoup à découvrir, il vaut la peine de continuer à creuser et de ne pas se contenter du premier “aha” sur lequel vous tombez. Prêtez attention aux valeurs aberrantes et aux anomalies – il s’agit de points de données très différents qui peuvent indiquer des erreurs dans les données et/ou des endroits à étudier et à analyser plus en profondeur.  Soyez conscient de vos biais cognitifs et des pièges potentiels lorsque vous effectuez votre analyse.

6. Lorsque vous connaissez votre histoire, partagez-la de manière responsable

Tout d’abord, qu’espérez-vous partager avec les autres ?

  • Descriptions des données, telles que les fréquences ou les pourcentages.
  • Les distributions des données, telles que les fourchettes ou les moyennes.
  • Comparaisons dans les données, telles que les changements dans le temps ou les corrélations entre les variables.

Un autre grand non-dit est d’assimiler corrélation et causalité de quelque manière que ce soit. Il peut y avoir une corrélation entre les ventes de crème glacée et de crème solaire, mais cela ne signifie pas que vendre plus de crème glacée entraînera plus de crème solaire, cela peut signifier que les deux ventes sont le résultat d’une troisième variable qui est la période de l’année.

Une fois que vous savez ce que vous espérez partager, vous pouvez choisir un visuel qui aidera le mieux quelqu’un d’autre à comprendre les principaux éléments à retenir.

7. Vous n’avez pas besoin de tout savoir

Mais vous devez continuer à apprendre ! Il y a beaucoup à apprendre, alors si vous avez besoin d’aide pour établir un ordre de priorité, il est très important de comprendre comment les données peuvent être utilisées pour induire en erreur. Au moins, assurez-vous que ce n’est pas ce que vous faites.

data literacy 5 ways writers use graphs to mislead

 

Félicitations ! Vous êtes maintenant sur la bonne voie pour surmonter vos phobies des données et devenir plus compétent dans ce domaine. J’espère que vous prendrez ce que vous avez appris ici et que vous commencerez à l’appliquer immédiatement.

De la même manière que la meilleure façon d’apprendre à lire était de prendre des livres, la meilleure façon de développer vos connaissances en matière de données est de vous entraîner à travailler avec des données et à les partager avec d’autres. Lorsque vous le ferez, vous vous rendrez rapidement compte de l’immense valeur de cette pratique.

Des modèles simples de visualisation des données pour renforcer votre connaissance des données

Vous pouvez commencer par utiliser quelques modèles simples pour créer des visualisations de données avec Venngage. Voici quelques modèles pour vous aider à démarrer.

data literacy

data literacy

data literacy

 

Vous voulez en voir plus ? Consultez notre bibliothèque de modèles et commencez à créer gratuitement votre propre infographie grâce à nos modèles faciles à éditer et à notre éditeur de type “glisser-déposer”.