Le mot «données» apparaît dans les statistiques. Il existe de nombreuses classifications différentes des données. Les données peuvent être quantitatif ou qualitatif, discret ou continu. Malgré l'utilisation courante du mot données, il est souvent mal utilisé. Le principal problème lié à l'utilisation de ce terme découle d'un manque de connaissances sur le mot singulier ou pluriel.
Si données est un mot singulier, alors quel est le pluriel de données? Cette question est en fait la mauvaise à poser. En effet, le mot données est déjà pluriel. La vraie question que nous devrions nous poser est: «Quelle est la forme singulière du mot données?» La réponse à cette question est «datum».
Il s'avère que cela se produit pour une raison très intéressante. Pour expliquer pourquoi nous devrons aller un peu plus loin dans le monde des langues mortes.
Un peu de latin
Nous commençons par l'histoire du mot datum. Le mot datum provient du langue latine. Le datum est un nom, et en latin, le terme datum signifie «quelque chose de donné». Ce nom vient de la deuxième déclinaison en latin. Cela signifie que tous les noms de cette forme qui ont une forme singulière se terminant par -um ont une forme plurielle qui se termine par -a. Bien que cela puisse sembler étrange, cela ressemble à une règle courante en anglais. La plupart des noms singuliers sont faits au pluriel en ajoutant un "s", ou peut-être "es", à la fin du mot.
Ce que toute cette grammaire latine signifie, c'est que le pluriel de donnée est donnée. Il est donc correct de parler d'une donnée et de plusieurs données.
Données et données
Bien que certains traitent le mot données comme un nom collectif se référant à une collecte d'informations, la plupart des statistiques écrites reconnaissent l'origine du mot. Une seule information est une donnée, plusieurs sont des données. Du fait que les données sont un mot pluriel, il est correct de parler et d'écrire sur «ces données» plutôt que «ces données». Dans le même esprit, nous dirions que "les données sont... "plutôt que" les données sont... "
Une façon d'esquiver ce problème est de considérer toutes les données comme un ensemble. Ensuite, nous pouvons parler d'un ensemble singulier de données.
Repérer les exemples d'abus
Un bref questionnaire peut en outre aider à déterminer la manière correcte d'utiliser les données de terme. Voici cinq déclarations. Déterminez les deux qui sont incorrects.
- L'ensemble de données a été utilisé par tout le monde dans la classe de statistiques.
- Les données ont été utilisées par tout le monde dans la classe de statistiques.
- Les données ont été utilisées par tout le monde dans la classe de statistiques.
- L'ensemble de données a été utilisé par tout le monde dans la classe de statistiques.
- Les données de l'ensemble ont été utilisées par tous dans la classe de statistiques.
L'instruction n ° 2 ne traite pas les données au pluriel et est donc incorrecte. L'instruction n ° 4 traite incorrectement l'ensemble de mots au pluriel, alors qu'il est singulier. Les autres déclarations sont correctes. L'énoncé n ° 5 est quelque peu délicat car l'ensemble de mots fait partie du préposition "de l'ensemble."
Grammaire et statistiques
Il n'y a pas beaucoup d'endroits où les sujets de grammaire et de statistiques se croisent, mais celui-ci est important. Avec un peu de pratique, il devient facile d'utiliser correctement les mots données et datum.