Une base de données est un ensemble d’informations structurées, semi-structurées ou
non structurées d’un système d’information organisé en vue de faciliter leur exploitation
(interrogation et mise à jour) et gérer leur stockage.
Un système d’information est l’ensemble des moyens (organisation, acteurs,
procédures, systèmes informatiques) nécessaires à la saisie, traitement, mémorisation,
classement, recherche, et diffusion des informations. Il a pour objectif de restituer, aux
différents membres de l’entreprise ou organisme, les informations sous une forme directement
utilisable au moment opportun, afin de faciliter le bon de fonctionnement opérationnel et la
prise de décisions aux différents niveaux.
Pour obtenir une base de données, il faut modéliser une situation réelle et le représenter
par un modèle selon un niveau d’abstraction désiré.
Donnée structurée
Une donnée structurée est une donnée formatée ou représentée selon une structure de
données précise. Vous avez vu dans le cours d’algorithmique et programmation la notion de
structure de données. C’est le type de données le plus ancien ayant l’avantage de faciliter le
contrôle et l’exploitation des données en se basant sur la structure. Par contre sa structure limite
sa flexibilité et son usage à ce qui a été défini.
Comme exemple, on peut citer les fiches d’étudiants, les données d’un point de vente,
les fiches de paie des employés, …
Donnée non structurée
Une donnée non structurée est une donnée sous sa forme brute absolue sans traitement.
Les données non structurées peuvent être tout ce qui n’est pas dans un format ou structure
spécifique. Comme avantage, on peut citer la liberté de spécifier le format selon le besoin ce
qui permet un grand nombre de cas d’utilisation car la finalité des données est adaptable. Par
contre, c’est une donnée difficile à exploiter du fait qu’il faut une expertise en science de
données pour leur préparation et leur analyse.
Comme exemple, on peut citer les fichiers journaux des applications, les publications
sur les réseaux sociaux et leurs commentaires, les discussions des forums ou chats ou emails,
…
Donnée semi-structurée
Une donnée semi-structurée est une donnée non structurée qui comporte des
métadonnées avec certaines caractéristiques. La métadonnée contient des informations sur les
données permettant de mieux les cataloguées, analysées et faire faire des recherches
efficacement par rapport aux données non structurées. Les données semi-structurées sont
présentées comme des données intermédiaires entre les données structurées et non structurées
et bénéficient en partie de leurs avantages.
Comme exemple, on peut citer les fichiers CSV (Comma-Separated Values) contenant
des données séparées par un délimitateur, les fichiers de données avec des balises (html, xml,
…), …