Une base de données est un ensemble d’informations structurées, semi-structurées ou non structurées d’un système d’information organisé en vue de faciliter leur exploitation (interrogation et mise à jour) et gérer leur stockage.

Un système d’information est l’ensemble des moyens (organisation, acteurs, procédures, systèmes informatiques) nécessaires à la saisie, traitement, mémorisation, classement, recherche, et diffusion des informations. Il a pour objectif de restituer, aux différents membres de l’entreprise ou organisme, les informations sous une forme directement utilisable au moment opportun, afin de faciliter le bon de fonctionnement opérationnel et la prise de décisions aux différents niveaux.

Pour obtenir une base de données, il faut modéliser une situation réelle et le représenter par un modèle selon un niveau d’abstraction désiré.

Donnée structurée


Une donnée structurée est une donnée formatée ou représentée selon une structure de données précise. Vous avez vu dans le cours d’algorithmique et programmation la notion de structure de données. C’est le type de données le plus ancien ayant l’avantage de faciliter le contrôle et l’exploitation des données en se basant sur la structure. Par contre sa structure limite sa flexibilité et son usage à ce qui a été défini. Comme exemple, on peut citer les fiches d’étudiants, les données d’un point de vente, les fiches de paie des employés, …

Donnée non structurée


Une donnée non structurée est une donnée sous sa forme brute absolue sans traitement. Les données non structurées peuvent être tout ce qui n’est pas dans un format ou structure spécifique. Comme avantage, on peut citer la liberté de spécifier le format selon le besoin ce qui permet un grand nombre de cas d’utilisation car la finalité des données est adaptable. Par contre, c’est une donnée difficile à exploiter du fait qu’il faut une expertise en science de données pour leur préparation et leur analyse. Comme exemple, on peut citer les fichiers journaux des applications, les publications sur les réseaux sociaux et leurs commentaires, les discussions des forums ou chats ou emails, …

Donnée semi-structurée


Une donnée semi-structurée est une donnée non structurée qui comporte des métadonnées avec certaines caractéristiques. La métadonnée contient des informations sur les données permettant de mieux les cataloguées, analysées et faire faire des recherches efficacement par rapport aux données non structurées. Les données semi-structurées sont présentées comme des données intermédiaires entre les données structurées et non structurées et bénéficient en partie de leurs avantages.
Comme exemple, on peut citer les fichiers CSV (Comma-Separated Values) contenant des données séparées par un délimitateur, les fichiers de données avec des balises (html, xml, …), …