bandeau Aconit

Navigation : Histoire  >  Les techniques  >  Système de gestion de bases de données


Google
Pour nous écrire :


© 2002-2020 - Aconit

Système de gestion de bases de données

C.Jullien ACONIT Juin 2021


Depuis les années 2000 et l’avènement des technologies numériques, la plupart d’entre nous utilisons au quotidien d’importantes quantités de données. Selon nos usages, qui évoluent avec le temps, ordinateurs, tablettes, smartphones échangent avec des serveurs ou avec des tiers en « peer to peer » via les réseaux de communications. Grâce aux progrès de la micro-électronique, les systèmes sont de plus en plus performants (volumes, débits,...).

Nous prenons cependant conscience de la criticité de l’information, surtout lorsque celle ci affecte notre vie personnelle ou nos organisations. Le terme "big data" est employé pour exprimer de nouveaux ordres de grandeur concernant la capture, la recherche, le partage, le stockage, l’analyse et la présentation des données. L’exploitation de cette masse considérable représente aujourd’hui un enjeu majeur pour les géants du WEB et pour notre société. En quelques dizaines d’années nous sommes passés de la gestion de lots de fiches à celle de fantastiques quantités de textes, images et sons. Dans ce domaine, les créateurs de logiciel grenoblois ont joué un rôle important.

Fin des années 1960 : naissance du concept de base de données

Dès les premiers calculateurs programmés en langage machine (années 50), des langages évolués se développent : FORTRAN, COBOL, PL1, ALGOL, ... Les données étant alors organisées en fichiers, leur dépendance avec les programmes est forte. Chaque modification de la structure d’un fichier nécessite de recompiler les programmes et de régénérer les applications. Des problèmes de partage, protection, confidentialité et sécurité sont posés.

Des systèmes de gestion de bases de données (SGBD) apparaissent, permettant :

  • la description et l’organisation de structures de données ;
  • la manipulation des données normalisée à partir des programmes ;
  • l’amélioration du partage, de la concurrence d’accès, de la protection et de la sauvegarde.

Les premiers SGBD proposent un simple modèle hiérarchique d’organisation des données, comme des classeurs et des fiches. Ils manquent de souplesse et les accès aux données nécessitent de coûteux parcours d’arbres. D’où l’évolution vers un modèle réseau organisé en collections d’objets (« SETs »), ce qui permet de gérer des dépendances plus complexes. Le SGBD permet alors aux programmes de parcourir les SETS et d’effectuer les opérations utiles sur les enregistrements. Les programmes deviennent dépendants des liens définis par la structure des données.

Ce modèle est considéré comme la première approche commerciale des SGBDs. En 1962 en effet, General Electric, sous l’égide de Charles Bachman, met sur le marché le logiciel Integrated Data Store (IDS). IBM propose Information Management System (IMS) qui reste hiérarchique. Suivront de nombreux produits en SGBD réseaux : DBMS, PICK, TOTAL, SYSTEM 2000, ....
En 1967, le consortium CODASYL publie un standard international normalisant les interfaces des SGBD en deux volets, : le DML (Data Manipulation Language) pour la manipulation des données, et le DDL (Data Definition Language) pour leur définition.

Un projet de recherche Grenoblois : SOCRATE

Au milieu des années 1960, quelques chercheurs grenoblois ont perçu les besoins grandissants de l’informatique de gestion, jusqu’alors réduite aux applications de paie et comptabilité traitées en mécanographie. De premiers contacts existent avec la recherche américaine, confirmant la tendance emmergeante de ce secteur. Il fallut beaucoup de persuasion aux pionniers que furent Jean Kuntzmann, Louis Bolliet et François Peccoud pour faire reconnaître l’informatique de gestion dans le milieu scientifique grenoblois. Gérer des données de gestion n’avait rien « d’avancé »...

Avec le soutien du plan calcul qui favorise quelques formations dans les universités américaines, et grâce à l’implantation d’un important centre scientifique IBM à Grenoble, l’orientation s’affirme. Parmi les premiers travaux de l’ IMAG, un important projet démarre en 1969, soutenu par un financement de l’IRIA, organisme crée 2 ans auparavant dans le cadre du plan calcul. Une equipe formée autour de Jean Raymond Abrial et de quelques thésards (à l’origine Georges Beaume, Robert Morin, Georges Vigliano) travaille à la réalisation d’un prototype de SGBD avancé de type réseau : SOCRATE. Pour programmer des accès et modifications de données sans se soucier de leur implantation, ce prototype intègre un puissant langage de manipulation, capable de se substituer totalement à COBOL. Ce qu’on appelle aujourd’hui un L4G (pour « langage de 4ième génération »). Des administrations locales (CHU, rectorat, sécurité sociale, ...), en phase de démarrage de leur informatique, comprennent l’intérêt, s’impliquent, utilisent et soutiennent cette innovation.

SOCRATE offre de nombreuses facilités : langage de définition, langage de manipulation L4G pour écrire des programmes. Les programmes sont enregistrés dans la base de données grace à une fonction « bibliothécaire » et un outil « macrogénérateur » en facilite l’écriture. Les programmeurs n’ont plus à gérer l’implantation physique des objets (programmes, données) : un algorithme innovant organise un « espace virtuel » quasi infini sur l’espace disque (limité à l’époque !), et cela tout en réduisant au maximum les accès avec un « cache » mémoire. SOCRATE est simple et performant !

En 1970 le prototype est réalisé sur ordinateur IBM 360/67 en langage PL1. Les travaux R&D se poursuivront jusqu’en 1973. Le prototype est utilisée au CHU de Grenoble et au rectorat dans leurs premières activités d’informatisation.
L’année suivante, une convention est signée avec l’atelier informatique de la sécurité sociale (AEIO) pour la production de SOCRATE sur un CII IRIS 50. La réalisation de cette première version industrielle s’opère sur 3 ans, avec une équipe d’ingénieurs de la société ECA Automation pilotée par Stephen Stepanian. La CII porte et commercialise également SOCRATE sur IRIS 50 et IRIS80, mais la fusion dans BULL sera la fin de cette production (remplacé par IDS2, puis ORACLE).
Suite à l’opération ECA/AEIO, la Caisse Régionale d’Assurance Maladie (CRAM) commande en 1974 une version pour IBM 370. L’équipe IRIS50 ECA_Automation se dédouble et la version IBM est produite en 24 mois.
C’est le début d’un longue aventure industrielle ...

Au plan technique, SOCRATE, utilisable en L4G ou depuis des langages de programmation usuels (COBOL, ...), s’avère simple d’utilisation, performant, fiable, portable. Les bases de données sont transférables d’un matériel à l’autre. Les modes de fonctionnement sont multiples : conversationnel, transactionnel, temps-réel,... Que de qualités !

Au début des années 70, les SGBD CODASYL acquièrent leur maturité, donnant lieu à une production majoritairement américaine, avec cependant quelques challengers européens dont SOCRATE, et en Allemagne ADABAS.

Évolution technologique : le modèle relationnel

Cependant, dès la fin des années 60, les recherches américaines convergent pour améliorer le modèle CODASYL. Chez IBM, les travaux théoriques de Edgar Frank Codd débouchent sur une solution cohérente et rigoureuse d’arrangement de données, appuyées sur une théorie algébrique. Le modèle fait l’objet d’une très importante publication scientifique en 1970, « A Relational Model of Data for Large Shared Data Banks" ("Un modèle de données relationnel pour de grandes banques de données partagées"), CACM 13, No. 6, June 1970.
Le modèle relationnel est né. Nous l’utilisons encore à ce jour.

Par la suite, plusieurs développements de SGBD-R vont être mis en œuvre :

  • SYSTEM-R en 1970, au centre de recherches IBM de San Jose : le projet définit un langage, nommé SEQUEL, premier nom du langage normalisé SQL, intégrant des clauses DDL et DML.
  • à l’université de Berkeley, l’équipe de Mickaël Stonebraker produit INGRES en 1973, et définit le langage QUEL
  • MRDS en 1976, sur Honeywell, a priori le premier SGBD-R a avoir été commercialisé

1970-1980 IMAG : Modèle Relationnel et Bases de données distribuées

Plusieurs chercheurs de l’IMAG on effectué des séjours post-doctoraux au Centre de Recherches d’IBM San José en Californie. Ils ont collaboré avec les équipes de E.C. Codd et ont contribué au développement des Bases de Données Relationnelles centralisées et réparties. Par exemple, Claude Delobel a travaillé sur la théorie des dépendances fonctionnelles dans le modèle relationnel. Michel Adiba a travaillé dans le projet R* (version répartie de System-R) et a proposé avec B.Lindsay la notion de cliché ou « snapshots ». Claude Delobel et Michel Adiba ont publié chez Dunod un ouvrage « Bases de Données et Systèmes Relationnels » qui a permis de développer les formations dans ces domaines aussi bien en milieu universitaire que dans le cadre de la formation continue auprès de plusieurs entreprises françaises.

A Grenoble plusieurs projets ont été développés entre 1970 et 1980 pour permettre le partage et la distribution des systèmes d’informations. Ces projets se sont déroulés en collaboration avec l’INRIA et le centre de recherches CII-HB. En utilisant le réseau CYCLADES plusieurs projets de SGBD répartis ont été menés : SIRIUS, POLYPHEME, URANUS. Ces projets ont permis de développer aussi bien des aspects de modélisation que des langages et des systèmes pour intégrer, interroger et manipuler des données hétérogènes réparties. Toute une communauté française s’est ainsi crée sur ces domaines et Grenoble y a pris une part importante.

1970-1980 ECA Automation : Industrialisation de SOCRATE

ECA Automation ouvre une agence à Grenoble. A l’initiative d’un de ses cadres, Robert Morin, (ancien thésard SOCRATE), TELEMECANIQUE établit un partenariat avec Eca Automation pour produire SOCRATE sur le nouveau mini-ordinateur SOLAR de la firme. Ce matériel (mots de 16bits, bus, 32K de mémoire, 5M de disque) cible principalement le marché des applications temps-réel et industrie. Le SGBD se développe aussi sur ces marchés, les applications industrielles, temps-réel ou embarqué manipulant des données de plus en plus complexes et volumineuses. Le développement de SOCRATE sur SOLAR, piloté par Robert Morin, donnera lieu à la création d’une carte électronique pour traiter l’adressage, dispositif accélérateur optionnel dénommé VSS 65. Ce dispositif fera l’objet d’un brevet.

SOCRATE est par ailleurs porté sur matériel SIEMENS, compatible IBM et les ventes démarrent en France. Avec les versions IBM et la percée sur la marché des mini-ordinateurs, SOCRATE devient un produit reconnu et apprécié des professionnels. Cependant moins que son son concurrent allemand ADABAS, qui mise uniquement sur IBM, ... SOCRATE commence malgré tout à faire parler de lui outre Atlantique.

En Europe, la R&D allemande s’intéresse également au relationnel

En 1977, l’université technique de Berlin (TU Berlin) et NIXDORF développent un prototype allemand de SGBD-R : REFLEX.

Les années 1980 : essor des produits SGBD-R américains et normalisation

Dans la foulée de SYSTEM-R et d’INGRES, on assiste à une importante percée commerciale des SGBD-R, promus par des start-ups ( ORACLE, SYBASE - qui deviendra MS/SQL server en 1992-, 4D, ACCESS ...) ou par des industriels établis ( IBM/DB2, DEC/RDB , DBASE, 4D, INFORMIX, ...).

En raison de l’importante clientèle installée IMS, IBM mettra du temps à promouvoir DB2, version industrielle de SYSTEM-R, et ORACLE prendra rapidement le leadership, Une « généalogie » des SGBD-R dénombre une quinzaine de produits. MySQL, version libre bien connue des développeurs WEB, un des principaux SGBD-R actuels, ne verra le jour qu’en 1995, en Allemagne.

Une première normalisation du langage SQL est éditée par l’ANSI en 1986, puis adoptée par l’ISO en 1987 (ISO/CEI 9075:1986 ), de sorte que la programmation d’application s’en trouve pérennisée. L’ISO produira deux révisions majeures en 1989 et 1992

En France, SOCRATE devient CLIO, leader du marché national des SGBD...

Dans les années 1980-1990, SOCRATE doit changer de nom, la marque étant déjà déposée...On l’appellera CLIO, avec un « look » plus industriel, un accompagnement commercial, une structure d’édition et de diffusion professionnelle au sein de SYSECA (ECA-Automation a changé de nom dans son adossement au groupe THOMSON-CSF). Grenoble est centre de développement, des services parisiens animent commerce, formation, marketing. Un club utilisateur se tient chaque année, qui contribue aux décisions d’évolution du produit. On compte un effectif d’environ 80 personnes employées à ces activités entre les deux sites.

CLIO est ré-écrit dans un macro-langage. Une technique de « portage » permet sa diffusion sur de nombreuses machines au delà des IBM et SOLAR : BULL GCOS 6/7/8, DEC-VAX, HP-9000, PC, ... dans des configurations diverses (transactionnel, client-serveur, ...). Plus de 1000 sites France sont équipés de CLIO avec des références prestigieuses : EDF, SNCF, DEFENSE, AEROSPATIALE, COGEMA, banques, assurances, ... CLIO a même un client US à Los Angeles : ORC (opérationnel jusqu’en 2000).

Mais la concurrence du SGBD-R se fait sentir, d’autant qu’ORACLE a ouvert une représentation France. Les clients espèrent une normalisation de CLIO ...et sont encore confiants. Mais comment faire façe aux géants US , d’autant que THOMSON n’a pas la culture de l’édition de logiciels ? Même leader dans son pays, que faire façe à ces concurrents dont les pages de la presse spécialisée vantent les avancées ?
Les dirigeants de CLIO vont miser sur un point fort : le L4G. Le langage permet effectivement de développer des applications à des coûts trés compétitifs vs les agencements L3G+SQL. Le projet MUST de production d’un langage de 5ième génération est lancé. La branche des services informatique (BSI) du groupe Thomson renforce le projet en achetant l’activité américaine NOMAD au groupe Dun&Bradstreet. Une base commerciale est acquise aux USA. Il est envisagé de produire un SQL sur CLIO dans MUST, mais cela n’est pas jugé prioritaire aux yeux des dirigeants ...Un effectif d’environ 40 personnes travaillent sur MUST à Grenoble entre 1986 et 1990.

Une stratégie équivalente sera également adoptée en Allemagne par la société indépendante Software AG, éditrice d’ADABAS. En 1990, SAG produira le L4G NATURAL.

... Et en 1986 à Grenoble, HARDIS produit un L4G pour AS400 et DB2
En 1984, quelques amis fondent la SSII HARDIS, devenue HARDIS Group depuis.

En 1986, ils éditent un AGL et un L4G pour la gamme AS400 d’IBM équipée du SGBD-R DB2. Ce produit nommé ADELIA prendra 65% de parts du marché mondial AS400 et compte encore de nombreux clients à ce jour. Depuis HARDIS s’est diversifié avec succès, et compte parmi les fleurons des entreprises grenobloises.
En 1983, à l’IMAG, un SGBD-R prototype nommé MICROBE ..

Dans le cadre d’un projet national, une équipe IMAG (Gio Toan Nguyen, Fernando Fernadez, Yoon Joon Lee, Lounis Ferrat) crée le prototype MICROBE. Ce SGBD-R, écrit en PASCAL intégre une technologie de traitement de l’arbre relationnel très performante (mode « pipe-line »).

MICROBE sera utilisé au CNET dans le cadre d’un projet européen de CAO microélectronique via une convention.L’équipe du CNET en fera la mise au point et un packaging, le portera en C. Les besoins de la CAO mettent en évidence les lacunes des SGBD-R pour gérer des structures complexes, et conduisent la réflexion à converger

  • soit vers les modèles de SGBD Orienté Objets (SGBD-OO), concepts naissants dans les années 90
  • soit vers une extension du modèle relationnel (concepts de surrogates, BLOBs, ...).
    Les travaux du CNET donnent lieu à publication internationale à la DAC 86 à Las Vegas sur le thème des SGBD avancés pour la CAO.

Les années 1990
Dans les années 1990, les équipes de l’IMAG animées par Michel Adiba et Christine Collet se concentrent sur les concepts de SGBD étendu aux aspects multimédia et CAO (projets TIGRE, FAKIR, STORM...) en liaison avec des industriels (SIG MATRA, base de sons avec l’Institut de la Communication Parlée, applications médicales, .....) ou dans le cadre de projets européens.

La compétence est forte et la contribution à des cas concrets appréciée des industriels. L’IMAG participera activement aux travaux du GIP ALTAÏR pour la production du SGBD O2.

Les SGBD-OO perdent au profit du relationnel étendu

Les SGBD orientés objets (VERSANT, ONTOLOGIC, POET, O2, ...) n’émergent cependant pas, et le SQL-étendu se concrétise par des extensions dans les produits d’ORACLE qui est leader du marché. La norme SQL 99 finira par intégrer ces concepts.

THOMSON/SYSECA se désengage de l’édition du logiciel

En 1990, SYSECA a fortement investi dans le projet MUST qui porte ses premiers résultats mais sans produire de ventes. Pour MUST, après une tentative de SQL générant du CLIO, il est décidé de produire un SQL performant. Avec l’expérience de CLIO, de SYSTEM-R (l’équipe intègre JC.Favre qui a travaillé à San José), des idées issues de MICROBE et de la CAO du CNET, une version industrielle de CLIO SQL voit le jour au bout de 18 mois, grâce à l’enthousiasme d’une équipe de 10 personnes. A la demande du Ministère de L’Industrie, le centre de grenoble est même chargé d’industrialiser le SGBD prototype SABRINA, issu du projet SABRE. Malgré un travail important de re-structuration pour amener ce système à un état industriel, la vente fut un échec.

D’importants changements chez SYSECA en 1991 conduisent à l’arrêt du projet MUST et des efforts commerciaux sur CLIO. A Grenoble, l’effectif passe en quelques mois de 140 à 28, se terminant en plan social. CLIO-SQL sera préservé par l’équipe résiduelle pour satisfaire au besoins des clients, dont la plupart se tourneront vers d’autres produits.

CLIO-SQL sera néanmoins packagé avec une documentation moderne. Nommé ORCHIS-base, il sera utilisé par les clients, notamment au travers des interfaces ODBC de Microsoft développés à Grenoble. Un partenariat avec Business Objets (société rachetée en 2008 par SAP) permettra aux clients de mettre en oeuvre des entrepôts de données dès 1995, prémices du BIG DATA. Jusqu’au départ en retraite du dernier ingénieur support CLIO, vers 2015, la maintenance des produits aura été assurée par l’agence THALES Services de Grenoble. Mais, suite aux décisions de 1991, l’essentiel de l’effectif a été repositionné sur de nouveaux métiers dès les années 95.

Aux USA, Thomson regroupe NOMAD et ALSYS dans TSP (Thomson software products), qui est renommé (AONIX puis ATEGO) suite à des croissances externes, puis finalement revendu en 2014, mettant fin aux activités d’édition de THOMSON/BSI aux USA.

Côté HARDIS à Grenoble, les clients ADELIA se voient dotés d’un ADELIA produisant du C sur plateforme RISC-6000 Unix avec DB2, et d’un atelier VISUAL studio sur PC, offres cohérentes et bien adaptées aux besoins. Le produit fait toujours partie de l’offre HARDIS et satisfait ses clients.

HARDIS a développé ses activités sur d’autres secteurs, mais reste bien ancrée dans le domaine de l’édition avec l’offre de produit logistique REFLEX, leader en Europe. Le groupe est dans une progression régulière depuis son origine, sous maîtrise des créateurs.

En Allemagne, SAG, après avoir intégré les travaux de TU-Berlin et Nixdorf sur le relationnel (parralèle avec Microbe !), produit un SGBD-R nommé ADABAS-D intégré à son offre L5G NATURAL (parallèle avec MUST !). SAG commercialise toujours ADABAS et NATURAL. En SGBD-R, SAG a également produit MAXDB, utilisé par SAP en remplacement de son SGBD interne d’origine. Dans son métier d’éditeur de logiciel, SAG s’est diversifiée sur d’autres segments, notamment dans le domaine de l’intégration WEB et de la gestion des données. SAG reste une des plus grandes sociétés de logiciels au monde, aux tous premiers rangs en RFA.

Avancées côté IMAG ...

L’essor du big data et l’émergence du « data science » ont remis à l’ordre du jour l’exploitation de grosses masses d’informations provenant d’observations du monde « réel ». Christine Collet et son équipe ont revisité les outils scientifiques et technologiques existants pour gérer et exploiter ces masses de données et répondre ainsi à des nouvelles applications ciblées.

Ces travaux se sont inscrits dans le développement de POLYSTORES, intégrant des systèmes SQL 3, NoSQL et NewSQL.Ce projet requiert une forte synergie entre les scientifiques de tous les instituts, établissements et entreprises collectant et exploitant des masses de données. Ceci dans des domaines comme la santé publique, la médecine, le sport, la biologie, la physique, l’astrophysique, l’énergie, la défense, l’environnement, les sciences de l’univers, la cosmologie, les sciences humaines et sociales, etc.
En 2015 Christine .Collet a été chargée par le CNRS de mettre en place un GDR sur le sujet du « big data », MADICS. Une belle reconnaissance de l’expertise grenobloise.

Epilogue

Ainsi se sont écoulées pratiquement 50 ans de « l’école grenobloise des bases de données »
selon les propos de J.Voiron, ancien professeur. 

Grenoble a-t-elle eu les clés du BIG DATA ?
Elle a eu les compétences, la maîtrise industrielle en édition de SGBD.
Grâce à des alliances industrielles en Europe, les grenoblois auraient sans doute pu continuer à être un acteur du domaine de l’édition, L’abandon du projet UNIDATA par les français a certainement été un moment clé où les européens ont perdu l’occasion de conserver la maîtrise sur leur marché. Le seul SGBD industrialisé en France à une échelle importante aura été SOCRATE/CLIO à Grenoble. Malheureusement, contrairement à SAG en RFA, la culture de l’actionnaire n’était pas l’édition de logiciel.
Heureusement, les chercheurs grenoblois ont su conserver un haut potentiel en la matière, vivier d’idées novatrices face aux nouveaux enjeux de la gestion de l’information. Cette école fait référence.

L’un des acteurs reconnus des SGBDs français formule (en oubliant CLIO et MICROBE)....

«  Dans le domaine des bases de données, comme dans beaucoup d’autres, la France a gâché beaucoup de chances, mais reste encore très compétitive, au moins en compétences sinon en produits. En fait, depuis septembre 1997, l’industrie française ne possède plus de SGBD important. Auparavant, elle avait possédé SOCRATE, IDS II,SABRE (un SGBD important pour l’auteur), et enfin O2. À vrai dire, le seul bien vendu fut IDS.II, un produit issu des États-Unis. Mais enfin, nous avions la maîtrise de la technologie... »
Georges Gardarin Bases de données 2003 Eyrolles...

On peut néanmoins considérer que rien n’est irréversible et retenir la devise de JR.Abrial (cf sa page Linkedin), l’un des « pères » de SOCRATE : "If it is important to you, you will find a way. If not, you will find an excuse. »

Première publication :
Mise en ligne le lundi 14 juin 2021

Article écrit par :
Christian Jullien , René Gindre , Xavier Hiron


Première publication :
Mise en ligne le lundi 14 juin 2021

Article écrit par :
Christian Jullien , René Gindre , Xavier Hiron


Première publication :
Mise en ligne le lundi 14 juin 2021

Article écrit par :
Christian Jullien , René Gindre , Xavier Hiron



Haut de page | Accueil | Plan du site | Mentions légales | Administration ?