Cobol

Cobol
Image illustrative de l’article Cobol

Date de première version 1959
Paradigme Impératif, procédural, structuré
Auteur Grace Hopper
Développeurs Short Range Committee
Dernière version (2023-01)
Normes ISO/IEC 1989:2023
Influencé par FLOW-MATIC, COMTRAN (en)
Extension de fichier cbl, cob et cpyVoir et modifier les données sur Wikidata

Cobol est un langage de programmation créé en 1959. Son nom est l’acronyme de COmmon Business Oriented Language qui révèle sa vocation originelle : être un langage commun pour la programmation d'applications de gestion. Aujourd'hui, il est surtout utilisé dans les secteurs de la banque, des assurances, des grandes administrations[2].

Histoire et spécifications

Le Cobol a initialement été créé en 1959 (officiellement le 18 septembre 1959)[3] par le Short Range Committee, un des trois comités proposés à une rencontre au Pentagone en mai 1959 organisée par Charles Phillips du département de la défense des États-Unis. Le comité a été formé pour recommander une approche à court terme pour un langage commun, indépendant des constructeurs, pour les applications de gestion de l'administration américaine. Il était constitué de membres représentant six constructeurs d'ordinateurs et trois agences gouvernementales. Les six constructeurs informatiques étaient Burroughs Corporation, IBM, Minneapolis-Honeywell, RCA, Sperry Rand, et Sylvania Electric Products. Les trois agences du gouvernement étaient le US Air Force, le David Taylor Model Basin, et l’Institut national des standards. Ce comité était présidé par un membre du NBS. Des comités à moyen et long terme ont également été proposés au Pentagone. En revanche, même si le premier a été fondé, il n'a jamais été opérationnel, et le dernier n'a jamais été fondé. En fin de compte, un sous-comité du Short Range Committee a été formé avec six membres :

Ce sous-comité a terminé les spécifications de Cobol fin 1959. Elles étaient largement inspirées par le langage FLOW-MATIC inventé par Grace Hopper, surnommée « la mère du langage Cobol », et par le langage COMTRAN d'IBM, inventé par Bob Bemer.

Ce langage ayant été conçu aux débuts de l'informatique, sa relative complexité rebute nombre de programmeurs de notre époque, ce qui lui a valu deux interprétations ironiques de son acronyme : Compiles Only Because Of Luck (fonctionne uniquement par chance) et Completely Obsolete Business Oriented Language (Langage orienté gestion complètement obsolète)[4].

Histoire des standards Cobol

Ces spécifications furent approuvées par le comité complet, puis par le comité exécutif (CODASYL) en janvier 1960 et envoyées au bureau d'impression du gouvernement qui les édita et imprima en les nommant Cobol 60. Le langage fut développé en moins de six mois de travail, et il est toujours utilisé aujourd'hui, après plusieurs révisions standardisées par l'ANSI et l'ISO, dont

Traits principaux

La totalité des variables et des structures de données utilisées sont définies au début du programme, avant la division procédurale contenant les instructions. La manière dont sont définies les variables, c'est-à-dire les espaces de stockage temporaire, est très particulière. C'est une structure arborescente définie par une suite de lignes de code. Chaque ligne commence par un nombre qui définit le niveau d'imbrication du champ ou du groupe de variables.

Par exemple :

      01 NomPrenom.
        05 Prenom PIC X(20).
        05 Nom    PIC X(20).

qui définit une structure NomPrenom contenant les champs Prenom et Nom sur 20 caractères.

Autre exemple :

       01 CodePostal.
         02 Depart  PIC 99.
         02 Commune PIC 999.

qui définit un code postal de France. Lorsqu'une valeur est assignée à CodePostal, cette définition permet l'assignation automatique du code de département à la variable Depart sans aucune autre opération de l'utilisateur.

Comme défini dans la spécification originale, Cobol possédait déjà les nombreuses fonctionnalités qui ont fait son succès : d'excellentes capacités d'auto-documentation, des méthodes pratiques de gestion des fichiers et des types de données variés, dont le format est précisé par la clause PICTURE.

La gestion des décimales en Cobol (nombres en virgule fixe), et la maîtrise des arrondis et des dépassements, permettent d'éviter les nombreux problèmes qui arriveraient en utilisant des nombres à virgule flottante pour les calculs financiers. Ce sont ses capacités arithmétiques en virgule fixe, notamment pour les traitements par lots où il présente d'excellentes performances, qui ont rendu le Cobol particulièrement populaire pour les traitements comptables.

Il intègre également un générateur de rapports, défini de la même manière que les autres structures de données. Sont intégrées des fonctions de tri, de fusion et de communication. Un module optionnel permettait également une forme de communication inter-processus par file de messages.

Le parti-pris initial de définir un langage de programmation proche du langage naturel (comme pour FLOW-MATIC) devait faciliter, sinon la programmation, du moins l'audit des programmes Cobol par des gestionnaires non-informaticiens. Ce choix a eu pour conséquence une syntaxe complexe (le langage naturel n'est pas simple), avec de nombreux mots réservés, et de nombreuses options (les opérations de gestion ne sont pas simples non plus) qui valent à Cobol une réputation de verbosité, qui n'est pas forcément fondée sur des faits.

Par exemple en Cobol l'instruction

       ADD montant TO total-jour total-mois total-annee.

s'exprimerait, en C ou autres langages dérivés, par

total_jour += montant; 
total_mois += montant; 
total_annee += montant;

Comme d'autres langages de l'époque (par exemple Fortran II[réf. nécessaire]), Cobol offrait la possibilité de modifier du code pendant l'exécution à l'aide de la fameuse instruction ALTER X TO PROCEED TO Y (altérer X pour aller vers Y). Cette possibilité dangereuse, qui transposait une technique courante de la programmation en langage machine, a été éliminée des spécifications du langage. Rendant possible la modification à la volée de l'exécution d'un programme, cette commande permettait d'outrepasser des ordres GO TO, complexifiant ainsi la maintenance.

Les versions successives du standard ont modernisé le langage, par exemple en ajoutant des structures de contrôle améliorées et le support de la programmation objet, tout en préservant au maximum la compatibilité avec les versions précédentes, de façon à éviter d'avoir à modifier l'énorme stock de programmes Cobol en service.

Le poids de l'héritage

Le langage Cobol était de loin le langage le plus employé des années 1960 à 1980, et reste très utilisé dans de grandes entreprises, notamment dans les institutions financières qui disposent (et développent encore) de nombreux logiciels et applications en Cobol[16].

Écrites à une époque où les octets coûtaient cher, et où l'an 2000 était encore fort loin, ces applications ont fait craindre le fameux bogue de l'an 2000. Souvent, en effet, par mesure d'économie de mémoire, les services informatiques et programmeurs avaient codé les années et les tests d'année sur deux chiffres plutôt que sur quatre. De sorte que la préparation du passage à l'an 2000 coûta finalement d'énormes moyens humains, matériels et financiers. Pourtant, les banques, assurances et autres institutions financières géraient depuis très longtemps des dossiers sur dix, vingt voire trente ans (prêts, par exemple), mais sans systématiquement prendre en compte dans les tests de date la notion de siècle.

En 2001, le Gartner Group estimait que 75 % des données du monde des affaires étaient traitées par des programmes en Cobol et que 15 % des nouveaux programmes développés le seraient dans ce langage en 2005[17]. Cependant, en juillet 2017, le Cobol est 25e dans l'Index TIOBE, qui mesure les langages de programmation selon leur popularité, avec une note de 1,135 %[18]. Des enquêtes publiées par Micro Focus permettent d'appréhender l'évolution de l'utilisation du langage dans les milieux d'affaires : en 1999, elles révélaient que 87 % des entreprises de ce milieu faisaient un usage de COBOL ; en 2003, le pourcentage est descendu à 56 % ; cependant une autre série d'enquêtes aux caractéristiques similaires montrent que cet usage aurait de nouveau augmenté au cours de la décennie suivante (62 % en 2006, 64 % en 2012)[19].

Structure d'un programme en Cobol

Un programme comporte quatre divisions[19]. La norme Cobol-85 ne rend obligatoire que la première.

  •        IDENTIFICATION DIVISION.
    
    Contient des informations générales sur le programme (dont le nom).
  •        ENVIRONMENT DIVISION.
    
    Contient des informations sur l'environnement (matériel et logiciel) dans lequel le programme s'exécute.
  •        DATA DIVISION.
    
    Contient les descriptions (définitions) de données (variables, fichiers, paramètres et parfois description d'écran).
  •        PROCEDURE DIVISION.
    
    Contient les instructions du programme.

Chaque division est composée de sections, formées de paragraphes composés de phrases qui peuvent être des phrases impératives ou des clauses (chacune étant formée d'un verbe suivi d'une ou plusieurs opérandes)[20]. Chaque phrase doit être terminée par un point[21].

Les six premières colonnes de chaque ligne de programme sont considérées comme une zone de commentaire, servant autrefois à numéroter les cartes perforées (en cas de chute du paquet, il suffisait de les passer sur une trieuse pour reconstituer la version correcte du programme).

La septième colonne contient un caractère de contrôle : espace pour les lignes actives, étoile pour les commentaires, tiret comme caractère de continuation, la lettre D[22] qui, utilisée avec [WITH DEBUGGING MODE], ajoute la ligne lors de l'exécution.

La huitième colonne est le début des titres de paragraphes.

La douzième colonne est le début des instructions.

Certains compilateurs Cobol modernes permettent l'emploi d'un format libre qui n'impose plus le colonnage.

Exemple de programme (Hello world !)

Écrit dans le style typique des programmes sur cartes perforées (années 1960-70), avec lignes numérotées

000100 IDENTIFICATION DIVISION.
000200 PROGRAM-ID. HELLO_WORLD.
000300 DATE-WRITTEN. 21/05/05 19:04.
000400 AUTHOR UNKNOWN.
000500 ENVIRONMENT DIVISION.
000600 CONFIGURATION SECTION.
000700 SOURCE-COMPUTER. RM-COBOL.
000800 OBJECT-COMPUTER. RM-COBOL.
000900
001000 DATA DIVISION.
001100 FILE SECTION.
001200
100000 PROCEDURE DIVISION.
100100
100200 DEBUT.
100300     DISPLAY " " LINE 1 POSITION 1 ERASE EOS.
100400     DISPLAY "Hello world!" LINE 15 POSITION 10.
100500     STOP RUN.

Note : ERASE EOS signifie « 'Erase End Of Screen' » La commande ligne 100300 a donc pour effet d'effacer l'écran.

Exemple en format libre

Autre version du même exemple en Cobol-85 format libre :

Identification division. 
Program-id. Hello.
Procedure division.
Display "Hello world!" line 15 position 10.
Stop run.

Return codes à l'exécution

Return code 203 : vérifier l'emplacement de l'ordre d'ouverture du fichier.

Limitations et critiques de Cobol

Cobol a été développé à la marge de la communauté scientifique et informatique, et a fait l'objet de critiques sévères dans les rangs de celle-ci[23],[24],[25]. Le célèbre mathématicien et informaticien Edsger Dijkstra a ainsi déclaré en 1975 : « L'utilisation de COBOL mutile l'esprit ; l'enseigner devrait, par conséquent, être considéré comme un délit pénal » (« The use of COBOL cripples the mind; its teaching should, therefore, be regarded as a criminal offence. »)[26],[27],[19].

La présence de très nombreux mot-clés ou mots réservés, entre environ 300 et plus de 1000 selon les implémentations[28],[29] (contre une trentaine en langage C, par exemple), a été critiquée pour son manque de praticité et les difficultés qu'elle pouvait poser à l'apprentissage du langage[19]. Un certain nombre sont de simple variantes formelles : abréviations (par exemple pic pour picture), ou mots visant à rendre plus naturelle la formulation de phrases qui se veulent proches de la langue anglaise (zero et ses variantes plurielles zeros / zeroes, time / times, etc.). De même, certains mots-clés sont facultatifs et sans valeur dans certains contextes[30].

Cobol fut élaboré avec l'idée d'être un langage commun et hautement portable. Toutefois, en 2001, on en recensait environ 300 dialectes différents, ce qui est source de problèmes d'intercompatibilité[31].

Cobol a souvent été critiqué pour sa grande verbosité[19]. Il fut conçu à l'origine dans l'idée de produire un code auto-documenté (écrit de sorte à limiter la nécessité de commentaires) facile à apprendre, maintenir et utiliser par des non-spécialistes[32],[33],[34],[35],[36],[37],[38]. Ceci a en réalité conduit à produire des quantités de code peu compréhensible, et certains changements introduits notamment dans la version Cobol-85 ont visé à limiter ces écueils[36].

Un autre problème est posé par le manque croissant de programmeurs formés en Cobol, avec les départs en retraite, Cobol n'étant pratiquement plus enseigné dans les milieux académiques[19]. Pour y faire face, des migrations vers d'autres systèmes, en particulier Java, ont été effectuées ou envisagées, donnant parfois lieu à de grandes difficultés ou à des renoncements[39],[19].

Annexes

Sur les autres projets Wikimedia :

Bibliographie

Articles connexes

  • Pacbase et TELON sont des AGL qui génèrent du Cobol.
  • CODASYL Conference On DAta SYstems Language

Liens externes

Références

  1. « https://www.iso.org/standard/74527.html »
  2. http://www.evoliris.be/fr/content/lh%C3%A9ritage-cobol-un-d%C3%A9fi-pour-la-formation-continue
  3. (en) www.microfocus.com
  4. Basé sur : J.E. Sammet. « The Early History of Cobol. », dans ACM SIGPLAN Notices, volume 13, numéro 8 (août 1978) Numéro spécial : History of programming languages conference, pp. 121-161, 1978. Également publié dans History of Programming Languages, rk: ACM Monograph Series, 1981.
  5. L'utilisation traditionnelle du point à cet effet, inadaptée et peu lisible, est source de nombreuses erreurs de programmation.
  6. Coughlan 2014, p. 74
  7. ISO/IEC JTC 1/SC 22/WG 4 2014, p. 899.
  8. McCracken et Golden 1988, § 8.4.
  9. Coughlan 2014, p. 4
  10. Encyclopædia Universalis, « COBOL », sur Encyclopædia Universalis (consulté le )
  11. ISO/IEC JTC 1/SC 22/WG 4 2001, Annexe F.
  12. Klein 2010, p. 21.
  13. Coughlan 2014, p. 4, 13
  14. Coughlan 2014, p. 523-531
  15. (en) Data Types in Managed COBOL, microfocus.com.
  16. « Les banques restent fidèles à Cobol, plus performant que Java » Le Monde Informatique
  17. (en) William M. Ulrich, « Remember Cobol? If You Don't, Get Reacquainted », Computerworld, vol. 35, no 21,‎ , p. 30 (ISSN 0010-4841, lire en ligne, consulté le )
  18. Juillet 2017, TIOBE Index
  19. a b c d e f et g (en) Charles Kiefer, « COBOL as a Modern Language », University of North Georgia.
  20. Coughlan 2014, p. 23
  21. Coughlan 2014, p. 22
  22. (en-US) « SOURCE-COMPUTER paragraph », sur www.ibm.com, (consulté le )
  23. Sammet 1978b, p. 255.
  24. Shneiderman 1985, p. 348–349.
  25. Bemer 1971, p. 133.
  26. Coughlan 2014, p. 1
  27. (en) Edsger Dijkstra, How do we tell truths that might hurt?, Site de l'Université du Texas à Austin (www.cs.utexas.edu), Département de sciences informatiques.
  28. ISO/IEC JTC 1/SC 22/WG 4 2014, § 8.9.
  29. « Reserved Words Table », sur Micro Focus Visual COBOL 2.2 COBOL Language Reference, Micro Focus (consulté le )
  30. C'est par exemple le cas des mots by, of, usage: l'instruction sort list on ascending key elem, qui range dans une liste le champ list par valeur croissante des éléments elem, peut tout aussi bien s'écrire sort list ascending elem. De même 01 indx usage index., pour la déclaration d'une variable indx de type index peut s'écrire simplement 01 indx index.. times est facultatif lorsqu'il sert à définir le nombre d'éléments d'un champ d'une table (pic x occurs 100 times est équivalent à pic x occurs 100), mais obligatoire lorsqu'il est utilisé pour exécuter un certain nombre de fois un paragraphe (perform 100 times). of est facultatif dans une expression comme length of function trim(s) (qui donne la longueur d'une chaîne de caractères privée des espaces situés aux extrémités. A noter encore que le elemnt of liste (qui désigne l'élément elemnt du conteneur liste) est équivalent à elemnt, si dans le contexte d'éxécution elemnt ne peut faire référence à aucune autre variable
  31. Ralf Lämmel et Chris Verhoef, « Cracking the 500-language problem », IEEE Software, vol. 18, no 6,‎ november–december 2001, p. 79 (DOI 10.1109/52.965809, hdl 1871/9853, lire en ligne [archive du ])
  32. Brown 1976, p. 53.
  33. CODASYL 1969, § II.1.1.
  34. Shneiderman 1985, p. 350.
  35. Sammet 1961, p. 381.
  36. a et b Conner 1984, p. ID/10.
  37. Marcotty 1978a, p. 263.
  38. Coughlan 2014, p. 11
  39. Coughlan 2014, p. 6-7, 13