En mathématiques, la longueur d'une démonstration dépend du langage (naturel ou formel) dans lequel elle est rédigée, ainsi que des résultats préliminaires sur lesquels elle s'appuie. Des résultats inattendus de la théorie de la démonstration, comme le théorème d'accélération de Gödel, montrent que des énoncés simples peuvent avoir des démonstrations très longues, et qui dépendent considérablement du système d'axiomes choisis ; si les mathématiciens ont une préférence pour les « démonstrations élégantes » (qui sont souvent les plus courtes possibles), dans la seconde moitié du XXe siècle, certaines résultats importants ont néanmoins fait l'objet de démonstrations, parfois assistées par ordinateur, d'une longueur exceptionnelle.
Longueur des démonstrations
La rédaction des démonstrations mathématiques est nécessairement un compromis entre une rigueur parfaite (et le plus souvent inaccessible), mais illisible pour un lecteur humain, car se perdant dans trop de détails, et un style trop allusif, comportant des lacunes de raisonnement qui peuvent aller jusqu'à mettre en péril la justesse des résultats[N 1]. Toutefois, sans sacrifier à la rigueur, les mathématiciens contemporains attachent une grande importance à ce qu'ils appellent l'élégance des démonstrations, qui se traduit souvent par la recherche de preuves courtes[N 2].
La recherche de la démonstration la plus courte (qui, contrairement par exemple à celle du programme le plus court exécutant une tâche donnée, est théoriquement toujours faisable pour un théorème démontré[N 3]) s'avère en pratique d'une difficulté redoutable ; avec un critère légèrement différent, Paul Erdős a expliqué que ces démonstrations étaient « celles qui figuraient dans le livre de mathématiques de Dieu »[1]. Le domaine de la complexité des preuves établit des résultats sur les tailles minimales des démonstrations selon divers systèmes de preuves[2].
La conséquence de cette quête de la perfection est la diminution de la longueur de certaines démonstrations (souvent liée à l'apparition de résultats ou de méthodes plus puissants et plus généraux) ; cependant, la longueur moyenne des démonstrations a tendance à augmenter avec le temps, et si, par exemple, un article de théorie des groupes d'une vingtaine de pages était considéré comme long au début du XXe siècle, des articles de plusieurs centaines de pages ont été publiés dans le cadre de l'étude des groupes finis à partir de 1960 ; d'ailleurs, en 2014, la plus longue démonstration recensée, mesurée par le nombre de pages publiées dans des revues mathématiques, est la classification des groupes finis simples, avec plus de dix mille pages. Toutefois, plusieurs démonstrations dépasseraient de loin ce record si les détails des calculs informatiques les justifiant étaient intégralement publiés ; les résultats de logique mathématique exposés ci-dessous amènent également à relativiser cette mesure.
Analyse de la longueur des démonstrations en logique mathématique
L'idée de l'utilisation d'un langage formel pour la rédaction de démonstrations mathématiques nait, à la fin du XIXe siècle, des besoins de la logique mathématique, et en particulier du désir d'automatiser les raisonnements ; on a souvent fait remarquer l'espace démesuré que prennent dans ces systèmes les démonstrations les plus simples, par exemple le fait qu'il faut plus de 300 pages à Russell et Whitehead pour démontrer rigoureusement que 1+1=2 dans les Principia Mathematica[N 4], ou le fait que l'écriture développée (sans abréviations) du nombre 1 dans le système de Nicolas Bourbaki demanderait des milliards de symboles[3]. Cependant, en utilisant un système convenable d'abréviations, il est possible de formaliser complètement des textes mathématiques non triviaux, ce qui permet par exemple à des logiciels de vérification de preuves tels que Coq de contrôler rigoureusement leur exactitude[4],[N 5].
En 1936, Kurt Gödel, en adaptant sa démonstration du premier théorème d'incomplétude, a construit des exemples explicites d'assertions relativement courtes, démontrables dans un système formel donné, mais dont la plus courte démonstration dans ce système est absurdement longue[5]. Ainsi, l'affirmation :
« Cette affirmation ne peut être prouvée à l'aide des axiomes de Peano (seuls) en moins d'un gogolplex de symboles »
(ou plus précisément, l'affirmation G qui code, au moyen d'un code de Gödel convenable, que G n'est pas démontrable en moins de N symboles) est effectivement vraie, et même démontrable dans PA (l'arithmétique de Peano) ; de plus, si PA est non-contradictoire, la démonstration possède nécessairement plus de N symboles. En revanche, il suffit d'adjoindre aux axiomes de Peano l'affirmation que ceux-ci sont non contradictoires (plus techniquement, l'axiome cohPA, lequel, d'après le second théorème d'incomplétude, ne peut être démontré dans PA), pour pouvoir démontrer G en peu de symboles.
Dans le même article, Gödel montrait également que la longueur (en fonction de n) des plus courtes démonstrations de certains théorèmes de longueur n croissait plus vite que toute fonction calculable de n, à l'aide d'un raisonnement très simple[N 6] ; une analyse plus précise de ce résultat, utilisant la fonction du castor affairé, a été donnée par Gustavo Lacerda en 2014[7].
Démonstrations courtes
Certaines démonstrations importantes de l'histoire des mathématiques tiennent en quelques dizaines de caractères, et les articles dans lesquels elles ont été publiées en une dizaine de lignes[8],[N 7]. Notamment :
la conjecture d'Euler, énoncée en 1772, n'a été réfutée qu'en 1966[9], la démonstration se résumant à l'énoncé d'un contre-exemple[N 8] : 275 + 845 + 1105 + 1335 = 1445 ;
la conjecture de Simpson concernant les systèmes couvrants, énoncée en 1987[10], a de même été réfutée en 1989[11] par le simple énoncé : D = {6, 15, 35, 14, 210 (140)}.
Ces deux démonstrations sont considérées comme complètes parce que l'égalité énoncée peut être vérifiée par un calcul arithmétique élémentaire. Elles diffèrent cependant en ce que la première peut être vérifiée très rapidement (en quelques secondes avec une calculette) alors que la seconde requiert qu'on comprenne la conjecture et implique un calcul extrêmement long, quoique élémentaire[8].
Démonstrations longues
La liste suivante (non exhaustive) est presque entièrement constituée de publications, faites après 1950, de résultats jugés importants par la communauté mathématique (et ayant souvent reçu des récompenses prestigieuses), dont la longueur inhabituelle a également fait l'objet de commentaires, en particulier concernant la difficulté de leur vérification. Dans plusieurs cas récents, comme les différents résultats liés à la classification des groupes finis simples, la démonstration proprement dite s'accompagne de calculs informatiques (voir la section suivante) qui, s'ils étaient intégralement publiés, augmenteraient, parfois énormément, les longueurs mentionnées ici.
1890 : La classification par Wilhelm Killing des algèbres de Lie simples (y compris sa découverte des algèbres exceptionnelles), occupe 180 pages en 4 articles[14].
1963 : La démonstration du théorème de l'ordre impair par Feit et Thompson prend 255 pages[17] (mais a été substantiellement simplifiée depuis par Gonthier et son équipe pour pouvoir mener à bien leur démonstration certifiée par ordinateur[18]) ; à cette époque, 25 pages est encore considéré comme long pour un article de théorie des groupes[réf. souhaitée].
1964 : Heisuke Hironaka démontre en 216 pages que toutes les singularités des variétés algébriques (de caractéristique nulle) sont résolubles(en) (cette démonstration a été simplifiée depuis jusqu'à une vingtaine de pages)[19].
1966 : La démonstration par Abhyankar du même résultat pour les variétés de dimension 3 et de caractéristique > 6 est répartie en plusieurs articles, couvrant environ 500 pages[20] (en 2009, Cutkosky la simplifie pour la ramener à 40 pages[21]).
2003 : Les démonstrations de Grigori Perelman de la conjecture de Poincaré et de la conjecture de géométrisation ne sont pas très longues, mais ne sont que des esquisses ; des démonstrations complètes, publiées par la suite par d'autres mathématiciens, prennent plusieurs centaines de pages[N 11].
2004 : La classification des groupes quasi-fins(en) par Michael Aschbacher et Stephen Smith prend 1 221 pages ; c'est l'un des plus longs articles jamais écrit ; un second article presque aussi long démontre de nombreux théorèmes de structure à leur sujet[38],[39]. Ces deux articles veulent mettre un point final à la classification des groupes finis simples.
2004 : Classification des groupes finis simples. La démonstration de ce théorème (et en particulier la détermination de la liste des 26 groupes sporadiques) était censée être achevée en 1983 ; cette démonstration était à l'époque dispersée dans plusieurs centaines d'articles de journaux, rendant difficile d'en estimer la longueur totale, sans doute comprise entre dix et vingt mille pages[40]. Cependant, la vérification de cet ensemble, presque humainement impossible, a amené à en réécrire une partie sous forme de théorèmes plus puissants, en particulier ceux de Michael Aschbacher mentionnés précédemment.
Il n'y a pas vraiment de séparation nette entre calculs informatiques et démonstrations ; en un certain sens, tout calcul est d'ailleurs la démonstration d'un théorème : celui affirmant que le résultat de ce calcul est bien la valeur énoncée[42]. Certaines des longues démonstrations mentionnées précédemment, comme celles du théorème des quatre couleurs ou de la conjecture de Kepler, utilisent de nombreuses pages de raisonnements mathématiques combinés à de longs calculs. Dans cette section-ci, les démonstrations proprement dites sont courtes, voire triviales, et les calculs sont, d'un point de vue mathématique, de pure routine (même si des techniques informatiques sophistiquées, comme le calcul distribué, ont parfois été utilisées pour les exécuter). Les quelques exemples typiques qui suivent sont souvent les derniers résultats (en 2022) d'une série de calculs analogues moins poussés, ayant parfois (comme pour celui des décimales de π) commencé dès l'aube de l'informatique[N 14].
Plusieurs démonstrations de l'existence de certains groupes sporadiques, comme le groupe de Lyons, se sont d'abord appuyées sur des calculs mettant en jeu de grandes matrices ou des permutations de milliards de symboles[43]. Cependant, dans la plupart des cas, par exemple pour le groupe Bébé Monstre, ces calculs furent par la suite remplacés par des démonstrations plus courtes et plus conceptuelles[44].
2012 : le calcul de nombres de Ramsey (et même simplement de bornes assez étroites de ces nombres) demande la manipulation d'un nombre énorme de configurations[N 15] ; ainsi, en 2012, Hiroshi Fujita a démontré que R(4,8) > 57 (la borne précédente était R(4,8)> 55), en 21 jours de calculs[48].
↑Voir par exemple l'introduction du traité de Nicolas Bourbaki (Ens,I, p. 7-12)
↑Cette discussion (en anglais) sur le site de MathOverflow donne quelques exemples de ce que des mathématiciens professionnels contemporains jugent particulièrement élégant ; d'autres discussions du même genre (par exemple celle-ci) renvoient souvent au livre Raisonnements divins mentionné au paragraphe suivant.
↑Il suffirait en effet d'explorer toutes les démonstrations possibles de longueur inférieure à celle qui est connue ; en pratique, toutefois, une telle recherche est matériellement impossible sous cette forme, en raison de l'explosion combinatoire.
↑Voir à ce sujet ces analyses (en anglais) sur le blog de Lance Fortnow(en) ; Scott Aaronson fait en particulier remarquer que le problème n'est pas l'apparition de difficultés mathématiques subtiles qui demanderaient de longs préliminaires pour aboutir à une rigueur absolue, mais seulement la nécessité de spécifier correctement tous les détails du langage utilisé, parmi lesquels la définition de 1, 2 et +.
↑En effet, s'il n'en était pas ainsi, appelant f la fonction calculable effectuant cette majoration, il suffirait (en théorie sinon en pratique) d'explorer toutes les démonstrations possibles de longueur inférieure à f(n) pour décider de la vérité de tout énoncé de longueur n, contredisant les théorèmes d'incomplétude de Gödel.
↑Voir par exemple les Notes on Perelman Papers (en) de Bruce Kleiner et John Lott, publiées en 2013.
↑L'analyse de l'enchaînement des résultats aboutissant à cette démonstration figure dans (en) Reinhard Diestel, Graph Theory [détail des éditions], p. 373.
↑La démonstration initiale de Hales (en 1998) n'a pas été vraiment acceptée, ce qui l'a amené à la réécrire sous une forme en permettant une vérification automatique (c'est le projet Flyspeck) ; bien que ce dernier ne se soit achevé qu'en août 2014, Hales avait déjà reçu le prix Fulkerson en 2009, ce qu'on peut interpréter comme une reconnaissance officielle de la validité de sa démonstration.
↑Ainsi, 2047 décimales de Pi furent calculées en 1949 par ENIAC, un des premiers ordinateurs. Mais en fait, certains de ces calculs avaient même été effectués à la main dès le XIXe siècle, tâche ayant parfois pris de longues années ; voir par exemple les articles consacrés à William Shanks ou Fortuné Landry.
↑Paul Erdős estimait que « en combinant toutes nos ressources, nous pourrions envisager de calculer R(5,5) si des extraterrestres nous menaçaient de destruction en cas d'échec, mais s'ils nous demandaient de calculer R(6,6), nous ferions mieux de tenter de leur résister » ((en) Joel Spencer, Ten Lectures on the Probabilistic Method, SIAM, , p. 4).
↑(it) Paolo Ruffini, Teoria generale delle equazioni in cui si dimostra impossibile la soluzione algebrica delle equazioni generali di grado superiore al quarto, nella stamperia di S. Tommaso d'Aquino(IS), S. Tommaso d'Aquino (tip.), 1799, 509 pages (lire en ligne).
↑(de) Wilhelm Killing, « Die Zusammensetzung der stetigen/endlichen Transformationsgruppen », Math. Ann., 1888-90, I, II, III et IV.
↑(de) Johann Gustav Hermes, « Über die Teilung des Kreises in 65537 gleiche Teile », Nachrichten von der Gesellschaft der Wissenschaften zu Göttingen, Mathematisch-Physikalische Klasse, Göttingen, vol. 3, , p. 186-418 (lire en ligne)(Sur la division du cercle en 65537 parties égales).
↑(de) Emanuel Lasker, « Zur Theorie der Moduln und Ideale », Mathematische Annalen, vol. 60, , p. 20-116 ; on trouvera une démonstration moderne (et courte) dans l’Introduction to commutative algebra de Michael Atiyah et Ian G. Macdonald (lire en ligne, théorèmes 4.5 et 4.10).
↑(en) Walter Feit et John G. Thompson, « Solvability of groups of odd order », Pac. J. Math., vol. 13, , p. 775-1029. Consultation payante en ligne.
↑G. Gonthier et al., « A Machine-Checked Proof of the Odd Order Theorem », HAL, Archives ouvertes, (lire en ligne)
↑(en) Herwig Hauser, « The Hironaka theorem on resolution of singularities (or: A proof we always wanted to understand) », Bull. Amer. Math. Soc. (N.S.), vol. 40, no 3, , p. 323-403 (lire en ligne).
↑(en) Steven Dale Cutkosky, Resolution of singularities for 3-folds in positive characteristic, vol. 131, , 59-127 p. (JSTOR40068184, MR2488485), chap. 1.
↑(en) V. S. Varadarajan, « Harish-Chandra and his mathematical work », Current Sci., vol. 65, no 12, 1993, p. 918-919.
↑(en) Kenneth Appel et Wolfgang Haken, « Every Planar Map is Four Colorable Part I. Discharging », Illinois Journal of Mathematics, vol. 21, , p. 429-490 ; (en) Kenneth Appel, Wolfgang Haken et John Koch, « Every Planar Map is Four Colorable Part II. Reducibility », Illinois Journal of Mathematics, vol. 21, , p. 491-567.
↑(en) D. Gorenstein et Koichiro Harada, Finite groups whose 2-subgroups are generated by at most 4 elements, vol. 147, Providence, R.I., AMS, coll. « Memoirs of the American Mathematical Society », , 464 p. (ISBN978-0-8218-1847-3, MR0367048, lire en ligne).
↑(en) R. P. Langlands, On the Functional Equations Satisfied by Eisenstein Series, Lecture Notes in Math., vol. 544, Springer-Verlag, Berlin-Heidelberg-New York, 1976. (lire en ligne).
↑(en) Dennis Hejhal, The Selberg Trace Formula for PSL (2, R), 2 volumes, Springer, 1976 (un troisième volume est prévu).
↑(en) Patterson, S. J., « Review: Dennis A. Hejhal, The Selberg trace formula for PSL(2, R), Volume I », Bull. Amer. Math. Soc., vol. 84, no 2, , p. 256-260 (DOI10.1090/s0002-9904-1978-14466-8, lire en ligne).
↑(en) Stephen Gelbart, Lectures on the Arthur-Selberg trace formula, vol. 9, Providence, R.I., AMS, coll. « University Lecture Series », (lire en ligne).
↑(en) Andrew Wiles, « Modular elliptic curves and Fermat's last theorem », Ann. Math., vol. 141, , p. 443-551 (lire en ligne).
↑(en) (avec Stephen D. Smith), The Classification of Quasithin Groups : I Structure of Strongly Quasithin K-groups, AMS, coll. « Mathematical Surveys and Monographs » (no 111), , 1221 p. (ISBN978-0-8218-3410-7, présentation en ligne, lire en ligne).
↑(en) (avec Stephen D. Smith), The Classification of Quasithin Groups : II Main Theorems: The Classification of Simple QTKE-groups, AMS, coll. « Mathematical Surveys and Monographs » (no 112), , 1221 p. (ISBN978-0-8218-3411-4, présentation en ligne).
↑Une analyse détaillée de la situation au début des années 2000 figure dans Krantz 2011, p. 186 à 191.
↑Michèle Artigue, Calcul et démonstration (lire en ligne)
↑(en) Charles C. Sims, Finite groups '72 (Proc. Gainesville Conf., Univ. Florida, Gainesville, Fla., 1972), vol. 7, Amsterdam, North-Holland, , 138–141 p., « The existence and uniqueness of Lyons' group »
↑Georges Gonthier, Andrea Asperti, Jeremy Avigad, Yves Bertot, Cyril Cohen, François Garillot, Stéphane Le Roux, Assia Mahboubi, Russell O'Connor, Sidi Ould Biha, Ioana Pasca, Laurence Rideau, Alexey Solovyev, Enrico Tassi, Laurent Théry: A Machine-Checked Proof of the Odd Order Theorem. ITP 2013: 163-179