Chapitre 3. Statistique et « loi mathématique hypothétique » chez R.A. Fisher (1921-1922)
- Par Franck Varenne
Pages 39 à 61
Citer ce chapitre
- VARENNE, Franck,
- Varenne, Franck.
- Varenne, F.
Citer ce chapitre
- Varenne, F.
- Varenne, Franck.
- VARENNE, Franck,
Notes
-
[1]
Voir Giegerenzer, Gerd et al., The Empire of Chance – How probability changed science and everyday life, Cambridge, Cambridge University Press, 1997, p. 111.
-
[2]
Cette histoire est assez bien connue et a déjà été rapportée, notamment par Mackenzie, Donald A., Statistics in Britain, 1865-1960, Edinburgh University Press, 1981, Giegerenzer et al., 1998, op.cit., Desrosieres, Alain, La politique des grandes nombre - Histoire de la raison statistique, Paris, La Découverte, 2000 et Segal, Jérôme, Le zéro et le un – Histoire de la notion scientifique d’information au 20ème siècle, Paris, Syllepse, 2003. Voir également la contribution de l'historien Olby, Robert C., « La 'Théorie de la sélection naturelle' : le point de vue d'un historien », dans les actes du colloque « R. A. Fisher et l'histoire de la génétique des populations », Revue de synthèse, n°103-104, 1981, p. 251-289. Pour les besoins de notre étude sur les formalismes mathématiques en biologie, nous ne ferons ici que rappeler les grandes lignes des travaux de Fisher avant de nous appesantir un peu plus sur l'épistémologie du modèle qui s'y dévoile.
-
[1]
On ne peut donc appliquer la loi dite des « grands nombres ».
-
[1]
Le théorème de Thomas Bayes (1702-1761) porte sur ce que ce dernier appelle la « probabilité des causes », c'est-à-dire sur « la probabilité a priori des diverses causes possibles d'un événement » comme le rappelle Borel, Emile, Probabilité et statistique, Paris, PUF, 1950, p. 34. Il permet, « à partir d'une loi de probabilité a priori, de dire comment les résultats de l'observation la modifient » selon Georges Darmois et Daniel Dugué in Taton, René, 1995, op. cit., p. 98. Selon Fisher (in Fisher, Ronald A., Statistical Methods for Research Works, Edinburgh, Oliver and Boyd, 1925 et 1946, nouvelle édition ; traduction : Les méthodes statistiques adaptées à la méthode scientifique, Paris, PUF, 1947, p. 16), c'est la première fois que le calcul des probabilités est conçu comme un instrument de raisonnement inductif. Or, pour que ce théorème soit valable au sens où Bayes l'entend, il faut postuler que la cause est une variable aléatoire. Les bayésiens sont ceux qui, selon Fisher, ne virent pas d'inconvénient à faire ce postulat qui gênait pourtant déjà Bayes. Fisher va sortir de l'impasse en proposant la notion de « vraisemblance » à la place de celle de « probabilité a priori », cette notion n'ayant pas tout à fait les mêmes propriétés mathématiques exigeantes que celle de « probabilité ».
-
[2]
Pour une analyse plus approfondie de l'influence de la théorie des erreurs sur l'approche de Fisher, voir Giegerenzer, G. et al., 1997, op. cit., p. 80-84.
-
[3]
Ŗconstructing a hypothetical infinite populationŗ, Fisher, Ronald A., ŖOn the Mathematical Foundations of Theoretical Statisticsŗ, Philosophical Transactions of the Royal Society of London, A, 1922, vol. 222, p. 311.
-
[1]
C'est dans ces termes que dès 1928, J. Neyman et E. Pearson l'interpréteront. Mais Fisher opposera toujours son approche par « inférence inductive » à leur approche, dite de « comportement inductif ». Pour une comparaison des deux approches, voir Lehmann, Erich L., ŖThe Fisher, Neyman-Pearson Theories of Testing Hypotheses : One Theory or Two?ŗ, Journal of the American Statistical Association, Vol. 88, No. 424 (Dec., 1993), p. 1242- 1249.
-
[1]
Voir son article célèbre : Gosset (alias 'Student'), William S., ŖThe probable error of a meanŗ, Biometrika, 1908, vol. 6, p. 1-25. Dès les premières phrases, Gosset y postule que « toute expérience doit être regardée comme constituant un individu parmi une population d'expériences qui pourraient être effectuées dans les mêmes conditions » et que, par conséquent, une « série d'expériences est un échantillon extrait de cette population » (ŖAny experiment may be regarded as forming an individual of a 'population' of experiments which might be performed under the same conditions. A series of experiments is a sample drawn from this populationŗ, ibid., p. 1.
-
[2]
Sur l'importance du rôle de Fisher dans l'émergence de la notion scientifique d'information, nous renvoyons à l'étude fouillée de Segal, 2003, op. cit. Pour notre part, nous ne suivrons pas ici les avatars de cette notion d'information, mais nous essaierons en revanche d'en évaluer le rôle dans l'introduction au cœur de la méthode expérimentale de ce qui deviendra le « modèle statistique ». Dans ses travaux, J. Segal montre que Fisher a d'abord été inspiré par le sens le plus commun du terme information, celui de simple renseignement, avant d'en venir à une définition mathématique rigoureuse.
-
[1]
ŖBriefly, and in its most concrete form, the object of statistical methods is the reduction of data. A quantity of data, which usually by its mere bulk is incapable of entering the mind, is to be replaced by relatively few quantities which shall adequately represent the whole, or which, in other words, shall contain as much as possible, ideally the whole, of the relevant information contained in the original dataŗ, Fisher, Ronald A., 1922, op. cit., p. 311.
-
[1]
L'idempotence est cette propriété des applications projectives telle que le fait de les composer à elles-mêmes ne les modifie pas. Si « o » (prononcé 'rond') est le symbole de composition d'une application p, on la formule ainsi : p o p = p (« p rond p est égal à p »).
-
[1]
Cela se confirme même explicitement dans un passage de l'article plus tardif de 1925 : ŖBeing infinite the population is clearly hypothetical […] Briefly the hypothetical population is the conceptual resultant of the conditions which we are studyingŗ, Fisher, Ronald A., ŖTheory of Statistical Estimationŗ, Proc. of the Cambridge Philosophical Society, 1925, vol. 22, p. 700.
-
[2]
Voir l'introduction de Fisher, Ronald A., ŖInverse Probabilityŗ, Proc. of the Cambridge Philosophical Society, 1930, vol. 26, p. 528-535, introduction remontant à 1950 et publiée dans Contribution to Mathematical Statistics, New York, John Wiley & Sons, 1950, 22, p. 527a : ŖIt is emphasized that statements of equality (exact statements) of fiducial probability can only be derived from statistics having continuous distributions.ŗ
-
[1]
ŖIn frequency curves, however, a second infinity is introducedŗ, Fisher, Ronald A., 1922, op. cit., p. 312.
-
[2]
Ibid.
-
[1]
Desrosieres, Alain, 2000, op. cit., p. 353.
-
[2]
Fisher, Ronald A., ŖStudies in Crop Variation. I. An Examination of the Yield of Dressed Grain from Broadbalkŗ, Journal of Agricultural Sciences, 1921, vol. 11, p. 111.
-
[1]
Fisher, Ronald A., ŖSome Remarks of the Methods Formulated in a Recent Article on 'The Quantitative Analysis of Plant Growth' ŗ, Annals of Applied Biology, 1921, vol. 7, p. 372.
-
[2]
Ibid., p. 367.
-
[3]
Ibid., p. 372.
-
[4]
Ibid., p. 367 et 372.
-
[5]
in Briggs George E.Ŕ Kidd, Franklin Ŕ West, Cyril, 1920, ŖA quantitative analysis of plant growth. Part I.ŗ, Annals of Applied Biology, 1920, vol. 7, p. 103 ; référence et extrait cités par Fisher, Ronald A., 1921, op. cit., p. 367.
-
[6]
Ibid., p. 368.
-
[1]
Ibid., p. 369.
-
[2]
Qui permet en retour l'exactitude ou tout au moins le contrôle de la vraisemblance des paramètres mathématiques du modèle statistique à la Fisher.
-
[1]
C'est là faire écho à une divergence de vue classique entre biométricien et physiologiste. Voir Schreider, Eugène, La biométrie, Paris, PUF, 1967, p. 110 : « Et pourtant, lorsque le biométricien affirme que les relations entre les éléments d'un ensemble ne sont pas fonctionnelles, que les rapports de probabilité dominent la physiologie, il répète, avec des preuves plus précises, une vérité connue depuis fort longtemps. » Et Schreider de citer à la suite un passage d'Etienne-Jules Marey (1830-1904) : « Une loi n'est que la détermination des rapports numériques entre différents phénomènes ; il n'y a donc pas de loi physiologique parfaite », extrait de La machine animale, Paris, 1873.
-
[1]
Boltzmann, Ludwig, ŖModelŗ, Encyclopedia Britannica, London: ŖThe Timesŗ Printing House, 10th Edition, volume XXX, 1902, p. 788-791.
-
[1]
Hertz, Heinrich, Die Prinzipien der Mechanik in neuem Zusammenhange dargestellt – Drei Beiträge (1891-1894), réimpression : Frankfurt-am-Main, Verlag Harri Deutsch, 1996, p. 67-68.
-
[2]
Ainsi, pour Boltzmann, contrairement à la thèse à laquelle parvenait le phénoménalisme fictionnaliste de Mach, l'équation différentielle, avec ses infinitésimaux, n'est pas le meilleur instrument de connaissance car elle n'est pas, parmi les types d'équations possibles, la meilleure pourvoyeuse d'images ; loin s'en faut. Il faut donc tâcher de conserver le plus longtemps possible cet accès intellectuel à l'image qu'est le modèle fini d'un mécanisme analogue aux équations. Pour Boltzmann, on ne doit pas oublier que les dérivées et les intégrales sont elles-mêmes historiquement et psychologiquement des produits de l'approche mécaniste poussée à sa limite et non, à l'inverse, des êtres mathématiques plus nobles et antérieurs qu'il faudrait, dans le pire des cas, approcher par des modèles. C'est là une des conséquences de sa conception finitiste et constructiviste en mathématiques. Dans cette perspective, les équations sont donc logiquement secondes par rapport aux modèles finis. Ainsi s'explique leur fondamentale opacité pour notre esprit mais aussi le fait qu'elles exercent sur lui un pouvoir de fascination finalement usurpé. Pour Boltzmann, c'est de cette fascination et de l'inversion indue des priorités conceptuelles qu'elle impose dont sont encore victimes bien des théoriciens de la physique. Plus largement, pour lui, l'histoire de la construction des concepts mathématiques ne peut jamais être complètement effacée ou réputée nulle (comme c'est en revanche souvent le cas aux yeux des théoriciens) au motif que des concepts plus puissants élaborés par la suite rendraient les anciens concepts superflus, approximatifs ou réducteurs. Il rejette par là la pertinence ontologique de la stratégie de déshistoricisation ex post et de convergence absorbante qu'adoptent fréquemment les approches théorico-mathématiques dans les sciences mathématisables. Car les anciens concepts mathématiques ont été un sol ferme pour d'autres plus puissants précisément parce qu'ils reposaient déjà eux-mêmes sur des pratiques effectives et humainement contrôlables. Comme on le sait, Wittgenstein, entre autres, se souviendra de cette interprétation de la puissance mathématique dans les sciences. Voir Bouveresse, Jacques, Le mythe de l’intériorité, Paris, Minuit, 1974, p. 200-216.
-
[1]
Hertz, Heinrich, 1996, op. cit., p. 67.
-
[2]
Cette question plus spécifique est traitée dans Barberousse, Anouk, La physique face à la probabilité, Paris, Vrin, 2000.
À l'heure où la botanique apprend à relativiser la valeur des lois phyllotaxiques, les recherches en agronomie et physiologie bénéficient des derniers développements de la méthode expérimentale proposés par l'école de biométrie anglaise. La notion de biométrie avait été introduite par le statisticien anglais Francis Galton (1822-1911) pour désigner la discipline dans laquelle on applique les méthodes de la statistique à la biologie. Un de ses buts avoués était de donner des outils rigoureux pour tester quantitativement la théorie darwinienne. Mais c'est avec le travail du physicien, statisticien et eugéniste anglais, Ronald Aylmer Fisher (1890-1962), qu'est introduit le concept de loi mathématique, probabiliste et hypothétique dans les sciences du vivant. Or, par ailleurs, on sait qu'en 1946, le statisticien suédois Harald Cramèr se réfèrera au concept de Fisher en recourant cette fois-ci à l'expression de « modèle statistique » créant l'expression et mariant ainsi l'approche modéliste de la théorie continentale des probabilités, et ses développements en mécanique statistique, avec la statistique biométrique anglo-américaine. C'est donc dans ces travaux du début des années 1920 que la biométrie a pour la première fois eu recours à un concept directement assimilable à celui de modèle statistique. C'est là également que la forme et la croissance des plantes sont systématiquement abordées avec un nouvel outillage formel, celui des statistiques. Qu'est-ce que cela suppose comme décision épistémologique quant au statut de la formalisation …
Date de mise en ligne : 30/01/2026
Ce chapitre est en accès conditionnel
Acheter cet ouvrage
28,99 €
Acheter ce chapitre
10,00 €