Les six premiers sommets dessinés en portions d’un carré.
La série géométrique sur la ligne réelle.
En mathématiques, la série infinie 1/2 + 1/4 + 1/8 + 1/16 + ⋯ est un exemple élémentaire d’une série géométrique qui converge absolument.
Sa somme est
1 2 + 1 4 + 1 8 + 1 16 + ⋯ = ∑ n = 1 ∞ ( 1 2 ) n = 1 2 1 − 1 2 = 1. {displaystyle {frac {1}{2}}+{frac {1}{4}}+{frac {1}{8}}+{frac {1}{16}}+cdots =sum _{n=1}^{infty }left({frac {1}{2}}right)^{n}={frac {frac {1}{2}}{1-{frac {1}{2}}}}=1.}
Comme pour toute série infinie, la somme infinie
1 2 + 1 4 + 1 8 + 1 16 + ⋯ {displaystyle {frac {1}{2}}+{frac {1}{4}}+{frac {1}{8}}+{frac {1}{16}}+cdots }
est définie comme signifiant la limite de la somme des n termes
s n = 1 2 + 1 4 + 1 8 + 1 16 + ⋯ + 1 2 n − 1 + 1 2 n {displaystyle s_{n}={frac {1}{2}}+{frac {1}{4}}+{frac {1}{8}}+{frac {1}{16}}+cdots +{frac {1}{2^{n-1}}}+{frac {1}{2^{n}}}}
Multiplier sn par 2 révèle une relation utile :
2 s n = 2 2 + 2 4 + 2 8 + 2 16 + ⋯ + 2 2 n = 1 + [ 1 2 + 1 4 + 1 8 + ⋯ + 1 2 n − 1 ] = 1 + [ s n − 1 2 n ] . {displaystyle 2s_{n}={frac {2}{2}}+{frac {2}{4}}+{frac {2}{8}}+{frac {2}{16}}+cdots +{frac {2}{2^{n}}}=1+left[{frac {1}{2}}+{frac {1}{4}}+{frac {1}{8}}+cdots +{frac {1}{2^{n-1}}}right]=1+left[s_{n}-{frac {1}{2^{n}}}right].}
En soustrayant sn des deux côtés, on a
s n = 1 − 1 2 n . {displaystyle s_{n}=1-{frac {1}{2^{n}}}.}
Lorsque n tend vers l’infini, sn tend vers 1.
Cette série a été utilisée comme une représentation d’un des paradoxes de Zénon[1]. Les parties de l’œil Oudjat ont été pensées autrefois pour représenter les six premiers termes de la série[2].
Les mathématiciens sont parfois un peu fêlés. En tout cas ils aiment bien essayer de repousser les limites de notre compréhension, quitte à défier le sens commun. Prenez par exemple la somme suivante : 1+2+3+4+5+6+7… et ainsi de suite. Combien vaut cette somme ?
Je pense que n’importe quel écolier censé répondrait « l’infini ». Eh bien oui, mais non. Les mathématiciens ont réussi à prouver que cette immense somme vaut en fait … -1/12 ! Nous allons nous aussi le démontrer, et rassurez vous, dans ce billet on ne va utiliser que l’addition !
Edit du 19/01/2014 : après toutes les controverses suscitées par ce billet, j’ai décidé d’en écrire un autre pour justifier pourquoi ce que je raconte ici n’est pas juste un délire de mec qui manipule des objets mathématiques n’importe comment. Vous pouvez commencer par lire ce billet, mais si cela vous indigne et que vous voulez creuser, n’oubliez pas d’aller lire la suite ici : Le scandale des séries divergentes !
Échauffement, niveau 1
A titre d’échauffement, commençons par une somme un peu plus simple :
1 – 1 + 1 – 1 + 1 – 1 + …
Combien vaut cette somme ? Les plus malins remarqueront que la valeur de cette somme oscille entre 0 et 1 au fur et à mesure qu’on lui ajoute des termes. Si on veut vraiment affecter une valeur « moyenne » à cette somme infinie, on peut taper entre les deux et choisir 1/2.
Eh bien on peut en fait rigoureusement démontrer que cette somme vaut bien 1/2. Voici l’idée : appelons A cette somme, on pose donc
A= 1 – 1 + 1 – 1 + 1 – …
On peut ensuite observer que
A = 1 – 1 + 1 – 1 + 1 – … = 1 – (1 – 1 + 1 – 1 + 1 – …)
mais on reconnait que le terme entre parenthèses n’est autre que A lui-même, on a donc l’égalité
A = 1 – A
et vous pouvez facilement résoudre cette équation pour trouver A = 1/2. Facile et amusant, non ? Alors passons au niveau suivant.
Échauffement, niveau 2
Considérons maintenant la somme
B = 1 – 2 + 3 – 4 + 5 – 6 + 7 – …
Il s’agit encore d’une somme oscillante, mais cette fois-ci les oscillations deviennent de plus en plus grosses ! Cette fois-ci on remarque que
B = 1 – (2 – 3 + 4 – 5 + 6 – 7 +…)
et en décomposant en deux morceaux le terme entre parenthèses on a
B = 1 – (1 – 2 + 3 – 4 + 5 – 6 + 7 – …) – (1 – 1 + 1 – 1 + 1 – …)
Or ici on reconnait dans la première parenthèse la somme B dont on est parti, et dans l’autre parenthèse la somme A que l’on a évaluée au paragraphe précédent. On a donc
B = 1 – B – A
Comme on a calculé que A vaut 1/2, on en tire B = 1 – B – 1/2 et donc B = 1/4. Vous voyez qu’avec de simples opérations arithmétiques, on peut attribuer une valeur bien définie à cette somme infinie oscillante !
Passons aux choses sérieuses
Venons-en à notre somme monstrueuse, et appelons la S.
S = 1 +2 + 3 + 4 + 5 + 6 + …
Cette fois ci, la somme n’oscille plus : elle file carrément vers l’infini à grande vitesse ! Et pourtant voici ce que l’on peut faire : prenons la somme S et retirons-lui la somme B
S – B = (1 +2 + 3 + 4 + 5 + 6 + …) – (1 – 2 + 3 – 4 + 5 – 6 + …)
Vous voyez que les termes impairs se compensent et que les termes pairs sont doublés, on a donc
S – B = 2 * (2 + 4 + 6 + 8 + …) = 4 * (1 + 2 + 3 + 4 + …)
et ici à droite on reconnait entre parenthèses notre somme S ! On a donc
S = B + 4S
ou encore S = -B/3. Comme on a vu que B = 1/4, on arrive donc au résultat tant attendu
S = – 1/12. CQFD !
Cela peut vous paraître choquant, vous pouvez chercher la faille, ou vous imaginer que l’on peut démontrer n’importe quoi de ce genre en tripotant des sommes infinies. Eh bien non, si on respecte quelques règles élémentaires, quelle que soit la manière dont on s’y prend, on trouve que si on veut affecter une valeur finie à cette somme monstrueuse, alors -1/12 est l’unique valeur qui colle.
Tout cela a-t-il un sens ?
Du point de vue strictement mathématique, on peut donner un sens formel bien défini à ces calculs. Il suffit juste de généraliser un peu la notion de somme infinie. Ce qui est plus drôle, c’est que cette somme infinie bizarre joue aussi un rôle important en physique théorique.
Pour ma part, je l’ai croisée pour la première fois lors d’une étude sur l’effet Casimir. Cet effet (qui n’a rien à voir avec l’île aux Enfants) a été prédit par le physicien hollandais Hendrik Casimir, et prévoit que deux plaques parallèles conductrices placées dans le vide vont s’attirer à cause des fluctuations de l’énergie du vide (énergie dont je parlais dans ce billet).
Et pour calculer la force subie par les plaques, on utilise l’égalité 1 + 2 + 3 + 4 + … = -1/12 ! Et ça marche, car cette force a été mesurée expérimentalement !
Mais il existe une autre branche de la physique où cette égalité joue un rôle essentiel, il s’agit de la fameuse théorie des cordes. Comme vous le savez peut-être, cette théorie affirme nous vivons dans un monde à 26 dimensions (ou 10 ou 11, c’est selon). Les cordistes aiment dire que c’est ce que « prédit » la théorie, mais la réalité est un peu différente : ce nombre de dimensions n’est pas une prédiction de la théorie, mais plutôt un prérequis pour que la théorie ait mathématiquement un sens.
J’ai déjà eu l’occasion d’évoquer cette histoire (dans ce billet), mais en gros ce qu’il faut savoir, c’est que si vous essayez de construire une théorie des cordes en dimension D=4, ça ne marche pas, car on trouve plein d’infinis partout. On pourrait être tentés d’abandonner l’idée, sauf qu’un jour quelqu’un a remarqué que les infinis disparaissaient si on choisissait D=26. Et c’est comme ça que les théoriciens des cordes, pour sauver leur belle théorie, ont décidé de se placer en dimension D=26 et de continuer l’aventure comme si de rien n’était.
Mais au fait, pourquoi D = 26 est-elle la dimension magique dans laquelle la théorie marche sans que les infinis apparaissent ? Si on fait le détail du calcul, on trouve que le terme infini qui fout le bazar est en fait proportionnel à
(left[1 + frac{D-2}{2}(1+2+3+4+5+6+7+…)right])
or si vous observez cette équation deux minutes, et que vous admettez que 1 + 2 + 3 + 4 + … = -1/12, vous remarquez que tout ce terme devient nul pour D=26, et les infinis disparaissent de la théorie ! Voilà d’où vient le nombre magique, appelé « dimension critique ». (Pour les esprits pointilleux, j’ai raconté ici le calcul tel qu’il se présente pour la théorie dite des « cordes bosoniques », qui est la plus simple. On sait depuis longtemps que cette théorie ne fonctionne pas pour d’autres raisons, et on favorise plutôt les théories « supersymétriques » pour lesquels le nombre magique de dimensions est 10, mais l’idée est la même.)
Pour les plus courageux, je propose deux pistes pour aller plus loin : l’une est mathématique (et parle de la définition formelle de ces sommes infinies pas si infinies), l’autre est physique et parle de l’effet Casimir, et nous donne une vision amusante sur ce que signifie vraiment ce -1/12.
Pour aller plus loin : une justification mathématique
Si vous n’êtes pas convaincus qu’assigner des valeurs finies à ces sommes infinies peut avoir un sens, voici quelques éléments sur le formalisme mathématique sous-jacent.
Si on considère une suite ((a_n)), on dit généralement que la série (sum a_n) est (simplement) convergente si on peut assigner une limite à la suite des sommes partielles.
(s_n = sum_{i=0}^{n} a_i)
Pour les suites ((a_n)) pour lesquelles la série est simplement convergente, appelons (sum) l’opérateur qui associe la limite de la suite des sommes partielles. Mais il existe plein de ((a_n)) pour lesquelles cette condition n’est pas vérifiée, et les 3 exemples de ce billet en font partie.
La question que l’on peut se poser est : existe-t-il une généralisation de l’opérateur (sum) qui soit définie sur un ensemble plus large que les séries simplement convergentes, mais qui bien sûr coïncide avec (sum) sur cet ensemble. Petite contrainte, on ne veut pas de n’importe quel opérateur, on cherche un opérateur linéaire, c’est-à-dire que si on additionne deux suites, les « sommes » s’additionnent (et pareil avec la multiplication par un scalaire). C’est parce qu’on demande ces conditions de linéarité que les manipulations proposées dans ce billet sont correcte, et montrent que si on arrive à trouver un opérateur linéaire qui est définit pour 1 + 2 + 3 + 4 + … alors la valeur que cet opérateur doit affecter cette somme ne peut pas être autre chose que -1/12.
Pour illustrer cette idée d’opérateur qui généralise (sum), une solution possible est d’utiliser la convergence dite « de Cesaro ». Ce dernier a proposé que l’on associe à une suite ((a_n)) le nombre qui soit la limite de la moyenne de ses sommes partielles. On définit donc l’opérateur
(C({a_n}) = lim frac{s_1 + s_2 + … + s_N}{N})
L’opérateur (C) généralise (sum) mais coïncide avec lui pour les séries simplement convergentes. La généralisation permet ainsi de calculer 1 – 1 + 1 – 1 + 1 – … C’est ce qui se cachait derrière l’idée de « la somme oscille entre 0 et 1 ».
Autre extension encore plus générale, la convergence d’Abel, où l’on définit l’opérateur A de la manière suivante
(A({a_n}) = lim_{xto1^-} sum_n a_n x^n)
Dans le deuxième exemple que j’ai donné, on peut se convaincre que la valeur 1/4 est obtenue comme convergence au sens d’Abel de la série entière de (frac{1}{1+x^2}).
Pour la somme 1+2+3+4+5+…, il faut chercher encore plus général si on veut donner une justification formelle. On peut par exemple utiliser ce qu’on appelle la régularisation par la fonction zeta de Riemann
(lim_{sto 0} sum a_n n^{-s})
Dans le cas de la suite (a_n=n), on obtient donc
(lim_{sto 0} sum n^{1-s} = lim_{sto 0} zeta(s-1))
La limite de cette expression correspond alors la fameuse fonction zeta de Riemann, évaluée en -1, et pour laquelle il existe un prolongement analytique qui vaut justement -1/12.
Bon assez de maths, passons à la physique !
Pour aller plus loin : une justification physique
Pour ceux qui ne connaissent pas cette bizarrerie, l’effet Casimir prédit que deux plaques conductrices placées dans le vide à distance L l’une de l’autre s’attirent avec une force qui décroit quand L augmente. Hendrik Casimir a proposé cet effet en le justifiant par les variations de l’énergie de point zéro du vide situé entre les plaques.
On sait que les modes de vibrations du champ électromagnétique quantique dans le vide se comportent chacun comme un oscillateur harmonique quantique, et que – contrairement à un oscillateur classique – l’état de plus basse énergie possède une énergie non-nulle. Quand deux plaques sont à distance L l’une de l’autre, à cause des conditions aux limites les modes du champ qui peuvent exister entre elles sont restreints aux longueurs d’ondes qui sont des fractions entières de L. Si on ne considère qu’une dimension d’espace, l’énergie de point zéro du mode (n) est égale à
(E_n = frac{1}{2} hbar c frac{npi}{L})
Si on somme sur tous les modes, on a donc l’énergie de point zéro totale en fonction de la distance entre les plaques (L) qui est égale à
(E(L) = frac{1}{2} hbar c frac{pi}{L} left(sum_n nright))
Si on ne veut pas trop réfléchir, on peut utiliser la formule magique (sum_n n = -1/12), et sortir
(E(L) = – frac{1}{24} hbar c frac{pi}{L})
On peut ensuite en tirer la force qui s’exerce sur la plaque en dérivant l’énergie par rapport à L.
(F(L) = frac{1}{24} hbar c frac{pi}{L^2})
Mais si utiliser l’égalité (sum_n n = -1/12) vous pose problème, on peut chercher une justification plus physique. Quand les plaques sont à distance (L) l’énergie qu’on vient de calculer semble infinie. Mais si on éloigne les plaques à grande distance, il y a toujours une énergie volumique associée aux modes du champs électromagnétique. La différence est que dans cette situation les modes ne sont plus quantifiés. Il faut donc essentiellement remplacer (sum_n n) par (int x dx). On obtient là aussi quelque chose d’infini, mais d’un peu plus gros. Maintenant si on prend cette situation comme point de référence et qu’on s’amuse à faire la différence entre les deux situations (plaques à distance L et plaques « très loin ») on trouve
(Delta E(L) = frac{1}{2} hbar c frac{pi}{L} left(sum_n n – int_0^{+infty} x dxright))
On soustrait donc deux infinis…comment faire ?
Il se trouve qu’on est sauvés par une formule mathématique bien pratique, que l’on croise dans les cours d’analyse en licence, et qui s’appelle la formule d’Euler-MacLaurin. Cette formule permet d’estimer la différence entre une somme discrète sur une fonction et l’intégrale correspondante. Elle dit notamment que pour une fonction (f)
(sum_n f(n) – int_0^{+infty} f(x) dx = frac{1}{2} f(0) – frac{1}{12} f'(0) + …)
où je vous épargne les termes liés aux dérivées d’ordre supérieur. Ce qu’il y a d’amusant, c’est que si on applique (illégalement) cette formule pour la fonction f(x)=x, on trouve
(left(sum_n n – int x dxright) = – 1/12 )
Et on retombe bien sur l’énergie de Casimir.
Personnellement je trouve que ce calcul nous éclaire sur l’origine profonde de -1/12. En fait la somme 1 + 2 + 3 + 4 + … est bien infinie, mais -1/12 est ce qui la sépare de (int x dx) qui est aussi infini, est que l’on peut voir comme une base que l’on soustrait. Dans le cas de Casimir, il s’agit bien d’ailleurs du niveau énergétique « de base », quand les plaques sont très éloignées.
Autre manière de le dire, on trouve que 1 + 2 + 3 + 4 + … est infini, mais égal à -1/12, modulo (int x dx).
Vous avez tenu jusque là, je vous félicite ! Promis un jour je ferai un billet compréhensible sur l’effet Casimir !
Soyez le premier a laisser un commentaire