Information classique
Comme dans la leçon précédente, nous allons commencer celle-ci par une discussion sur l'information classique. Une fois de plus, les descriptions probabiliste et quantique sont mathématiquement similaires, et comprendre comment les mathématiques fonctionnent dans le cadre familier de l'information classique est utile pour saisir pourquoi l'information quantique est décrite comme elle l'est.
États classiques via le produit cartésien
Nous allons partir d'un niveau très fondamental, en examinant les états classiques de systèmes multiples. Pour simplifier, nous commençons par discuter de deux systèmes, puis nous généralisons à plus de deux systèmes.
Pour être précis, soit un système dont l'ensemble des états classiques est et soit un second système dont l'ensemble des états classiques est Rappelons que, puisque nous avons qualifié ces ensembles d'ensembles d'états classiques, notre hypothèse est que et sont tous deux finis et non vides. Il est possible que mais ce n'est pas nécessairement le cas — et quoi qu'il en soit, il sera utile d'utiliser des noms différents pour désigner ces ensembles, dans un souci de clarté.
Imagine maintenant que les deux systèmes et sont placés côte à côte, avec à gauche et à droite. Si nous le souhaitons, nous pouvons considérer ces deux systèmes comme s'ils formaient un seul système, que nous pouvons noter ou selon notre préférence. Une question naturelle à se poser sur ce système composé est : « Quels sont ses états classiques ? »
La réponse est que l'ensemble des états classiques de est le produit cartésien de et de qui est l'ensemble défini par
En termes simples, le produit cartésien est précisément la notion mathématique qui capture l'idée de considérer ensemble un élément d'un ensemble et un élément d'un second ensemble, comme s'ils formaient un seul élément d'un seul ensemble. Dans le cas présent, dire que est dans l'état classique signifie que est dans l'état classique et est dans l'état classique ; et si l'état classique de est et l'état classique de est alors l'état classique du système joint est
Pour plus de deux systèmes, la situation se généralise de façon naturelle. Si l'on suppose que sont des systèmes ayant respectivement les ensembles d'états classiques pour tout entier positif l'ensemble des états classiques du -uplet considéré comme un seul système joint, est le produit cartésien
Bien sûr, nous sommes libres d'utiliser les noms que nous voulons pour les systèmes, et de les ordonner comme bon nous semble. En particulier, si nous avons systèmes comme ci-dessus, nous pourrions choisir de les nommer et de les disposer de droite à gauche, de sorte que le système joint devient En suivant le même schéma de nommage pour les états classiques et les ensembles d'états classiques associés, nous pourrions alors désigner un état classique
de ce système composé. C'est d'ailleurs la convention d'ordre utilisée par Qiskit pour nommer plusieurs qubits. Nous reviendrons sur cette convention et sur la façon dont elle s'articule avec les circuits quantiques dans la prochaine leçon, mais nous allons l'utiliser dès maintenant pour nous y habituer.
Il est souvent pratique d'écrire un état classique de la forme comme une chaîne de caractères par souci de concision, en particulier dans la situation très courante où les ensembles d'états classiques sont associés à des ensembles de symboles ou de caractères. Dans ce contexte, le terme alphabet est couramment utilisé pour désigner les ensembles de symboles servant à former des chaînes, mais la définition mathématique d'un alphabet est exactement la même que celle d'un ensemble d'états classiques : c'est un ensemble fini et non vide.
Par exemple, supposons que soient des bits, de sorte que les ensembles d'états classiques de ces systèmes sont tous identiques.
Il y a alors états classiques du système joint qui sont les éléments de l'ensemble
Écrits sous forme de chaînes, ces états classiques ressemblent à ceci :
Pour l'état classique par exemple, on voit que et sont dans l'état tandis que tous les autres systèmes sont dans l'état
États probabilistes
Rappelle-toi que dans la leçon précédente, un état probabiliste associe une probabilité à chaque état classique d'un système. Ainsi, un état probabiliste de plusieurs systèmes — considérés collectivement comme un seul système — associe une probabilité à chaque élément du produit cartésien des ensembles d'états classiques des systèmes individuels.
Par exemple, supposons que et soient tous deux des bits, de sorte que leurs ensembles d'états classiques respectifs sont et Voici un état probabiliste de la paire
Cet état probabiliste est celui où et sont tous deux des bits aléatoires — chacun vaut avec une probabilité de et avec une probabilité de — mais les états classiques des deux bits sont toujours identiques. C'est un exemple de corrélation entre ces systèmes.
Ordre des ensembles d'états du produit cartésien
Les états probabilistes de systèmes peuvent être représentés par des vecteurs de probabilité, comme nous l'avons vu dans la leçon précédente. En particulier, les entrées du vecteur représentent les probabilités que le système se trouve dans les différents états classiques possibles, sachant qu'une correspondance entre les entrées et l'ensemble des états classiques a été choisie.
Choisir une telle correspondance revient en pratique à décider d'un ordre pour les états classiques, ce qui est souvent naturel ou dicté par une convention standard. Par exemple, l'alphabet binaire est naturellement ordonné avec en premier et en second, de sorte que la première entrée d'un vecteur de probabilité représentant un état probabiliste d'un bit est la probabilité d'être dans l'état et la deuxième entrée est la probabilité d'être dans l'état
Rien de tout cela ne change dans le contexte de systèmes multiples, mais il faut prendre une décision. L'ensemble des états classiques de plusieurs systèmes réunis, considérés collectivement comme un seul système, est le produit cartésien des ensembles d'états classiques des systèmes individuels — il faut donc décider comment ordonner les éléments des produits cartésiens d'ensembles d'états classiques.
Il existe une convention simple que nous suivons à cet effet : on part des ordres déjà en place pour les ensembles d'états classiques individuels, puis on ordonne les éléments du produit cartésien par ordre alphabétique. Une autre façon de le dire est que les entrées de chaque -uplet (ou, de façon équivalente, les symboles de chaque chaîne) sont traités comme s'ils avaient une importance qui décroît de gauche à droite. Par exemple, selon cette convention, le produit cartésien est ordonné comme suit :
Quand les -uplets sont écrits sous forme de chaînes et ordonnés de cette façon, on retrouve des schémas familiers, comme ordonné en et l'ensemble ordonné comme il a été écrit plus tôt dans la leçon. Autre exemple : en considérant l'ensemble comme un ensemble de chaînes, on obtient les nombres à deux chiffres de à ordonnés numériquement. Ce n'est évidemment pas une coïncidence ; notre système décimal utilise précisément ce type d'ordre alphabétique, où le mot alphabétique doit être compris au sens large, incluant les chiffres en plus des lettres.
Revenons à l'exemple de deux bits ci-dessus : l'état probabiliste décrit précédemment est donc représenté par le vecteur de probabilité suivant, où les entrées sont étiquetées explicitement par souci de clarté.
Indépendance de deux systèmes
Un type particulier d'état probabiliste de deux systèmes est celui où les systèmes sont indépendants. De façon intuitive, deux systèmes sont indépendants si connaître l'état classique de l'un n'a aucun effet sur les probabilités associées à l'autre. Autrement dit, apprendre dans quel état classique se trouve l'un des systèmes ne fournit aucune information sur l'état classique de l'autre.
Pour définir cette notion avec précision, supposons à nouveau que et sont des systèmes ayant respectivement les ensembles d'états classiques et Par rapport à un état probabiliste donné de ces systèmes, ils sont dits indépendants si
pour tout choix de et
Pour exprimer cette condition en termes de vecteurs de probabilité, supposons que l'état probabiliste donné de est décrit par un vecteur de probabilité, écrit en notation de Dirac comme
La condition d'indépendance est alors équivalente à l'existence de deux vecteurs de probabilité
représentant respectivement les probabilités associées aux états classiques de et tels que
pour tout et
Par exemple, l'état probabiliste d'une paire de bits représenté par le vecteur
est un état dans lequel et sont indépendants. Plus précisément, la condition requise pour l'indépendance est satisfaite pour les vecteurs de probabilité
Par exemple, pour que les probabilités de l'état concordent, il faut que et c'est bien le cas. Les autres entrées peuvent être vérifiées de façon similaire.
En revanche, l'état probabiliste que l'on peut écrire
ne représente pas l'indépendance entre les systèmes et Voici un moyen simple de l'établir.
Suppose qu'il existe des vecteurs de probabilité et tels qu'en équation ci-dessus, pour lesquels la condition est satisfaite pour tout choix de et Il faudrait alors nécessairement que
Cela implique que soit soit car si les deux étaient non nuls, leur produit le serait aussi. Cela conduit à la conclusion que soit (dans le cas ) soit (dans le cas ). Or, on voit qu'aucune de ces égalités ne peut être vraie, car on doit avoir et Il n'existe donc pas de vecteurs et satisfaisant la propriété requise pour l'indépendance.
Ayant défini l'indépendance entre deux systèmes, nous pouvons maintenant définir ce que l'on entend par corrélation : c'est une absence d'indépendance. Par exemple, puisque les deux bits dans l'état probabiliste représenté par le vecteur ne sont pas indépendants, ils sont, par définition, corrélés.
Produits tensoriels de vecteurs
La condition d'indépendance que nous venons de décrire peut s'exprimer de façon concise à l'aide de la notion de produit tensoriel. Bien que les produits tensoriels soient une notion très générale, pouvant être définie de façon assez abstraite et appliquée à diverses structures mathématiques, nous pouvons adopter une définition simple et concrète dans le cas présent.
Étant donné deux vecteurs
le produit tensoriel est le vecteur défini par
Les entrées de ce nouveau vecteur correspondent aux éléments du produit cartésien qui sont écrits sous forme de chaînes dans l'équation précédente. De façon équivalente, le vecteur est défini par l'équation
vraie pour tout et
Nous pouvons maintenant reformuler la condition d'indépendance : pour un système joint dans un état probabiliste représenté par un vecteur de probabilité les systèmes et sont indépendants si s'obtient en prenant un produit tensoriel
de vecteurs de probabilité et sur chacun des sous-systèmes et Dans ce cas, est dit état produit ou vecteur produit.
Nous omettons souvent le symbole lorsqu'on prend le produit tensoriel de kets, en écrivant par exemple plutôt que Cette convention traduit l'idée que le produit tensoriel est, dans ce contexte, la façon la plus naturelle ou par défaut de prendre le produit de deux vecteurs. Bien que moins courant, la notation est également parfois utilisée.
Lorsque nous utilisons la convention alphabétique pour ordonner les éléments des produits cartésiens, nous obtenons la spécification suivante du produit tensoriel de deux vecteurs colonnes.
En aparté important, remarque l'expression suivante pour les produits tensoriels de vecteurs de base standard :
On pourrait aussi écrire comme une paire ordonnée plutôt que comme une chaîne, auquel cas on obtient Cependant, il est plus courant d'omettre les parenthèses dans cette situation, en écrivant plutôt C'est typique des mathématiques en général ; les parenthèses qui n'apportent pas de clarté ou ne lèvent pas d'ambiguïté sont souvent simplement omises.
Le produit tensoriel de deux vecteurs a l'importante propriété d'être bilinéaire, ce qui signifie qu'il est linéaire en chacun des deux arguments séparément, en supposant que l'autre argument est fixé. Cette propriété s'exprime à travers ces équations :
1. Linéarit é dans le premier argument :
2. Linéarité dans le second argument :
En examinant la deuxième équation de chacune de ces paires, on constate que les scalaires « flottent librement » dans les produits tensoriels :
Il n'y a donc pas d'ambiguïté à écrire simplement ou encore ou pour désigner ce vecteur.
Indépendance et produits tensoriels pour trois systèmes ou plus
Les notions d'indépendance et de produits tensoriels se généralisent naturellement à trois systèmes ou plus. Si sont des systèmes ayant respectivement les ensembles d'états classiques alors un état probabiliste du système combiné est un état produit si le vecteur de probabilité associé prend la forme
pour des vecteurs de probabilité décrivant les états probabilistes de Ici, la définition du produit tensoriel se généralise de façon naturelle : le vecteur
est défini par l'équation
vraie pour tout
Une autre façon, équivalente, de définir le produit tensoriel de trois vecteurs ou plus est de le faire de façon récursive, en termes de produits tensoriels de deux vecteurs :
Comme pour le produit tensoriel de seulement deux vecteurs, le produit tensoriel de trois vecteurs ou plus est linéaire en chacun des arguments individuellement, en supposant que tous les autres arguments sont fixés. Dans ce cas, on dit que le produit tensoriel de trois vecteurs ou plus est multilinéaire.
Comme dans le cas de deux systèmes, on pourrait dire que les systèmes sont indépendants lorsqu'ils se trouvent dans un état produit, mais le terme mutuellement indépendants est plus précis. Il existe d'autres notions d'indépendance pour trois systèmes ou plus, comme l'indépendance par paires, qui sont à la fois intéressantes et importantes — mais pas dans le cadre de ce cours.
En généralisant l'observation précédente concernant les produits tensoriels de vecteurs de base standard, pour tout entier positif et tous états classiques on a
Mesures d'états probabilistes
Passons maintenant aux mesures d'états probabilistes de systèmes multiples. En choisissant de considérer plusieurs systèmes ensemble comme des systèmes uniques, nous obtenons immédiatement une spécification du fonctionnement des mesures pour les systèmes multiples — à condition que tous les systèmes soient mesurés.
Par exemple, si l'état probabiliste de deux bits est décrit par le vecteur de probabilité
alors le résultat — c'est-à-dire pour la mesure de et pour la mesure de — est obtenu avec une probabilité de et le résultat est également obtenu avec une probabilité de Dans chaque cas, nous mettons à jour la description par vecteur de probabilité de notre connaissance en conséquence, de sorte que l'état probabiliste devient respectivement ou
Nous pourrions cependant choisir de ne pas mesurer tous les systèmes, mais seulement certains d'entre eux. Cela donnera un résultat de mesure pour chaque système mesuré, et affectera également (en général) notre connaissance des systèmes restants que nous n'avons pas mesurés.
Pour expliquer comment cela fonctionne, nous allons nous concentrer sur le cas de deux systèmes, dont l'un est mesuré. La situation plus générale — dans laquelle un sous-ensemble propre de trois systèmes ou plus est mesuré — se ramène effectivement au cas de deux systèmes si l'on considère les systèmes mesurés collectivement comme s'ils formaient un système et les systèmes non mesurés comme s'ils formaient un second système.
Pour être précis, supposons que et sont des systèmes dont les ensembles d'états classiques sont et respectivement, et que les deux systèmes ensemble se trouvent dans un certain état probabiliste. Nous allons examiner ce qui se passe quand on mesure uniquement et qu'on ne fait rien à La situation où seul est mesuré et où rien n'arrive à est traitée symétriquement.
D'abord, nous savons que la probabilité d'observer un état classique particulier lors de la mesure de seul doit être cohérente avec les probabilités que nous obtiendrions en supposant que était également mesuré. C'est-à-dire qu'on doit avoir
C'est la formule pour ce qu'on appelle l'état probabiliste réduit (ou marginal) de seul.
Cette formule est parfaitement sensée au niveau intuitif, dans le sens où quelque chose de très étrange devrait se passer pour qu'elle soit fausse. Si elle était fausse, cela signifierait que mesurer pourrait d'une façon ou d'une autre influencer les probabilités associées aux différents résultats de la mesure de indépendamment du résultat réel de la mesure de Si se trouvait dans un endroit éloigné, comme quelque part dans une autre galaxie par exemple, cela permettrait une transmission d'information plus rapide que la lumière — ce que nous rejetons sur la base de notre compréhension de la physique. Une autre façon de comprendre cela vient de l'interprétation de la probabilité comme reflétant un degré de croyance. Le simple fait que quelqu'un d'autre puisse décider de regarder ne peut pas changer l'état classique de donc sans aucune information sur ce qu'il a fait ou vu, nos croyances sur l'état de ne devraient pas changer.
Maintenant, en supposant que seul est mesuré et ne l'est pas, il peut encore exister une incertitude sur l'état classique de Pour cette raison, plutôt que de mettre à jour notre description de l'état probabiliste de vers pour un certain choix de et nous devons mettre à jour notre description de façon à ce que cette incertitude sur soit correctement reflétée.
La formule de probabilité conditionnelle suivante traduit cette incertitude.
Ici, l'expression désigne la probabilité que sachant que (ou conditionnellement au fait que) À proprement parler, cette expression n'a de sens que si est non nul, car si nous divisons par zéro et nous obtenons la forme indéterminée Ce n'est pas un problème, cependant, car si la probabilité associée à est nulle, nous n'obtiendrons jamais comme résultat d'une mesure de et nous n'avons donc pas à nous préoccuper de cette éventualité.
Pour exprimer ces formules en termes de vecteurs de probabilité, considérons un vecteur de probabilité décrivant un état probabiliste joint de
Mesurer seul donne chaque résultat possible avec la probabilité
Le vecteur représentant l'état probabiliste de seul est donc donné par
Ayant obtenu un résultat particulier de la mesure de l'état probabiliste de est mis à jour selon la formule des probabilités conditionnelles, de sorte qu'il est représenté par ce vecteur de probabilité :
Dans le cas où la mesure de a donné l'état classique nous mettons donc à jour notre description de l'état probabiliste du système joint vers
Une façon de comprendre cette définition de est de la voir comme une normalisation du vecteur où nous divisons par la somme des entrées de ce vecteur pour obtenir un vecteur de probabilité. Cette normalisation traduit effectivement un conditionnement sur l'événement que la mesure de a donné le résultat
À titre d'exemple concret, supposons que l'ensemble des états classiques de est l'ensemble des états classiques de est et l'état probabiliste de est
Notre but sera de déterminer les probabilités des deux résultats possibles ( et ), et de calculer quel est l'état probabiliste résultant de pour les deux résultats, en supposant que le système est mesuré.
En utilisant la bilinéarité du produit tensoriel, et en particulier le fait qu'il est linéaire dans le second argument, nous pouvons réécrire le vecteur comme suit :
En d'autres termes, nous avons isolé les vecteurs de base standard distincts pour le premier système (celui qui est mesuré), en faisant le produit tensoriel de chacun avec la combinaison linéaire de vecteurs de base standard pour le second système, obtenue en sélectionnant les entrées du vecteur original qui sont cohérentes avec l'état classique correspondant du premier système. En y réfléchissant un instant, on voit que cela est toujours possible, quel que soit le vecteur de départ.
Ayant exprimé notre vecteur de probabilité de cette façon, les effets de la mesure du premier système deviennent faciles à analyser. Les probabilités des deux résultats peuvent être obtenues en sommant les probabilités entre parenthèses.
Ces probabilités somment à un, comme prévu — c'est une vérification utile de nos calculs.
Et maintenant, l'état probabiliste de conditionné sur chaque résultat possible peut être déduit en normalisant les vecteurs entre parenthèses. C'est-à-dire que nous divisons ces vecteurs par les probabilités associées que nous venons de calculer, afin qu'ils deviennent des vecteurs de probabilité.
Ainsi, conditionné sur valant l'état probabiliste de devient
et conditionné sur la mesure de valant l'état probabiliste de devient
Opérations sur les états probabilistes
Pour conclure cette discussion sur l'information classique pour les systèmes multiples, nous allons considérer les opérations sur des systèmes multiples dans des états probabilistes. En suivant la même idée qu'avant, nous pouvons considérer les systèmes multiples collectivement comme des systèmes uniques composés, puis nous référer à la leçon précédente pour voir comment cela fonctionne.
En revenant à la configuration habituelle où nous avons deux systèmes et examinons les opérations classiques sur le système composé D'après la leçon précédente et la discussion ci-dessus, nous concluons que toute opération de ce type est représentée par une matrice stochastique dont les lignes et les colonnes sont indexées par le produit cartésien
Par exemple, supposons que et sont des bits, et considérons une opération avec la description suivante.
C'est une opération déterministe connue sous le nom d'opération NOT contrôlé, où est le bit de contrôle qui détermine si une opération NOT doit être appliquée au bit cible Voici la représentation matricielle de cette opération :
Son action sur les états de base standard est la suivante.
Si nous interchangeons les rôles de et en prenant comme bit de contrôle et comme bit cible, alors la représentation matricielle de l'opération devient
et son action sur les états de base standard serait la suivante :
Un autre exemple est l'opération ayant cette description :
La représentation matricielle de cette opération est la suivante :
L'action de cette opération sur les vecteurs de base standard est la suivante :
Dans ces exemples, nous considérons simplement deux systèmes ensemble comme un seul système et procédons comme dans la leçon précédente.
La même chose peut être faite pour n'importe quel nombre de systèmes. Par exemple, imaginons que nous ayons trois bits, et que nous incrémentions ces trois bits modulo — c'est-à-dire que nous considérons les trois bits comme encodant un nombre entre et en notation binaire, nous ajoutons puis nous prenons le reste après division par Une façon d'exprimer cette opération est la suivante :
Une autre façon de l'exprimer est
en supposant que nous avons convenu que les nombres de à à l'intérieur des kets désignent les encodages binaires à trois bits de ces nombres. Une troisième option est d'exprimer cette opération sous forme de matrice.
Opérations indépendantes
Supposons maintenant que nous avons plusieurs systèmes et que nous effectuons indépendamment différentes opérations sur les systèmes séparément.
Par exemple, en reprenant notre configuration habituelle de deux systèmes et ayant respectivement les ensembles d'états classiques et supposons que nous effectuons une opération sur et, de façon totalement indépendante, une autre opération sur Comme nous le savons de la leçon précédente, ces opérations sont représentées par des matrices stochastiques — et pour être précis, disons que l'opération sur est représentée par la matrice et l'opération sur est représentée par la matrice Ainsi, les lignes et les colonnes de ont des indices mis en correspondance avec les éléments de et, de même, les lignes et les colonnes de correspondent aux éléments de
Une question naturelle à se poser est la suivante : si nous considérons et ensemble comme un seul système composé quelle est la matrice qui représente l'action combinée des deux opérations sur ce système composé ? Pour répondre à cette question, nous devons d'abord introduire les produits tensoriels de matrices, qui sont similaires aux produits tensoriels de vecteurs et sont définis de façon analogue.
Produits tensoriels de matrices
Le produit tensoriel des matrices
et
est la matrice
De façon équivalente, le produit tensoriel de et est défini par l'équation
vraie pour tout choix de et
Une autre façon, équivalente, de décrire est que c'est l'unique matrice qui satisfait l'équation
pour tout choix possible de vecteurs et en supposant que les indices de correspondent aux éléments de et les indices de correspondent à
En suivant la convention décrite précédemment pour ordonner les éléments des produits cartésiens, on peut aussi écrire le produit tensoriel de deux matrices explicitement comme suit :
Les produits tensoriels de trois matrices ou plus sont définis de façon analogue. Si sont des matrices dont les indices correspondent aux ensembles d'états classiques alors le produit tensoriel est défini par la condition que
pour tout choix d'états classiques Alternativement, les produits tensoriels de trois matrices ou plus peuvent être définis de façon récursive, en termes de produits tensoriels de deux matrices, similaire à ce que nous avons observé pour les vecteurs.
Le produit tensoriel de matrices est parfois dit multiplicatif car l'équation
est toujours vraie, pour tout choix de matrices et à condition que les produits aient un sens.
Opérations indépendantes (suite)
Nous pouvons maintenant répondre à la question posée précédemment : si est une opération probabiliste sur est une opération probabiliste sur et les deux opérations sont effectuées indépendamment, alors l'opération résultante sur le système composé est le produit tensoriel
Ainsi, pour les états probabilistes comme pour les opérations probabilistes, les produits tensoriels représentent l'indépendance. Si nous avons deux systèmes et qui sont indépendamment dans les états probabilistes et alors le système composé est dans l'état probabiliste ; et si nous appliquons des opérations probabilistes et aux deux systèmes indépendamment, alors l'action résultante sur le système composé est décrite par l'opération
Voyons un exemple, qui rappelle une opération probabiliste sur un seul bit de la leçon précédente : si l'état classique du bit est il est laissé tel quel ; et si l'état classique du bit est il est ramené à 0 avec une probabilité de Nous avions observé que cette opération est représentée par la matrice
Si cette opération est effectuée sur un bit et qu'une opération NOT est effectuée (indépendamment) sur un second bit alors l'opération conjointe sur le système composé a la représentation matricielle
À l'inspection, on voit que c'est une matrice stochastique. Ce sera toujours le cas : le produit tensoriel de deux matrices stochastiques ou plus est toujours stochastique.
Une situation courante que nous rencontrons est celle où une opération est effectuée sur un système et où rien n'est fait à un autre. Dans ce cas, exactement la même prescription est suivie, en gardant à l'esprit que ne rien faire est représenté par la matrice identité. Par exemple, remettre le bit à l'état et ne rien faire à donne l'opération probabiliste (et en fait déterministe) sur représentée par la matrice