Produits scalaires et projections

Pour mieux nous préparer à explorer les capacités et les limites des circuits quantiques, nous introduisons maintenant quelques concepts mathématiques supplémentaires — à savoir le produit scalaire entre vecteurs (et son lien avec la norme euclidienne), les notions d'orthogonalité et d'orthonormalité pour des ensembles de vecteurs, ainsi que les matrices de projection, qui nous permettront d'introduire une généralisation pratique des mesures dans la base standard.

Produits scalaires

Rappelle-toi que lorsqu'on utilise la notation de Dirac pour désigner un vecteur colonne arbitraire par un ket, tel que

\vert \psi \rangle = \begin{pmatrix} \alpha_1\\ \alpha_2\\ \vdots\\ \alpha_n \end{pmatrix},

le vecteur bra correspondant est le conjugué transposé de ce vecteur :

\langle \psi \vert = \bigl(\vert \psi \rangle \bigr)^{\dagger} = \begin{pmatrix} \overline{\alpha_1} & \overline{\alpha_2} & \cdots & \overline{\alpha_n} \end{pmatrix}. \tag{1}

Alternativement, si on a un ensemble d'états classiques $\Sigma$ en tête, et qu'on exprime un vecteur colonne sous forme de ket, tel que

\vert \psi \rangle = \sum_{a\in\Sigma} \alpha_a \vert a \rangle,

alors le vecteur ligne (ou bra) correspondant est le conjugué transposé

\langle \psi \vert = \sum_{a\in\Sigma} \overline{\alpha_a} \langle a \vert. \tag{2}

On a également que le produit d'un vecteur bra et d'un vecteur ket, considérés comme des matrices ayant respectivement une seule ligne ou une seule colonne, donne un scalaire. Plus précisément, si on a deux vecteurs colonnes

\vert \psi \rangle = \begin{pmatrix} \alpha_1\\ \alpha_2\\ \vdots\\ \alpha_n \end{pmatrix} \quad\text{et}\quad \vert \phi \rangle = \begin{pmatrix} \beta_1\\ \beta_2\\ \vdots\\ \beta_n \end{pmatrix},

de sorte que le vecteur ligne $\langle \psi \vert$ est comme dans l'équation $(1),$ alors

\langle \psi \vert \phi \rangle = \langle \psi \vert \vert \phi \rangle = \begin{pmatrix} \overline{\alpha_1} & \overline{\alpha_2} & \cdots & \overline{\alpha_n} \end{pmatrix} \begin{pmatrix} \beta_1\\ \beta_2\\ \vdots\\ \beta_n \end{pmatrix} = \overline{\alpha_1} \beta_1 + \cdots + \overline{\alpha_n}\beta_n.

Alternativement, si on a deux vecteurs colonnes qu'on a écrits sous la forme

\vert \psi \rangle = \sum_{a\in\Sigma} \alpha_a \vert a \rangle \quad\text{et}\quad \vert \phi \rangle = \sum_{b\in\Sigma} \beta_b \vert b \rangle,

de sorte que $\langle \psi \vert$ est le vecteur ligne $(2),$ on trouve que

\begin{aligned} \langle \psi \vert \phi \rangle & = \langle \psi \vert \vert \phi \rangle\\ & = \Biggl(\sum_{a\in\Sigma} \overline{\alpha_a} \langle a \vert\Biggr) \Biggl(\sum_{b\in\Sigma} \beta_b \vert b\rangle\Biggr)\\ & = \sum_{a\in\Sigma}\sum_{b\in\Sigma} \overline{\alpha_a} \beta_b \langle a \vert b \rangle\\ & = \sum_{a\in\Sigma} \overline{\alpha_a} \beta_a, \end{aligned}

où la dernière égalité découle de l'observation que $\langle a \vert a \rangle = 1$ et $\langle a \vert b \rangle = 0$ pour des états classiques $a$ et $b$ satisfaisant $a\neq b.$

La valeur $\langle \psi \vert \phi \rangle$ est appelée le produit scalaire entre les vecteurs $\vert \psi\rangle$ et $\vert \phi \rangle.$ Les produits scalaires sont d'une importance capitale en information et en calcul quantiques ; on ne pourrait pas aller bien loin dans la compréhension mathématique de l'information quantique sans eux.

Rassemblons maintenant quelques propriétés fondamentales des produits scalaires de vecteurs.

Lien avec la norme euclidienne. Le produit scalaire d'un vecteur
$\vert \psi \rangle = \sum_{a\in\Sigma} \alpha_a \vert a \rangle$
avec lui-même vaut
$\langle \psi \vert \psi \rangle = \sum_{a\in\Sigma} \overline{\alpha_a} \alpha_a = \sum_{a\in\Sigma} \vert\alpha_a\vert^2 = \bigl\| \vert \psi \rangle \bigr\|^2.$
Ainsi, la norme euclidienne d'un vecteur peut aussi s'exprimer comme
$\bigl\| \vert \psi \rangle \bigr\| = \sqrt{ \langle \psi \vert \psi \rangle }.$
Note que la norme euclidienne d'un vecteur est toujours un nombre réel non négatif. De plus, la seule façon pour que la norme euclidienne d'un vecteur soit nulle est que toutes ses entrées soient nulles, c'est-à-dire que le vecteur soit le vecteur nul.

On peut résumer ces observations ainsi : pour tout vecteur $\vert \psi \rangle$ on a
$\langle \psi \vert \psi \rangle \geq 0,$
avec $\langle \psi \vert \psi \rangle = 0$ si et seulement si $\vert \psi \rangle = 0.$ Cette propriété du produit scalaire est parfois appelée définie positive.
Symétrie conjuguée. Pour deux vecteurs quelconques
$\vert \psi \rangle = \sum_{a\in\Sigma} \alpha_a \vert a \rangle \quad\text{et}\quad \vert \phi \rangle = \sum_{b\in\Sigma} \beta_b \vert b \rangle,$
on a
$\langle \psi \vert \phi \rangle = \sum_{a\in\Sigma} \overline{\alpha_a} \beta_a \quad\text{et}\quad \langle \phi \vert \psi \rangle = \sum_{a\in\Sigma} \overline{\beta_a} \alpha_a,$
et donc
$\overline{\langle \psi \vert \phi \rangle} = \langle \phi \vert \psi \rangle.$
Linéarité par rapport au second argument (et linéarité conjuguée par rapport au premier). Supposons que $\vert \psi \rangle,$ $\vert \phi_1 \rangle,$ et $\vert \phi_2 \rangle$ sont des vecteurs et que $\alpha_1$ et $\alpha_2$ sont des nombres complexes. Si on définit un nouveau vecteur
$\vert \phi\rangle = \alpha_1 \vert \phi_1\rangle + \alpha_2 \vert \phi_2\rangle,$
alors
$\langle \psi \vert \phi \rangle = \langle \psi \vert \bigl( \alpha_1\vert \phi_1 \rangle + \alpha_2\vert \phi_2 \rangle\bigr) = \alpha_1 \langle \psi \vert \phi_1 \rangle + \alpha_2 \langle \psi \vert \phi_2 \rangle.$
Autrement dit, le produit scalaire est linéaire par rapport au second argument. Cela peut se vérifier soit par les formules ci-dessus, soit simplement en remarquant que la multiplication matricielle est linéaire par rapport à chaque argument (et en particulier par rapport au second argument).

En combinant ce fait avec la symétrie conjuguée, on conclut que le produit scalaire est conjugué linéaire par rapport au premier argument. C'est-à-dire que si $\vert \psi_1 \rangle,$ $\vert \psi_2 \rangle,$ et $\vert \phi \rangle$ sont des vecteurs et $\alpha_1$ et $\alpha_2$ sont des nombres complexes, et qu'on définit
$\vert \psi \rangle = \alpha_1 \vert \psi_1\rangle + \alpha_2 \vert \psi_2 \rangle,$
alors
$\langle \psi \vert \phi \rangle = \bigl( \overline{\alpha_1} \langle \psi_1 \vert + \overline{\alpha_2} \langle \psi_2 \vert \bigr) \vert\phi\rangle = \overline{\alpha_1} \langle \psi_1 \vert \phi \rangle + \overline{\alpha_2} \langle \psi_2 \vert \phi \rangle.$
L'inégalité de Cauchy–Schwarz. Pour tout choix de vecteurs $\vert \phi \rangle$ et $\vert \psi \rangle$ ayant le même nombre d'entrées, on a
$\bigl\vert \langle \psi \vert \phi \rangle\bigr| \leq \bigl\| \vert\psi \rangle \bigr\| \bigl\| \vert \phi \rangle \bigr\|.$
C'est une inégalité incroyablement pratique, très largement utilisée en information quantique (et dans de nombreux autres domaines d'étude).

Ensembles orthogonaux et orthonormaux

On dit que deux vecteurs $\vert \phi \rangle$ et $\vert \psi \rangle$ sont orthogonaux si leur produit scalaire est nul :

\langle \psi \vert \phi \rangle = 0.

Géométriquement, on peut voir les vecteurs orthogonaux comme des vecteurs perpendiculaires l'un à l'autre.

Un ensemble de vecteurs $\{ \vert \psi_1\rangle,\ldots,\vert\psi_m\rangle\}$ est appelé un ensemble orthogonal si chaque vecteur de l'ensemble est orthogonal à tous les autres vecteurs de l'ensemble. C'est-à-dire que cet ensemble est orthogonal si

\langle \psi_j \vert \psi_k\rangle = 0

pour tous les choix de $j,k\in\{1,\ldots,m\}$ tels que $j\neq k.$

Un ensemble de vecteurs $\{ \vert \psi_1\rangle,\ldots,\vert\psi_m\rangle\}$ est appelé un ensemble orthonormal s'il est orthogonal et si, de plus, chaque vecteur de l'ensemble est un vecteur unitaire. Alternativement, cet ensemble est orthonormal si

\langle \psi_j \vert \psi_k\rangle = \begin{cases} 1 & j = k\\[1mm] 0 & j\neq k \end{cases} \tag{3}

pour tous les choix de $j,k\in\{1,\ldots,m\}.$

Enfin, un ensemble $\{ \vert \psi_1\rangle,\ldots,\vert\psi_m\rangle\}$ est une base orthonormale si, en plus d'être un ensemble orthonormal, il forme une base. Cela est équivalent à dire que $\{ \vert \psi_1\rangle,\ldots,\vert\psi_m\rangle\}$ est un ensemble orthonormal et que $m$ est égal à la dimension de l'espace d'où sont tirés $\vert \psi_1\rangle,\ldots,\vert\psi_m\rangle.$

Par exemple, pour tout ensemble d'états classiques $\Sigma,$ l'ensemble de tous les vecteurs de la base standard

\big\{ \vert a \rangle \,:\, a\in\Sigma\bigr\}

est une base orthonormale. L'ensemble $\{\vert+\rangle,\vert-\rangle\}$ est une base orthonormale pour l'espace de dimension $2$ correspondant à un seul qubit, et la base de Bell $\{\vert\phi^+\rangle, \vert\phi^-\rangle, \vert\psi^+\rangle, \vert\psi^-\rangle\}$ est une base orthonormale pour l'espace de dimension $4$ correspondant à deux qubits.

Compléter des ensembles orthonormaux en bases orthonormales

Supposons que $\vert\psi_1\rangle,\ldots,\vert\psi_m\rangle$ sont des vecteurs vivant dans un espace de dimension $n$ , et qu'en plus $\{\vert\psi_1\rangle,\ldots,\vert\psi_m\rangle\}$ est un ensemble orthonormal. Les ensembles orthonormaux sont toujours des ensembles linéairement indépendants, donc ces vecteurs engendrent nécessairement un sous-espace de dimension $m.$ On en conclut que $m\leq n$ , car la dimension du sous-espace engendré par ces vecteurs ne peut pas être supérieure à la dimension de l'espace entier dont ils sont tirés.

Si $m<n,$ il est toujours possible de choisir $n-m$ vecteurs supplémentaires $\vert \psi_{m+1}\rangle,\ldots,\vert\psi_n\rangle$ de sorte que $\{\vert\psi_1\rangle,\ldots,\vert\psi_n\rangle\}$ forme une base orthonormale. Une procédure connue sous le nom de procédé d'orthogonalisation de Gram–Schmidt peut être utilisée pour construire ces vecteurs.

Ensembles orthonormaux et matrices unitaires

Les ensembles orthonormaux de vecteurs sont étroitement liés aux matrices unitaires. Une façon d'exprimer ce lien est de dire que les trois affirmations suivantes sont logiquement équivalentes (c'est-à-dire qu'elles sont toutes vraies ou toutes fausses) pour tout choix d'une matrice carrée $U$ :

La matrice $U$ est unitaire (c'est-à-dire $U^{\dagger} U = \mathbb{I} = U U^{\dagger}$ ).
Les lignes de $U$ forment un ensemble orthonormal.
Les colonnes de $U$ forment un ensemble orthonormal.

Cette équivalence est en réalité assez directe lorsqu'on réfléchit au fonctionnement de la multiplication matricielle et du conjugué transposé. Supposons par exemple qu'on ait une matrice $3\times 3$ comme celle-ci :

U = \begin{pmatrix} \alpha_{1,1} & \alpha_{1,2} & \alpha_{1,3} \\[1mm] \alpha_{2,1} & \alpha_{2,2} & \alpha_{2,3} \\[1mm] \alpha_{3,1} & \alpha_{3,2} & \alpha_{3,3} \end{pmatrix}

Le conjugué transposé de $U$ ressemble à ceci :

U^{\dagger} = \begin{pmatrix} \overline{\alpha_{1,1}} & \overline{\alpha_{2,1}} & \overline{\alpha_{3,1}} \\[1mm] \overline{\alpha_{1,2}} & \overline{\alpha_{2,2}} & \overline{\alpha_{3,2}} \\[1mm] \overline{\alpha_{1,3}} & \overline{\alpha_{2,3}} & \overline{\alpha_{3,3}} \end{pmatrix}

Le produit des deux matrices, avec le conjugué transposé à gauche, nous donne la matrice suivante :

\begin{aligned} &\begin{pmatrix} \overline{\alpha_{1,1}} & \overline{\alpha_{2,1}} & \overline{\alpha_{3,1}} \\[1mm] \overline{\alpha_{1,2}} & \overline{\alpha_{2,2}} & \overline{\alpha_{3,2}} \\[1mm] \overline{\alpha_{1,3}} & \overline{\alpha_{2,3}} & \overline{\alpha_{3,3}} \end{pmatrix} \begin{pmatrix} \alpha_{1,1} & \alpha_{1,2} & \alpha_{1,3} \\[1mm] \alpha_{2,1} & \alpha_{2,2} & \alpha_{2,3} \\[1mm] \alpha_{3,1} & \alpha_{3,2} & \alpha_{3,3} \end{pmatrix}\\[4mm] \quad &= \begin{pmatrix} \overline{\alpha_{1,1}}\alpha_{1,1} + \overline{\alpha_{2,1}}\alpha_{2,1} + \overline{\alpha_{3,1}}\alpha_{3,1} & \overline{\alpha_{1,1}}\alpha_{1,2} + \overline{\alpha_{2,1}}\alpha_{2,2} + \overline{\alpha_{3,1}}\alpha_{3,2} & \overline{\alpha_{1,1}}\alpha_{1,3} + \overline{\alpha_{2,1}}\alpha_{2,3} + \overline{\alpha_{3,1}}\alpha_{3,3} \\[2mm] \overline{\alpha_{1,2}}\alpha_{1,1} + \overline{\alpha_{2,2}}\alpha_{2,1} + \overline{\alpha_{3,2}}\alpha_{3,1} & \overline{\alpha_{1,2}}\alpha_{1,2} + \overline{\alpha_{2,2}}\alpha_{2,2} + \overline{\alpha_{3,2}}\alpha_{3,2} & \overline{\alpha_{1,2}}\alpha_{1,3} + \overline{\alpha_{2,2}}\alpha_{2,3} + \overline{\alpha_{3,2}}\alpha_{3,3} \\[2mm] \overline{\alpha_{1,3}}\alpha_{1,1} + \overline{\alpha_{2,3}}\alpha_{2,1} + \overline{\alpha_{3,3}}\alpha_{3,1} & \overline{\alpha_{1,3}}\alpha_{1,2} + \overline{\alpha_{2,3}}\alpha_{2,2} + \overline{\alpha_{3,3}}\alpha_{3,2} & \overline{\alpha_{1,3}}\alpha_{1,3} + \overline{\alpha_{2,3}}\alpha_{2,3} + \overline{\alpha_{3,3}}\alpha_{3,3} \end{pmatrix} \end{aligned}

Si on forme trois vecteurs à partir des colonnes de $U,$

\vert \psi_1\rangle = \begin{pmatrix} \alpha_{1,1}\\ \alpha_{2,1}\\ \alpha_{3,1} \end{pmatrix}, \quad \vert \psi_2\rangle = \begin{pmatrix} \alpha_{1,2}\\ \alpha_{2,2}\\ \alpha_{3,2} \end{pmatrix}, \quad \vert \psi_3\rangle = \begin{pmatrix} \alpha_{1,3}\\ \alpha_{2,3}\\ \alpha_{3,3} \end{pmatrix},

on peut alors exprimer le produit ci-dessus autrement :

U^{\dagger} U = \begin{pmatrix} \langle \psi_1\vert \psi_1 \rangle & \langle \psi_1\vert \psi_2 \rangle & \langle \psi_1\vert \psi_3 \rangle \\ \langle \psi_2\vert \psi_1 \rangle & \langle \psi_2\vert \psi_2 \rangle & \langle \psi_2\vert \psi_3 \rangle \\ \langle \psi_3\vert \psi_1 \rangle & \langle \psi_3\vert \psi_2 \rangle & \langle \psi_3\vert \psi_3 \rangle \end{pmatrix}

En se référant à l'équation $(3),$ on voit maintenant que la condition que cette matrice soit égale à la matrice identité est équivalente à l'orthonormalité de l'ensemble $\{\vert\psi_1\rangle,\vert\psi_2\rangle,\vert\psi_3\rangle\}.$

Cet argument se généralise aux matrices unitaires de toute taille. Le fait que les lignes d'une matrice forment une base orthonormale si et seulement si la matrice est unitaire découle alors du fait qu'une matrice est unitaire si et seulement si sa transposée est unitaire.

Compte tenu de l'équivalence décrite ci-dessus, et du fait que tout ensemble orthonormal peut être complété en une base orthonormale, on conclut le fait utile suivant : Étant donné un ensemble orthonormal quelconque de vecteurs $\{\vert\psi_1\rangle,\ldots,\vert\psi_m\rangle\}$ tirés d'un espace de dimension $n$ , il existe une matrice unitaire $U$ dont les $m$ premières colonnes sont les vecteurs $\vert\psi_1\rangle,\ldots,\vert\psi_m\rangle.$ Schématiquement, on peut toujours trouver une matrice unitaire de la forme suivante :

U = \left( \begin{array}{ccccccc} \rule{0.4pt}{10pt} & \rule{0.4pt}{10pt} & & \rule{0.4pt}{10pt} & \rule{0.4pt}{10pt} & & \rule{0.4pt}{10pt}\\ \vert\psi_1\rangle & \vert\psi_2\rangle & \cdots & \vert\psi_m\rangle & \vert\psi_{m+1}\rangle & \cdots & \vert\psi_n\rangle\\[2mm] \rule{0.4pt}{10pt} & \rule{0.4pt}{10pt} & & \rule{0.4pt}{10pt} & \rule{0.4pt}{10pt} & & \rule{0.4pt}{10pt} \end{array} \right).

Ici, les $n-m$ dernières colonnes sont complétées par un choix quelconque de vecteurs $\vert\psi_{m+1}\rangle,\ldots,\vert\psi_n\rangle$ qui font de $\{\vert\psi_1\rangle,\ldots,\vert\psi_n\rangle\}$ une base orthonormale.

Projections et mesures projectives

Matrices de projection

Une matrice carrée $\Pi$ est appelée projection si elle satisfait deux propriétés :

$\Pi = \Pi^{\dagger}.$
$\Pi^2 = \Pi.$

Les matrices qui satisfont la première condition — être égales à leur propre conjugué transposé — sont appelées matrices hermitiennes, et les matrices qui satisfont la seconde condition — dont le carré ne les modifie pas — sont appelées matrices idempotentes.

Par précaution, le mot projection est parfois utilisé pour désigner toute matrice qui ne satisfait que la seconde condition mais pas nécessairement la première, et dans ce cas le terme projection orthogonale désigne typiquement les matrices satisfaisant les deux propriétés. Dans le contexte de l'information et du calcul quantiques, cependant, les termes projection et matrice de projection désignent plus généralement des matrices satisfaisant les deux conditions.

Un exemple de projection est la matrice

\Pi = \vert \psi \rangle \langle \psi \vert \tag{4}

pour tout vecteur unitaire $\vert \psi\rangle.$ On peut vérifier que cette matrice est hermitienne de la façon suivante :

\Pi^{\dagger} = \bigl( \vert \psi \rangle \langle \psi \vert \bigr)^{\dagger} = \bigl( \langle \psi \vert \bigr)^{\dagger}\bigl( \vert \psi \rangle \bigr)^{\dagger} = \vert \psi \rangle \langle \psi \vert = \Pi.

Ici, pour obtenir la seconde égalité, on a utilisé la formule

(A B)^{\dagger} = B^{\dagger} A^{\dagger},

qui est toujours vraie, pour deux matrices $A$ et $B$ quelconques pour lesquelles le produit $AB$ a un sens.

Pour voir que la matrice $\Pi$ dans $(4)$ est idempotente, on peut utiliser l'hypothèse que $\vert\psi\rangle$ est un vecteur unitaire, donc qu'il satisfait $\langle \psi \vert \psi\rangle = 1.$ On a ainsi

\Pi^2 = \bigl( \vert\psi\rangle\langle \psi\vert \bigr)^2 = \vert\psi\rangle\langle \psi\vert\psi\rangle\langle\psi\vert = \vert\psi\rangle\langle\psi\vert = \Pi.

Plus généralement, si $\{\vert \psi_1\rangle,\ldots,\vert \psi_m\rangle\}$ est un ensemble orthonormal quelconque de vecteurs, alors la matrice

\Pi = \sum_{k = 1}^m \vert \psi_k\rangle \langle \psi_k \vert \tag{5}

est une projection. Plus précisément, on a

\begin{aligned} \Pi^{\dagger} &= \biggl(\sum_{k = 1}^m \vert \psi_k\rangle \langle \psi_k \vert\biggr)^{\dagger} \\ &= \sum_{k = 1}^m \bigl(\vert\psi_k\rangle\langle\psi_k\vert\bigr)^{\dagger} \\ &= \sum_{k = 1}^m \vert \psi_k\rangle \langle \psi_k \vert\\ &= \Pi, \end{aligned}

\begin{aligned} \Pi^2 & = \biggl( \sum_{j = 1}^m \vert \psi_j\rangle \langle \psi_j \vert\Bigr)\Bigl(\sum_{k = 1}^m \vert \psi_k\rangle \langle \psi_k \vert\biggr) \\ & = \sum_{j = 1}^m\sum_{k = 1}^m \vert \psi_j\rangle \langle \psi_j \vert \psi_k\rangle \langle \psi_k \vert \\ & = \sum_{k = 1}^m \vert \psi_k\rangle \langle \psi_k \vert\\ & = \Pi, \end{aligned}

où l'orthonormalité de $\{\vert \psi_1\rangle,\ldots,\vert \psi_m\rangle\}$ implique l'avant-dernière égalité.

En fait, cela épuise toutes les possibilités : toute projection $\Pi$ peut s'écrire sous la forme $(5)$ pour un certain choix d'ensemble orthonormal $\{\vert \psi_1\rangle,\ldots,\vert \psi_m\rangle\}.$ (Techniquement, la matrice nulle $\Pi=0,$ qui est une projection, est un cas particulier. Pour la faire entrer dans la forme générale $(5)$ , on doit autoriser la possibilité que la somme soit vide, ce qui donne la matrice nulle.)

Mesures projectives

La notion de mesure d'un système quantique est plus générale que les simples mesures dans la base standard. Les mesures projectives sont des mesures décrites par une collection de projections dont la somme est égale à la matrice identité. En termes symboliques, une collection $\{\Pi_0,\ldots,\Pi_{m-1}\}$ de matrices de projection décrit une mesure projective si

\Pi_0 + \cdots + \Pi_{m-1} = \mathbb{I}.

Lorsqu'une telle mesure est effectuée sur un système $\mathsf{X}$ alors qu'il est dans un état $\vert\psi\rangle,$ deux choses se produisent :

Pour chaque $k\in\{0,\ldots,m-1\},$ le résultat de la mesure est $k$ avec une probabilité égale à
$\operatorname{Pr}\bigl(\text{le résultat est $k$}\bigr) = \bigl\| \Pi_k \vert \psi \rangle \bigr\|^2.$
Pour quel que soit le résultat $k$ que la mesure produit, l'état de $\mathsf{X}$ devient
$\frac{\Pi_k \vert\psi\rangle}{\bigl\|\Pi_k \vert\psi\rangle\bigr\|}.$

On peut aussi choisir des résultats autres que $\{0,\ldots,m-1\}$ pour les mesures projectives si on le souhaite. Plus généralement, pour tout ensemble fini et non vide $\Sigma,$ si on dispose d'une collection de matrices de projection

\{\Pi_a:a\in\Sigma\}

qui satisfait la condition

\sum_{a\in\Sigma} \Pi_a = \mathbb{I},

alors cette collection décrit une mesure projective dont les résultats possibles coïncident avec l'ensemble $\Sigma,$ les règles étant les mêmes qu'avant :

Pour chaque $a\in\Sigma,$ le résultat de la mesure est $a$ avec une probabilité égale à
$\operatorname{Pr}\bigl(\text{le résultat est $a$}\bigr) = \bigl\| \Pi_a \vert \psi \rangle \bigr\|^2.$
Pour quel que soit le résultat $a$ que la mesure produit, l'état de $\mathsf{X}$ devient
$\frac{\Pi_a \vert\psi\rangle}{\bigl\|\Pi_a \vert\psi\rangle\bigr\|}.$

Par exemple, les mesures dans la base standard sont équivalentes à des mesures projectives, où $\Sigma$ est l'ensemble des états classiques du système $\mathsf{X}$ dont on parle et notre ensemble de matrices de projection est $\{\vert a\rangle\langle a\vert:a\in\Sigma\}.$

Un autre exemple de mesure projective, cette fois sur deux qubits $(\mathsf{X},\mathsf{Y}),$ est donné par l'ensemble $\{\Pi_0,\Pi_1\},$ où

\Pi_0 = \vert \phi^+\rangle\langle \phi^+ \vert + \vert \phi^-\rangle\langle \phi^- \vert + \vert \psi^+\rangle\langle \psi^+ \vert \quad\text{et}\quad \Pi_1 = \vert\psi^-\rangle\langle\psi^-\vert.

Si on a plusieurs systèmes qui sont conjointement dans un état quantique et qu'une mesure projective est effectuée sur un seul de ces systèmes, l'action est similaire à ce qu'on avait pour les mesures dans la base standard — et en fait, on peut maintenant décrire cette action en termes bien plus simples qu'auparavant.

Pour être précis, supposons qu'on ait deux systèmes $(\mathsf{X},\mathsf{Y})$ dans un état quantique $\vert\psi\rangle,$ et qu'une mesure projective décrite par une collection $\{\Pi_a : a\in\Sigma\}$ soit effectuée sur le système $\mathsf{X},$ tandis que rien n'est fait sur $\mathsf{Y}.$ Cela est alors équivalent à effectuer la mesure projective décrite par la collection

\bigl\{ \Pi_a \otimes \mathbb{I} \,:\, a\in\Sigma\bigr\}

sur le système joint $(\mathsf{X},\mathsf{Y}).$ Chaque résultat de mesure $a$ se produit avec probabilité

\bigl\| (\Pi_a \otimes \mathbb{I})\vert \psi\rangle \bigr\|^2,

et conditionnellement au résultat $a$ , l'état du système joint $(\mathsf{X},\mathsf{Y})$ devient

\frac{(\Pi_a \otimes \mathbb{I})\vert \psi\rangle}{\bigl\| (\Pi_a \otimes \mathbb{I})\vert \psi\rangle \bigr\|}.

Implémenter des mesures projectives

Des mesures projectives arbitraires peuvent être implémentées à l'aide d'opérations unitaires, de mesures dans la base standard, et d'un système de travail supplémentaire, comme on va l'expliquer maintenant.

Supposons que $\mathsf{X}$ est un système et que $\{\Pi_0,\ldots,\Pi_{m-1}\}$ est une mesure projective sur $\mathsf{X}.$ On peut facilement généraliser cette discussion à des mesures projectives ayant différents ensembles de résultats, mais par souci de commodité et de simplicité, on suppose que l'ensemble des résultats possibles pour notre mesure est $\{0,\ldots,m-1\}.$

Notons explicitement que $m$ n'est pas nécessairement égal au nombre d'états classiques de $\mathsf{X}$ — on note $n$ le nombre d'états classiques de $\mathsf{X},$ ce qui signifie que chaque matrice $\Pi_k$ est une matrice de projection $n\times n.$

Comme on suppose que $\{\Pi_0\ldots,\Pi_{m-1}\}$ représente une mesure projective, il est nécessairement vrai que

\sum_{k = 0}^{m-1} \Pi_k = \mathbb{I}_n.

Notre objectif est de réaliser un processus ayant le même effet que d'effectuer cette mesure projective sur $\mathsf{X},$ mais en n'utilisant que des opérations unitaires et des mesures dans la base standard.

On va faire appel à un système de travail supplémentaire $\mathsf{Y}$ pour cela, et plus précisément on prend l'ensemble des états classiques de $\mathsf{Y}$ comme étant $\{0,\ldots,m-1\},$ qui est le même que l'ensemble des résultats de la mesure projective. L'idée est d'effectuer une mesure dans la base standard sur $\mathsf{Y},$ et d'interpréter le résultat de cette mesure comme étant équivalent au résultat de la mesure projective sur $\mathsf{X}.$ On doit supposer que $\mathsf{Y}$ est initialisé dans un état fixe, qu'on choisit d'être $\vert 0\rangle.$ (Tout autre choix d'état quantique fixe pourrait être utilisé, mais choisir $\vert 0\rangle$ simplifie considérablement l'explication qui suit.)

Bien sûr, pour qu'une mesure dans la base standard de $\mathsf{Y}$ nous donne des informations sur $\mathsf{X},$ on devra laisser $\mathsf{X}$ et $\mathsf{Y}$ interagir d'une façon ou d'une autre avant de mesurer $\mathsf{Y},$ en effectuant une opération unitaire sur le système $(\mathsf{Y},\mathsf{X}).$ Considérons d'abord cette matrice :

M = \sum_{k = 0}^{m-1} \vert k \rangle \langle 0 \vert \otimes \Pi_k.

Exprimée explicitement comme une matrice par blocs, qui est essentiellement une matrice de matrices qu'on interprète comme une seule matrice plus grande, $M$ ressemble à ceci :

M = \begin{pmatrix} \Pi_0 & 0 & \cdots & 0\\[1mm] \Pi_1 & 0 & \cdots & 0\\[1mm] \vdots & \vdots & \ddots & \vdots\\[1mm] \Pi_{m-1} & 0 & \cdots & 0 \end{pmatrix}.

Ici, chaque $0$ représente une matrice $n\times n$ entièrement remplie de zéros, de sorte que la matrice entière $M$ est une matrice $nm\times nm.$

Or, $M$ n'est certainement pas une matrice unitaire (sauf si $m=1,$ auquel cas $\Pi_0 = \mathbb{I},$ ce qui donne $M = \mathbb{I}$ dans ce cas trivial) car les matrices unitaires ne peuvent pas avoir de colonnes (ou de lignes) entièrement nulles ; les matrices unitaires ont des colonnes qui forment des bases orthonormales, et le vecteur nul n'est pas un vecteur unitaire.

Cependant, il est vrai que les $n$ premières colonnes de $M$ sont orthonormales, et cela découle de l'hypothèse que $\{\Pi_0,\ldots,\Pi_{m-1}\}$ est une mesure. Pour vérifier cette affirmation, remarquons que pour chaque $j\in\{0,\ldots,n-1\},$ le vecteur formé par la colonne numéro $j$ de $M$ est le suivant :

\vert \psi_j\rangle = M \vert 0, j\rangle = \sum_{k = 0}^{m-1} \vert k \rangle \otimes \Pi_k \vert j\rangle.

Notons qu'ici on numérote les colonnes en commençant par la colonne $0.$ Le produit scalaire de la colonne $i$ avec la colonne $j$ pour $i,j\in\{0,\ldots,n-1\}$ donne

\begin{aligned} \langle \psi_i \vert \psi_j \rangle & = \biggl(\sum_{k = 0}^{m-1} \vert k \rangle \otimes \Pi_k \vert i\rangle\biggr)^{\dagger} \biggl(\sum_{l = 0}^{m-1} \vert l \rangle \otimes \Pi_l \vert j\rangle\biggr) \\ & = \sum_{k = 0}^{m-1} \sum_{l = 0}^{m-1} \langle k \vert l \rangle \langle i \vert \Pi_k \Pi_l \vert j\rangle\\ & = \sum_{k = 0}^{m-1} \langle i \vert \Pi_k \Pi_k \vert j\rangle\\ & = \sum_{k = 0}^{m-1} \langle i \vert \Pi_k \vert j\rangle\\ & = \langle i \vert \mathbb{I} \vert j \rangle\\ & = \begin{cases} 1 & i = j\\ 0 & i\neq j, \end{cases} \end{aligned}

ce qui est bien ce qu'on voulait montrer.

Ainsi, comme les $n$ premières colonnes de la matrice $M$ sont orthonormales, on peut remplacer toutes les entrées nulles restantes par d'autres valeurs complexes de sorte que la matrice entière soit unitaire.

U = \begin{pmatrix} \Pi_0 & \fbox{?} & \cdots & \fbox{?}\\[1mm] \Pi_1 & \fbox{?} & \cdots & \fbox{?}\\[1mm] \vdots & \vdots & \ddots & \vdots\\[1mm] \Pi_{m-1} & \fbox{?} & \cdots & \fbox{?} \end{pmatrix}

Si on nous donne les matrices $\Pi_0,\ldots,\Pi_{m-1},$ on peut calculer les matrices appropriées pour remplir les blocs marqués $\fbox{?}$ dans l'équation — en utilisant le procédé de Gram–Schmidt — mais peu importe ce que sont précisément ces matrices pour les besoins de cette discussion.

Enfin, on peut décrire le processus de mesure : on effectue d'abord $U$ sur le système joint $(\mathsf{Y},\mathsf{X})$ puis on mesure $\mathsf{Y}$ avec une mesure dans la base standard. Pour un état arbitraire $\vert \phi \rangle$ de $\mathsf{X},$ on obtient l'état

U \bigl( \vert 0\rangle \vert \phi\rangle\bigr) = M \bigl( \vert 0\rangle \vert \phi\rangle\bigr) = \sum_{k = 0}^{m-1} \vert k\rangle \otimes \Pi_k \vert\phi\rangle,

où la première égalité découle du fait que $U$ et $M$ coïncident sur leurs $n$ premières colonnes. Lorsqu'on effectue une mesure projective sur $\mathsf{Y},$ on obtient chaque résultat $k$ avec probabilité

\bigl\| \Pi_k \vert \phi\rangle \bigr\|^2,

auquel cas l'état de $(\mathsf{Y},\mathsf{X})$ devient

\vert k\rangle \otimes \frac{\Pi_k \vert \phi\rangle}{\bigl\| \Pi_k \vert \phi\rangle \bigr\|}.

Ainsi, $\mathsf{Y}$ stocke une copie du résultat de la mesure et $\mathsf{X}$ évolue exactement comme il l'aurait fait si la mesure projective décrite par $\{\Pi_0,\ldots,\Pi_{m-1}\}$ avait été effectuée directement sur $\mathsf{X}.$