Accueil > Recherche et développement > Stéréovision > Stéréovision par projection sur un plan virtuel (Bernard Couapel)
samedi 2 février 2013, par
Toutes les versions de cet article : [English] [français]
Notre technique s’inscrit dans les approches
géométriques avec pour originalité le fait de
nécessiter des calculs en majeure partie bidimensionnels. Nous
utilisons un Plan Virtuel Intermédiaire Virtuel (VIP) qui est
défini par trois points supposés connus de la
scène. Nous obtenons une disparité entre points
homologues par une double projection du point de l’image homologue
sur l’image de référence en passant par le VIP. Cette
disparité est fonction de la distance du point à la
caméra et de son altitude par rapport au VIP.
This paper presents a geometrical method to calculate the position
of points in 3D space from two different views. Our method is divided
in two steps. The first step is two-dimensional and defines the
epipolar geometry. It calculates a double projection of the
homologous image on the reference image through a Virtual
Intermediate Plane. We use eight corresponding points to calculate
the transformation of the homologous image. The disparity between the
corresponding points in a same referential allows us to get some
information about the position of the 3D points. The second step
calculates the coordinates of points in a projective space. The
calculation of 3D coordinates consists in a simple transformation of
projective to cartesian coordinates with 5 points in the case of a
pinhole camera, and 4 points for the parallel projection. The
interest of our method is to calculate the relative positionning
without any knowledge on 3D coordinates of points, to offer controls
along the calculation and to postpone use of the reference points at
the end of the calculation.
Keywords: stereovision, geometry, calibration, relative
positionning
Un des principaux sujets de recherche en vision par ordinateur
porte sur la stéréovision, c'est à dire le
calcul de points dans l'espace, à partir de leurs images
prises de différentes positions par une caméra de type
sténopé. La première approche de ce
problème consiste à calibrer le système de prise
de vues stéréoscopiques, c'est à dire de
calculer les paramètres intrinsèques des caméras
et leur positionnement relatif. Des travaux dans ce domaine sont
présentés dans [CHAU89] and [HONG91]. C'est aussi la
méthode de calcul utilisée en photogrammétrie
depuis de nombreuses années [CARR71] [HURA60]. Une nouvelle
approche du problème est issue des travaux de [LONG81] qui a
présenté une méthode permettant de calculer la
géométrie épipolaire induite par le
modèle sténopé. Ces travaux ont
été étendus à l'espace par des
méthodes algébriques qui calculent les matrices de
transformation des caméras à l'aide de cinq points de
la scène [FAUG92] [LUON92], et des méthodes
géométriques qui utilisent deux ensembles de quatre
points coplanaires de la scène [MORI93] [MOHR92].
Récemment, [SHAS93] a proposé une méthode de
reconstruction qui utilise quatre points de la scène
définissant un tétraèdre ainsi que le centre de
projection de la caméra comme cinquième point de
référence. L'auteur calcule un invariant projectif et
définit un nouvel élément descriptif: la
distance projective (projective depth).
Notre technique s'inscrit dans les approches
géométriques avec pour originalité le fait de
nécessiter des calculs en majeure partie bidimensionnels. Nous
utilisons un Plan Virtuel Intermédiaire Virtuel (VIP) qui est
défini par trois points supposés connus de la
scène. Nous obtenons une disparité entre points
homologues par une double projection du point de l'image homologue
sur l'image de référence en passant par le VIP. Cette
disparité est fonction de la distance du point à la
caméra et de son altitude par rapport au VIP.
La première étape de notre méthode est décrite dans le chapitre 3 de cet article. Elle permet de calculer l'épipôle et le recalcul de l'image homologue par rapport à l'image de référence à l'aide de 8 couples de points appariés sur les deux images. La seconde étape décrite dans le chapitre 4 calcule de positionnement relatif des points dans un espace projectif défini par cinq points de la scène supposés connus. Les coordonnées cartésiennes sont obtenues à la fin de l'algorithme par un simple changement de repère projectif - cartésien, en utilisant les coordonnées de cinq points de la scène dans le cas du modèle sténopé, et quatre points pour la projection parallèle.
Notre méthode a pour avantages d'offrir des autocontrôles sur la validité des appariements de points, et aussi le fait que le recalcul de l'image homologue donne des informations directement interprétables sur le positionnement des points dans l'espace. Cette transformation de l'image homologue est d'autre part très utile pour la mise en correspondance des deux images, puisque les images des points 3D appartenant au VIP sont directement mis en correspondance.
Pour décrire notre méthode de calcul, nous
utiliserons les notations suivantes.
Les coordonnées cartésiennes sont notées en
minuscules et les coordonnées projectives en majuscules. Pour
chaque point décrit ci-dessous, nous donnons les
coordonnées cartésiennes et projectives
correspondantes.
Nous utilisons deux caméras S et S', et l'homologue d'un
élément x de S est noté x' sur S'.
Pour la caméra S, le plan image est noté Q, le centre
de projection: C (xc,yc,zc) ou (Xc,Yc,Zc,Tc), l'épipôle:
E (xe,ye) ou (Xe,Ye,Ze), et les points images: Mi (xi,yi) ou
(Xi,Yi,Zi).
Les points 3D sont notés Pi (xi*,yi*,zi*) ou
(Xi*,Yi*,Zi*,Ti*).
Nous utilisons un Plan Virtuel dans l'espace, noté VIP. Les
points sur le VIP sont notés en minuscule.
Les deux homographies correspondant aux projections de Q sur VIP par
C et Q' sur VIP par C' sont notées respectivement H1 et
H2.
Le recalcul d'un point Mi' de Q' sur Q après double projection
par le VIP est noté Mi" (xi",yi") ou (Xi",Yi",Zi").
Notre méthode s'appuie sur deux images stéréoscopiques. L'une est appelée image de référence et reste inchangée pendant les calculs. Elle correspond au plan image Q de la caméra S. La seconde est appelée image homologue. Elle est transformée pendant les calculs et correspond au plan image Q' de la caméra S'.
Dans les figures qui suivent, nous prenons comme convention que le
centre de projection se trouve en avant du plan image, ce qui
diffère des représentations habituelles.
Les relations entre les points dans l'espace et leurs images sur les
plans de projection sont présentées Fig1. Les cinq
points P1,C,C',M1 and M1' sont coplanaires et définissent la
géométrie épipolaire [LONG81] qui décrit
deux faisceaux de droites homologues se coupant à
l'intersection des deux plans images dans l'espace. Les droites
homologues sont appelées droites épipolaires homologues
et les centres de ces faisceaux épipôles. Les
épipôles sont définis par l'intersection de la
droite passant par les centres de projection et les plans images.
Cette géométrie induit des contraintes que nous
utilisons au cours de cette présentation.
La figure 2 présente un cas simplifié de stéréovision dans lequel les deux plans de projection sont confondus avec un plan de l'espace défini par trois points (non alignés). Dans ce cas, il n'y a qu'un seul épipôle e.
Le calcul d'un point P est facilement obtenu par l'intersection
des droites {C,M} et {C',M'} dans l'espace.
Si les positions de C et C' sont inconnues, il est possible de les
calculer si l'on connaît les positions de deux points P1 et P2
ainsi que leurs images (M1,M1') (M2,M2') sur Q. C est obtenu par
l'intersection de {P1,M1} et {P2,M2}, et C' par l'intersection de
{P1,M1'} et {P2,M2'}. Nous avons au total utilisé trois points
pour définir Q et deux points pour calculer les centres de
projection.
Notre but est de ramener le cas général de
stéréovision à ce cas particulier.
Le cas général de stéréovision est
présenté figure 3. Nous ne savons pas où sont
situés les deux plans de projection dans l'espace, mais le
modèle sténopé induit une
géométrie épipolaire, et la coplanarité
de tous les points représentés sur la figure 3.
Nous ramenons ce cas général de
stéréovision au cas particulier présenté
au paragraphe précédent en utilisant un Plan
Intermédiaire Virtuel (VIP) dans l'espace.
Notre méthode de calcul est divisée en deux étapes:
La première partie détermine la géométrie épipolaire en s'appuyant sur l'homographie H liant bijectivement les plans images par les deux projections qui s'appuient sur le plan virtuel. H est la composition de la projection H2 de Q' par C' sur le VIP et de la projection H1 du VIP sur Q par C. H est telle que pour un point P du VIP, M"=H(M') est confondu avec M sur Q. En revanche, si ce point n'est pas sur le VIP, alors la droite {M,M"} intersecte l'épipôle E sur Q. La définition de H est obtenue avec huit couples de points homologues sur Q et Q'.
La seconde étape consiste à projeter Q et H(Q') sur le VIP et à calculer la position de C et C' dans l'espace. Ceci nous ramène alors au cas particulier présenté au début de ce chapitre. Les calculs nécessitent la connaissance de cinq points non coplanaires de l'espace ainsi que leurs images, mais si on considère ces points comme base d'un espace projectif il est possible de calculer les points de la scène dans cet espace et obtenir ainsi leur positionnement relatif sans utiliser d'information 3D. On se ramène ainsi aux solutions proposées par Faugeras, Hartley et Mohr.
Le projection H1 de Q sur VIP par C et la projection H2 de Q' sur VIP par C' correspondent à des homographies de plan à plan.
Propriétés des homographies [EFIM81]:
- un homographie non dégénérée est une
application bijective définie par une matrice inversible.
- les homographies forment un groupe, donc une composition
d'homographies, ou l'inverse d'une homographie est aussi une
homographie.
- une homographie conserve le birapport de quatre points
alignés.
Nous calculons la composition H des projections H2 et H1-1 qui
transforment les points Mi' dans Q' en points Mi" sur Q. Cette double
projection est une homographie avec les propriétés
suivantes:
1) Pour les points Pi qui appartiennent au VIP, les transformés Mi"=H(Mi') sur Q des images Mi' sur Q' sont confondus avec les points Mi sur Q.
2) Pour les points Pi qui n'appartiennent par au VIP, le transformé Mi"=H(Mi') est aligné avec la droite {Mi,E} sur Q.
Les projections des trois points définissant le VIP sont choisis comme les trois premiers points (M1,M2,M3 / M1',M2',M3') de la base projective de chaque image (a qui il faut ajouter un quatrième point pour compléter la base). Chacun de ces triplets est appelé triplet des points de base. On leur affecte respectivement les coordonnées homogènes (0,0,1), (0,1,0), (1,0,0). Si nous choisissons comme point unitaire (1,1,1) de la base projective le barycentre de ces trois points, alors les coordonnées cartésiennes (xi,yi) sur Q sont transformées en coordonnées projectives (Xi,Yi,Zi) par la matrice:
|Xi| |x1 x2 x3|-1 |xi| |
Nous construisons une matrice similaire pour Q' avec les coordonnées des points homologues.
Les points (M1,M2,M3) sur Q et (M1',M2',M3') sur Q' ont les coordonnées projectives:
M1 (0,0,1), M2 (0,1,0) M3 (1,0,0)
M1'(0,0,1), M2'(0,1,0) M3'(1,0,0)
Première propriété de H:
H(M1') = M1, H(M2')=M2, H(M3')=M3
H(0,0,1)=(0,0,1), H(0,1,0)=(0,1,0), H(1,0,0)=(1,0,0)
L'homographie H est donc réduite à la matrice:
| a 0 0 | |
avec a.b.c différent de 0.
Tous les points de Q et Q' sont exprimés en coordonnées projectives avec leur matrice respective.
Seconde propriété de H:
Pour les points Pi qui n'appartiennent par au VIP, le transformé Mi"=H(Mi') est aligné avec la droite {Mi,E} sur Q. Ces points sont appelés points secondaires. L'alignement {Mi,Mi",E} avec l'épipôle E (Xe,Ye,Ze) donne l'équation:
|Xi a.Xi' Xe| |
Soit:
|
Nous éliminons les coordonnées de E pour obtenir une meilleure stabilité. Pour chaque équation, nous prenons trois couples de points secondaires d'indices i,j,k (différents entre eux et supérieurs à 3 pour ne pas utiliser les points de base qui sont confondus par définition), ce qui donne le nouveau système d'équations:
|c.Yi.Zi'-b.Yi'.Zi
a.Zi.Xi'-c.Zi'.Xi b.Xi.Yi'-a.Xi'.Yi| |
Avec n points, nous construisons C(n,3) équations de ce type, qui correspondent à un système d'équations avec les variables liées a, b, c:
|
Dans lequel les variables liées peuvent
s'écrire:
xa=b/c, xa'=c/b, xb=c/a, xb'=a/c, xc=a/b, xc'=b/a,
soit:
|
Avec xa.xa' = xb.xb' = xc.xc' = 1
Nous résolvons le système par la méthode des
moindres carrés et nous obtenons deux autocontrôles:
- Le résidu des moindres carrés LSQ du système
à C(n,3) équations
- L'erreur de cohérence des variables liées qui doivent
respecter la contrainte xa.xa' = xb.xb' = xc.xc' = 1, notée
ERRCOEF.
Ces deux valeurs sont faibles si les points respectent la contrainte
épipoplaire. Elles nous renseignent donc sur la qualité
de l'appariement des points entre les deux images.
Nous calculons une solution avec 8 couples de points qui forment
3 paires de points de base définissant le plan virtuel VIP
5 paires de points secondaires qui forment C(5,3) = 10
équations linéaires
Comme les coefficients a,b,c sont calculés à un facteur
près (espace projectif), nous fixons c=1 et obtenons les
coefficients a, b ainsi que les autocontrôles décrits
ci-dessus. Nous calculons les épipôles E et E' qui ont
les mêmes coordonnées projectives en reprenant
l'équation 1.
Cette résolution nous permet de recalculer l'image homologue
et de la superposer avec l'image de référence Q. Les
couples de points de base sont superposés et les couples de
points secondaires alignés avec l'épipôle. Toutes
les images Mi,Mi" des points Pi appartenant au VIP sont confondues,
et les autres sont alignées avec l'épipôle. Les
droites épipolaires homologues sont superposées, nous
avons résolu le problème de la géométrie
épipolaire.
Les cas de dégénérescence se
présentent:
- lorsque les trois points de base sont alignés, dans ce cas
la base projective est dégénérée et le
VIP n'est pas défini. il est donc impossible de
résoudre le système d'équation pour calculer
l'épipôle.
- lorsque tous les points appartiennent au VIP, dans ce cas les
points Mi et Mi" sont confondu sur Q et ne permettent pas de calculer
l'épipôle. Notons cependant qu'il fournit des droites
conjuguées passant par le même point.
Nous avons utilisé notre méthode sur différents types d'images et nous présentons un exemple de solution avec deux images d'une pyramide. Les points de base qui définissent le VIP sont pris sur la base de la pyramide, et l'on peut observer la transformation de l'image homologue par l'homographie calculée. Tous les points de la base de la pyramide sont confondus et la disparité entre les autre points homologues Mi,Mi" est fonction de l'altitude du point Pi par rapport au VIP et de la distance de Pi avec la caméra.
|
|
![]() Image homologue transformée (3) |
![]() Superposition de (1) et (3) |
Dans les figures suivantes, nous présentons l'influence du choix des points de base sur le recalcul de l'image homologue. Pour chaque cas, les points de base correspondent aux sommets du triangle dessiné sur la superposition des images de référence et homologue recalculée. Les quatre exemples différents de position du VIP dans l'espace montrent la variation de la disparité entre les points Mi et Mi" en fonction de la distance (Pi - VIP). Notons que pour le troisième exemple, la mise en correspondance à l'intérieur du triangle défini par les points de base est réalisée puisque le VIP correspond à une facette de la pyramide.
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
Image de référence (1)
|
Image homol.transf.(2)
|
Superposition de (1) et (2)
|
Les éléments que nous utilisons dans cette seconde étape sont présentés dans la figure 4. Nous utilisons les coordonnées 3D de cinq points non coplanaires Pi ainsi que leurs images Mi et Mi" sur Q.
Pour nous ramener au cas simplifié de stéréovision présenté dans le chapitre 2 de cet article, nous devons projeter le plan image Q sur le VIP et calculer les coordonnées des centres de projection C et C'.
Nous utilisons les images {M1,M2,M3} et {M1',M2',M3'} des points 3D {P1,P2,P3} comme repère projectif sur Q et Q' avec pour point unitaire le centre de gravité respectif de chaque triplet, comme dans le chapitre précédent. Puisque nous avons calculé l'homographie H entre Q et Q' correspondant à cette double projection utilisant le VIP, nous pouvons transformer les coordonnées de Q' en coordonnées H(Q') sur Q. Nous n'avons plus qu'une seule projection à réaliser de Q sur VIP par C.
Si nous considérons les points {P1,P2,P3,P4,P5}
supposés connus comme base projective R dans l'espace, les
coordonnées projectives des points sont:
P1 (1,0,0,0), P2 (0,1,0,0) P3 (0,0,1,0) P4 (0,0,0,1) P5 (1,1,1,1) et
un point Pi dans R a pour coordonnées Pi(Xi,Yi,Zi,Ti).
Le plan virtuel VIP est défini par les trois points (P1,P2,P3). L'équation de ce plan est T=0 et la projection H1 de Q sur le VIP est définie par une homographie à deux paramètres u et v comme pour Q et Q'. Nous devons aussi calculer les coordonnées des centre de projection que nous pouvons écrire C: (Xc,Yc,Zc,1) et C': (Xc',Yc',Zc',1). Nous avons donc au total 8 inconnues à calculer pour définir la projection de Q sur le VIP et les coordonnées projectives de C et C' dans le référentiel R.
Les projections H1 de {M1,M2,M3,M4,M5} et {M1",M2",M3",M4",M5"} sur le VIP ont pour coordonnées m1=m1"(1,0,0,0), m2=m2"(0,1,0,0), m3=m3"(0,0,1,0), m4(u.x4,v.y4,z4,0), m4"(u.x4",v.y4",z4,0), m5(u.x5,v.y5,z5,0), m5"(u.x5",v.y5",z5",0) dans R.
Les contraintes utilisées sont les alignements des points (m4,P4,C), (m4",P4,C'), (m5,P5,C) et (m5",P5,C'). Chaque droite ainsi définie dans l'espace projectif R peut se décrire par l'intersection de deux plans, c'est à dire deux équations
Nous obtenons donc un système de 8 équations à 8 inconnues qui nous donne une solution unique qui définit la projection H1 de Q sur le VIP par C ainsi que les coordonnées projectives de C et C'.
Après recalcul de l'image homologue Q' sur Q par H, nous avons ainsi un moyen simple de calculer les coordonnées projectives d'un point P inconnu en utilisant les coordonnées projectives de ses deux images M et M" sur Q. Il suffit de transformer les coordonnées en m=H1(M), m"=H1(M"), puis de calculer l'intersection dans R des droites (C,m) et (C',m"). Le résultat nous donne les coordonnées projectives de P. Les coordonnées cartésiennes sont obtenues par l'application d'une matrice (4x4) coordonnées projective -> cartésiennes sur les coordonnées projectives de P.
Nous avons ramené le problème général de la stéréovision au cas particulier présenté au début du chapitre 2. Nous pouvons calculer le positionnement relatif des points dans un espace projectif si le coordonnées 3D des 5 points formant le référentiel projectif sont inconnues, et nous obtenons les coordonnées cartésiennes si les 5 points sont connus dans l'espace. L'utilisation des coordonnées 3D est reporté à la fin des calculs, ce qui évite la propagation des erreurs d'approximation des points dans l'espace.
La projection parallèle est un cas simplifié de modèle sténopé car les centres de projection C et C' sont rejetés à l'infini, ainsi que les épipôles E et E'. Il ne faut donc calculer que les directions de projection sur Q et Q'. Il suffit donc de quatre points non coplanaires dans l'espace pour résoudre le problème. La position dans l'espace d'un points P est obtenue en calculant l'intersection des deux parallèle à (m4,P4) et (m4",P4) passant respectivement par m et m' comme le montre la figure 5. On retrouve ainsi le résultat de Koenderink et Van Doorn sur les caméras affines [KOEN89].
Dans ce cas particulier, nous n'avons pas besoin de calculer la double projection de Q' sur Q, nous convertissons les coordonnées images en coordonnées barycentriques par rapport aux points {M1,M2,M3} pour Q et {M1',M2',M3'} pour Q'. Ensuite, nous revenons aux coordonnées cartésiennes par rapport aux points {P1,P2,P3} sur le VIP.
|x| |x1 x2 x3| |X| |
Méthode de calcul
1) Transformation des coordonnées images en
coordonnées barycentriques par rapport à {M1,M2,M3}
pour les points Mi sur Q, et par rapport à {M1',M2',M3'} pour
les points Mi' sur Q'.
2) Transformation des coordonnées barycentriques des points Mi
et Mi' en coordonnées cartésiennes mi and mi' sur le
VIP par rapport à {P1,P2,P3,P4}.
Le points de l'espace P4 et ses images sur le VIP sont connues, donc
(m4,P4) et (m4',P4) définissent les deux directions des
projections parallèles.
3) Tout point P est calculé par l'intersection des
parallèles à (m4,P4) et (m4',P4) passant respectivement
par m et m'.
Nous avons testé les deux méthodes de calcul sur
différents objets et nous présentons ci-dessous les
résultats obtenus sur l'exemple pyramide. Trois sources
d'erreurs perturbent l'évaluation des points dans
l'espace:
1) La camera n'est pas un vrai modèle sténopé et
les plans images présentent des distorsions.
2) La position des points homologues sur les images peuvent subir des
erreurs d'évaluation allant jusqu'à trois pixels.
3) Les points 3D ont été mesurés à la
règle et peuvent comporter des erreurs d'approximation.
Le but de cet expérimentation n'est pas d'obtenir la meilleure
précision possible, mais d'évaluer
l'intérêt de notre méthode de calcul dans de
conditions courantes d'utilisation
La profondeur de l'objet est d'environ 10 cm et la caméra est
située à environs un mètre de l'objet. Le
tableau 1 présente la position des points mesurés sur
les images (X,Y), (X',Y') et sur l'objet (X3D,Y3D,Z3D).
X |
Y |
X' |
Y' |
X3D |
Y3D |
Z3D |
15 |
150 |
89 |
41 |
0 |
0 |
0 |
454 |
106 |
395 |
186 |
5 |
8.8 |
0 |
343 |
188 |
169 |
202 |
7.5 |
4.4 |
0 |
164 |
34 |
255 |
26 |
2.5 |
4.4 |
5 |
93 |
128 |
121 |
61 |
2.5 |
1.1 |
1.9 |
306 |
100 |
272 |
126 |
4.8 |
5.8 |
2.1 |
336 |
50 |
457 |
97 |
0 |
8.8 |
0 |
112 |
213 |
16 |
124 |
5 |
0 |
0 |
206 |
133 |
157 |
111 |
4.7 |
3.2 |
2 |
312 |
58 |
370 |
96 |
2.1 |
7.2 |
1.9 |
La première étape de calcul pour la double
projection de Q' sur Q par le VIP donne:
Homographie correspondant à la composition des deux
projections: a=0.997 b=0.986 c=1 LSQ=0 ERRCOEF=0.03
Position des epipôles sur Q et Q': E=(1860, -1177) E'=(1573,
-922)
L'erreur des moindres carrés LSQ et l'erreur sur les
coefficients ERRCOEF est faible et valide le choix des points
homologues sur les images, nous pouvons appliquer la deuxième
étape du calcul.
Les tableaux 1 et 2 présentent les résultats obtenus
pour le calcul des points dans l'espace avec le modèle
sténopé et la projection parallèle. Chaque ligne
d'un tableau présente la position d'un point mesuré sur
l'objet (Xréel,Yréel,Zréel) (qui correspond au
point du tableau 1), le point calculé (Xcalc,Ycalc,Zcalc),
l'erreur des moindres carrés LSQ issue de l'intersection des
deux droites dans l'espace (4 équations et 3 variables) ainsi
que la distance entre le point mesuré et le point
calculé.
Xreal |
Yreal |
Zreal |
Xcalc |
Ycalc |
Zcalc |
LSQ |
dist. |
0.00 |
0.00 |
0.00 |
0.00 |
0.00 |
0.00 |
0.00 |
0.00 |
5.00 |
8.80 |
0.00 |
5.00 |
8.80 |
0.00 |
0.00 |
0.00 |
7.50 |
4.40 |
0.00 |
7.50 |
4.40 |
0.00 |
0.00 |
0.00 |
2.10 |
7.20 |
1.90 |
2.10 |
7.20 |
1.90 |
0.00 |
0.00 |
2.50 |
4.40 |
5.00 |
2.50 |
4.40 |
5.00 |
0.00 |
0.00 |
2.50 |
1.10 |
1.90 |
2.52 |
1.53 |
1.82 |
18.21 |
0.44 |
4.80 |
5.80 |
2.10 |
4.90 |
5.70 |
2.17 |
17.08 |
0.16 |
0.00 |
8.80 |
0.00 |
-0.94 |
8.72 |
-0.29 |
1.07 |
0.99 |
5.00 |
0.00 |
0.00 |
4.42 |
0.12 |
-0.48 |
3.61 |
0.76 |
4.70 |
3.20 |
2.00 |
5.00 |
3.17 |
2.07 |
41.42 |
0.31 |
Homographie entre l'image Q et le VIP: u=0.0174 v=0.0183
w=0.017
Position des centres de projection: C=(50,5, -5.9, 37.9) C'=(79.9,
26.3, 80.7)
Somme des distances entre les points mesurés et les points
calculés: 2.6 cm, soit une erreur moyenne de 2,6 mm.
Xreal |
Yreal |
Zreal |
Xcalc |
Ycalc |
Zcalc |
LSQ |
dist. |
0.00 |
0.00 |
0.00 |
0.00 |
0.00 |
0.00 |
0.00 |
0.00 |
5.00 |
8.80 |
0.00 |
5.00 |
8.80 |
0.00 |
0.00 |
0.00 |
7.50 |
4.40 |
0.00 |
7.50 |
4.40 |
0.00 |
0.00 |
0.00 |
2.10 |
7.20 |
1.90 |
2.10 |
7.20 |
1.90 |
0.00 |
0.00 |
2.50 |
4.40 |
5.00 |
1.80 |
4.32 |
5.10 |
0.03 |
0.71 |
2.50 |
1.10 |
1.90 |
2.08 |
1.38 |
1.80 |
0.02 |
0.51 |
4.80 |
5.80 |
2.10 |
4.52 |
5.72 |
2.16 |
0.00 |
0.30 |
0.00 |
8.80 |
0.00 |
0.00 |
8.54 |
-0.06 |
0.00 |
0.27 |
5.00 |
0.00 |
0.00 |
4.44 |
-0.14 |
-0.46 |
0.03 |
0.74 |
4.70 |
3.20 |
2.00 |
4.54 |
3.04 |
2.09 |
0.02 |
0.24 |
Distance totale entre les points mesurés et les points
calculés: 2.7 cm. Ce qui correspond à une erreur
moyenne de 2,7 mm.
Les tableau 2 et 3 présentent les résultats pour les
deux modèles de projection sur le même couple d'images
stéréoscopiques. La reconstruction des points est
presque identique. Ceci est dû au fait que si l'objet est
compact et observé d'une distance suffisamment grande (plus de
dix fois la profondeur le l'objet), alors il est possible
d'approximer la projection par une projection parallèle sans
trop d'erreur. Les avantages du modèle parallèle sont
une meilleure stabilité que le modèle
sténopé, ainsi que l'utilisation de quatre points de la
scène au lieu de cinq.
La position calculée des centres de projection pour le
modèle sténopé est aberrante, bien que la
reconstruction soit acceptable puisque l'erreur de positionnement est
de l'ordre de 3% par rapport à la taille de l'objet. Ceci pose
le problème de la stabilité de notre méthode de
reconstruction, qui pourrait être améliorée par
l'utilisation d'un nombre plus important de points de la scène
et l'utilisation de modèles de déformation pour les
plans images.
La méthode de reconstruction d'une scène
tridimensionnelle par projection sur un plan virtuel de l'espace
présente plusieurs avantages:
- Le calcul de la géométrie épipolaire nous
donne des autocontrôles sur la validité du choix des
points homologues sur l'image.
- La reconstruction des points 3D peut être obtenue en
connaissant la position de 5 points de la scène dans le cas du
modèle sténopé, et 4 points pour la projection
parallèle. Si les points de la scène sont inconnus, il
est tout de même possible de calculer le positionnement relatif
des points dans l'espace comme dans d'autres méthodes [SHAS93]
[FAUG92] [LUON92].
- Le recalcul de l'image homologue par rapport à l'image de
référence est un premier pas vers la mise en
correspondance. Son avantage est de représenter les deux
images dans un même référentiel et de superposer
tous les points correspondant au VIP dans l'espace. Cette
transformation est utilisée en coopération avec un
critère de ressemblance de forme entre contours, pour extraire
automatiquement des points homologues sur les deux images. Cette
technique sera présentée dans un prochain article qui
est détaillé dans [COUA94].
- Cette approche permet aussi de calculer en 2D un modèle
à facettes et présente l'avantage d'une
évaluation simple des disparités puisque tous les
points homologues sont confondus lorsque le VIP correspond à
un plan de l'objet dans l'espace.
Le but principal de notre travail actuel est d'obtenir une meilleure
stabilité en utilisant des modèles de
déformation sur les plans images et en augmentant le nombre de
points connus dans l'espace.
Je remercie Mr Eugene Duclos, professeur de mathématiques pour son aide au cours de ce travail
1. [AYAC89] Ayache , Nicholas. Vision st,r,oscopique et perception multisensorielle.
Inter ,ditions science informatique (1989).
2. [CARR71] Carr,, Jean. Lecture et exploitation des photographies a,riennes.
Editions EYROLLES Paris (1971).
3. [CHAU89] Chaumette, Fran[daggerdbl]ois. R,alisation et calibration d'un syst[Sinvcircumflex]me
exp,rimental de vision compos, d'une cam,ra mobile embarqu,e sur un robot manipulateur.
Rapport de recherche INRIA Rennes nø994 Mars 1989
4. [COUA94] Couapel, Bernard. St,r,ovision par ordinateur, g,om,trie et exp,rimentation.
Th[Sinvcircumflex]se en informatique, Univerist, de Rennes 1 (1994).
5. [DUDA70] Duda, Richard.O. HART, Peter E. Pattern classification and scene
analysis. Artificial intelligence group. Stanford research institute Menlo Park
California December 1970
6. [EFIM81] Efimov. G,om,trie sup,rieure. Traduction francaise, ,ditions Mir
Moscou (1981).
7. [FAUG92] Faugeras, Olivier. What can be seen in three dimensions with an
uncalibrated stereo rig ? Computer vision ECCV '92. Lecture notes in computer
science 588. Springer Verlag (1992).
8. [FAN_91] Fan, Hong. Yuan, Baozong. An accurate and practical camera calibration
system for 3D computer vision Chinese journal of elctronics, June 1991.
9. [HURA60] G,n,ral Hurault, L. L'examen st,r,oscopique des photographies a,riennes.
Imprimerie de l'IGN Paris (1960).
10. [LONG81] Longuet - Higgins,H.C. A computer algorithm for reconstructing
a scene from two projections. Nature Vol. 293, 10 september 1981.
11. [LUON92] Luong,Quang Tuan. Matrice fondamentale et calibration visuelle
sur l'environnement. Th[Sinvcircumflex]se en informatique. Universit, de Paris
Sud Centre d'Orsay (1992).
12. [MOHR92] Mohr, Roger., Morin, Luce. Geometric solutions to some 3D vision
problems. LIFIA - IMAG Grenoble (1992).
13. [MOHR93] Mohr, Roger. Projective geometry and computer vision. Handbook
of Pattern Recognition and Computer Vision. World Scientific Publishing Company
(1993).
14. [MORI93] Morin, Luce. Quelques contributions des invariants projectifs ...
la vision par ordinateur. Th[Sinvcircumflex]se en informatique. Institut National
de Polytechnique de Grenoble (1993).
15. [SHAS93] Shashua, Amnon. Projective depth: a geometric invariant for 3D
reconstruction from two perspective / orthographic views and for visual recognition.
IEEE Feb. 1993