|
|
 |
|
 |
|

Intervenants
|
|
LISTE DES CONFERENCIERS
- Horst Bischof, Institute for Computer Graphics and Vision , TU Graz
Sujet : Solving Vision Tasks with Variational Methods on GPUs
This lecture will present novel solutions to long standing computer
vision problems by means of variational methods. We present robust
methods for optical flow calculation, the correspondence problem for
stereo matching, depth map integration and interactive segmentation
methods. The variety of topics that can be handled by these methods
demonstrate the wide applicability of variational methods.
In addition, modern graphics hardware (GPUs) allow to compute solutions
to these problems very efficiently and in some cases (e.g. optical flow)
even in real-time. Having real-time solutions opens several new
applications areas (e.g. industrial imaging), interactive medical
segmentation, etc. Some of these will be presented during the talk.
- James Fung, NVIDIA Santa Clara
Sujet : video panorama stitching demo on the GPU
As a massively parallel processor, the GPU is well-suited for performing
'per-pixel' operations in image processing and computer vision. However,
new changes in hardware, software, afford new algorithm mappings which go
beyond per pixel operations and allow entire vision algorithms to be
performed solely on GPU. In this session we will present GPU hardware and
programming environment features that support image processing and
computer vision on the GPU. In particular, new features on the Fermi
architecture and in the CUDA-C programming environment that support high
performance image processing will be discussed.
- Patrick Horain, Télécom Sud-Paris
Sujet : GpuCV: Accélération par processeur graphique pour le traitement d'image
et la vision artificielle (video demo), télécharger Le Fichier Zip
Nous décrirons brièvement l'état de l'art de l'utilisation des
processeurs graphiques grand public (GPU) pour accélérer le traitement
d'image, et nous en discuterons les limites. Puis, nous décrirons GpuCV,
une bibliothèque logicielle libre et multi-plateforme pour accélérer par
GPU les opérateurs de traitement d'image et de vision artificielle.
GpuCV a été conçue pour être compatible avec la bibliothèque OpenCV et
permettre d'intégrer facilement des opérateurs accélérés sur GPU dans
des applications développées sur CPU. L'environnement GpuCV gère de
façon transparente les caractéristiques du matériel, la synchronisation
des données, l'activation à bas niveau des procédures GLSL ou CUDA,
l'étalonnage et l'aiguillage vers la mise en oeuvre la plus performante
et finalement offre un ensemble d'opérateurs de traitement accélérés par
GPU.
- Julien Bert, INSERM Brest
Sujet : Le GPU dans les sciences du vivant et de la santé
Ces dernières années le calcul sur cible GPU a pris une dimension inégalée dans les sciences du vivant et de la santé. Nous évoquerons les espoirs engendrés par ce type d’architecture notamment en imagerie médicale et en bioinformatique. Un exemple concret et complet de parallélisassion sur GPU sera présenté. La méthode, utilisée en biologie structurale par cryo-microscopie électronique, permet la classification de milliers d’images de protéines par optimisation (algorithme de k-means couplé à un recuit simulé). Nous expliquerons comment il est possible d’utiliser la bibliothèque d’algèbre linéaire CUBLAS pour faire des opérations arithmétiques entre images. Nous détaillerons également la stratégie utilisée pour tirer partie de la puissance de plusieurs GPUs. Les performances seront comparées entre des clusters de différents types (CPUs, CPUs+GPUs). Ces performances nous permettront de dresser la force d’une telle implémentation ainsi que ses limites.
- Frédéric Champagnat, ONERA, Châtillon
Sujet : flot optique rapide sur grandes images par GPU et applications
Cette présentation concerne l'estimation de flot optique haute cadence sur grandes images et l'utilisation de cette primitive dans diverses applications par intégration temporelle: vélocimétrie par imagerie de particules, super-résolution, détection d'objet en mouvement, structure from motion.
Une démonstration "on stage" de l'algorithme de flot optique,
le coeur algorithmique de ces applications, sera proposée en fin de séance.
- David Defour, Univ. Perpignan
Sujet : Arithmétique et processeur graphique
L'actuel succès des processeurs graphiques repose sur la facilité d'accès à une formidable puissance de calcul. Aujourd'hui, tout un chacun peut disposer librement de puce capable de plusieurs teraflops dans son PC. Cependant, leur exploitation n'est pas sans poser de nombreux problèmes dont il faut avoir conscience.
Après un bref aperçu des capacités de calcul des nouvelles générations de GPU, nous nous focaliserons sur le problème de l'utilisation de la puissance disponible vue sous l'angle de l'efficacité, de la qualité et de la confiance des calculs.
- Lionel Lacassagne, IEF Paris
Sujet : comparaisons GPU/CPU
Cet exposé présente une évaluation des performances de 3 classes
architectures actuelles : processeurs généralistes multicoeurs (GPP),
carte graphique (GPU) et processeur Cell. L’algorithme retenu est
l’opérateur de Harris pour sa représentativité du traitement d'image
bas niveau (opérateurs ponctuels et convolutions). Le but est de
guider l’utilisateur dans le choix d’une architecture parallèle et d’
évaluer l’impact des différentes transformations afin d’avoir une
implantation en adéquation avec l’architecture.
- Nicolas Gac, SUPELEC-LSS Paris
Sujet : Accélération d'algorithmes itératifs de traitement d'images sur GPUs
(tomographie CT et restauration d'image)
Les algorithmes itératifs de reconstruction d’images (notamment en
tomographie X) et de restauration d’images (élimination du bruit et du
flou introduits par les systèmes imageurs) offrent une très bonne
qualité d’image au prix d’un coût de calcul bien souvent trop important
(plusieurs heures voire jours de calcul) pour être employés en pratique.
Pour chacun de ces algorithmes itératifs, les opérateurs de base
(convolution pour la restauration d'images et projection/rétroprojection
pour la tomographie CT) ont été implémentés sur GPUs, ce qui a permis
d’accélérer de manière significative ces algorithmes (d’un facteur 10 à
100). Par ailleurs, la mise en oeuvre de la parallélisation sur un
serveur 8 GPUs avec une bonne gestion des transferts de données entre le
CPU et les GPUs nous a permis d'obtenir un facteur d'accélération
supplémentaire.
- Marius Vasiliu, IEF
Sujet : Analyse temps-réel de flux vidéo automotive
L'exposé présente en détail l'implantation, sur des architectures
multi-GPU fixes ou embarquées, de plusieurs blocs de traitement d'images
destinés à l'analyse des scène routières en vue de l'aide actif à la
conduite (projet ANR LOVe). L'application exploite l'ensemble des
ressources de calcul, de communication et d'affichage offert par Cuda
dans contexte d'une architecture multiprocesseur asynchrone (multi-CPU
et multi-GPU). L'exposé montre l'approche up-down dans le découpage
fonctionnel des algorithmes (calibration et rectification, calcul de
disparité stéréo, calcul d'histogrammes de U et V disparité, détection
de la position de la route, affichage etc.), l'optimisation par
Cuda-Profiler ainsi que leur implantation spécifique avec allocation de
ressources en vue de la maximisation du degré de parallélisme actif
réellement obtenu.
- Eric Chauvineau, VEGA Technologies Toulouse
Sujet : Traitement d'images d'observation de la Terre sur GPU
VEGA Technologies présente les résultats d'une étude R&T émise par le
CNES en 2008 et portant sur l'utilisation des processeurs graphiques
pour les traitements d'imagerie spatiale à la volée. Cette étude,
achevée en mai 2009 s'est scindée en deux phases : tout d'abord une
étude large des possibilités des GPU quant au traitement d'image (état
de l'art et étude de faisabilité) puis un portage complet (incluant la
fourniture du matériel) de trois algorithmes sur GPU permettant à la
fois de mesurers les gains de performances (jusqu'à x50) et de valider
les résultats obtenus. Cette étude, terminée de puis près d'un an a
permis au CNES de lancer une phase de portage massif de bibliothèques de
traitements d'images vers le GPU.
- Cyril Crassin, Inria Rhones-Alpes
Sujet : GPU et rendu haute performance
Le domaine de l'informatique graphique et en particulier le rendu temps-réel sont en train de vivre une véritable mutation de pars l'évolution des GPU vers des architectures génériques de calcul parallèle. Cette évolution ouvre la voie vers l'utilisation de nouvelles structures de données et de toutes nouvelles méthodes de rendu temps réel très éloignées du pipeline graphique historiquement implémenté par les GPU.
Dans ce contexte, nous développons GigaVoxels, un pipeline de rendu de voxels haute performance implémenté avec CUDA. Cet exposé présentera les problématiques de calcul parallèle soulevées dans ce contexte: codage et parcours de structure hiérarchique, utilisation des caches, ordonnancement, gestion de données out-of-core.
- David Michea, BRGM Orléans
Sujet : Calcul scientifique haute performance sur GPU(s)
Le monde du calcul scientifique haute performance, historiquement très gros consommateur de ressources de calcul s'intéresse de plus en plus aux approches GPGPU avec l'arrivée des premières grappes de machines hybrides GPU+CPU. Les codes de simulation de phénomènes physiques effectuent la plupart du temps des calculs dans des domaines à 4 dimensions et exhibent très souvent un grand parallélisme de données (modèle SIMD), ce qui en fait des candidats naturels à un portage sur GPU.
Pour cette école d'été, on présentera le portage de deux codes de propagation d'ondes sismiques sur cartes graphiques NVIDIA en utilisant l'API CUDA. Ces codes utilisent deux méthodes différentes de discrétisation : méthode des éléments spectraux (éléments finis) et méthode des différences finies. Chaque méthode pose des problématiques différentes qui appellent des solutions personnalisées. On discutera des problèmes rencontrés et des choix réalisés afin d'optimiser les performances. Finalement, on évoquera quelques solutions pour les problèmes trop grand pour tenir en GRAM : grappes hybrides avec MPI, algorithmes "out of core".
- Tomasz Toczek, GIPSA-Lab
Sujet : Lancé de rayons, traversée de grille
Le rendu par lancer de rayons est une alternative à la rasterisation permettant d'obtenir des images de grande qualité exhibant des phénomènes lumineux potentiellement complexes. Cette technique a longtemps été réservée aux images précalculées, mais l'évolution des GPUs rend envisageable son utilisation dans des contextes temps réel. Nous présentons les différents aspects liés à l'implémentation et
l'optimisation des algorithmes basés sur le lancer de rayons sur GPU, notamment les problématiques d'ordonnancement des threads, d'utilisation des différentes mémoires on-chip, et des accès vers la mémoire DRAM externe.
- Tim Legrand, CAPS entreprise
Sujet : GPU Computing with directives
Based on C and FORTRAN directives, HMPP offers a high level abstraction for hybrid programming that fully leverages the computing power of stream processors without the complexity associated with GPU programming.
HMPP compiler integrates powerful data-parallel backends for NVIDIA CUDA and OpenCL that drastically reduce development time. The HMPP runtime ensures application deployment on multi-GPU systems. Software assets are kept independent from both hardware platforms and commercial software. While preserving portability and hardware interoperability, HMPP increases application performance and development productivity.
|
| |
 |
|
 |
|