Accueil
............................................
 Objectifs
............................................
 Information Generale
............................................
 Intervenants
............................................
 Comités
............................................
 Programme
............................................
 Inscription
............................................
 Documents a fournir
............................................
 Soumission Poster
............................................
 Hotels et tourisme
............................................
 Venir à Grenoble
............................................
 Mentions Legales
............................................
 Contacts


............................................



Intervenants



LISTE DES CONFERENCIERS

  • Horst Bischof, Institute for Computer Graphics and Vision , TU Graz

    Sujet : Solving Vision Tasks with Variational Methods on GPUs

    This lecture will present novel solutions to long standing computer vision problems by means of variational methods. We present robust methods for optical flow calculation, the correspondence problem for stereo matching, depth map integration and interactive segmentation methods. The variety of topics that can be handled by these methods demonstrate the wide applicability of variational methods.

    In addition, modern graphics hardware (GPUs) allow to compute solutions to these problems very efficiently and in some cases (e.g. optical flow) even in real-time. Having real-time solutions opens several new applications areas (e.g. industrial imaging), interactive medical segmentation, etc. Some of these will be presented during the talk.

  • James Fung, NVIDIA Santa Clara

    Sujet : video panorama stitching demo on the GPU

    As a massively parallel processor, the GPU is well-suited for performing 'per-pixel' operations in image processing and computer vision. However, new changes in hardware, software, afford new algorithm mappings which go beyond per pixel operations and allow entire vision algorithms to be performed solely on GPU. In this session we will present GPU hardware and programming environment features that support image processing and computer vision on the GPU. In particular, new features on the Fermi architecture and in the CUDA-C programming environment that support high performance image processing will be discussed.

  • Patrick Horain, Télécom Sud-Paris

    Sujet : GpuCV: Accélération par processeur graphique pour le traitement d'image et la vision artificielle (video demo), télécharger Le Fichier Zip

    Nous décrirons brièvement l'état de l'art de l'utilisation des processeurs graphiques grand public (GPU) pour accélérer le traitement d'image, et nous en discuterons les limites. Puis, nous décrirons GpuCV, une bibliothèque logicielle libre et multi-plateforme pour accélérer par GPU les opérateurs de traitement d'image et de vision artificielle. GpuCV a été conçue pour être compatible avec la bibliothèque OpenCV et permettre d'intégrer facilement des opérateurs accélérés sur GPU dans des applications développées sur CPU. L'environnement GpuCV gère de façon transparente les caractéristiques du matériel, la synchronisation des données, l'activation à bas niveau des procédures GLSL ou CUDA, l'étalonnage et l'aiguillage vers la mise en oeuvre la plus performante et finalement offre un ensemble d'opérateurs de traitement accélérés par GPU.

  • Julien Bert, INSERM Brest

    Sujet : Le GPU dans les sciences du vivant et de la santé

    Ces dernières années le calcul sur cible GPU a pris une dimension inégalée dans les sciences du vivant et de la santé. Nous évoquerons les espoirs engendrés par ce type d’architecture notamment en imagerie médicale et en bioinformatique. Un exemple concret et complet de parallélisassion sur GPU sera présenté. La méthode, utilisée en biologie structurale par cryo-microscopie électronique, permet la classification de milliers d’images de protéines par optimisation (algorithme de k-means couplé à un recuit simulé). Nous expliquerons comment il est possible d’utiliser la bibliothèque d’algèbre linéaire CUBLAS pour faire des opérations arithmétiques entre images. Nous détaillerons également la stratégie utilisée pour tirer partie de la puissance de plusieurs GPUs. Les performances seront comparées entre des clusters de différents types (CPUs, CPUs+GPUs). Ces performances nous permettront de dresser la force d’une telle implémentation ainsi que ses limites.

  • Frédéric Champagnat, ONERA, Châtillon

    Sujet : flot optique rapide sur grandes images par GPU et applications

    Cette présentation concerne l'estimation de flot optique haute cadence sur grandes images et l'utilisation de cette primitive dans diverses applications par intégration temporelle: vélocimétrie par imagerie de particules, super-résolution, détection d'objet en mouvement, structure from motion. Une démonstration "on stage" de l'algorithme de flot optique, le coeur algorithmique de ces applications, sera proposée en fin de séance.

  • David Defour, Univ. Perpignan

    Sujet : Arithmétique et processeur graphique

    L'actuel succès des processeurs graphiques repose sur la facilité d'accès à une formidable puissance de calcul. Aujourd'hui, tout un chacun peut disposer librement de puce capable de plusieurs teraflops dans son PC. Cependant, leur exploitation n'est pas sans poser de nombreux problèmes dont il faut avoir conscience.
    Après un bref aperçu des capacités de calcul des nouvelles générations de GPU, nous nous focaliserons sur le problème de l'utilisation de la puissance disponible vue sous l'angle de l'efficacité, de la qualité et de la confiance des calculs.

  • Lionel Lacassagne, IEF Paris

    Sujet : comparaisons GPU/CPU

    Cet exposé présente une évaluation des performances de 3 classes architectures actuelles : processeurs généralistes multicoeurs (GPP), carte graphique (GPU) et processeur Cell. L’algorithme retenu est l’opérateur de Harris pour sa représentativité du traitement d'image bas niveau (opérateurs ponctuels et convolutions). Le but est de guider l’utilisateur dans le choix d’une architecture parallèle et d’ évaluer l’impact des différentes transformations afin d’avoir une implantation en adéquation avec l’architecture.

  • Nicolas Gac, SUPELEC-LSS Paris

    Sujet : Accélération d'algorithmes itératifs de traitement d'images sur GPUs (tomographie CT et restauration d'image)

    Les algorithmes itératifs de reconstruction d’images (notamment en tomographie X) et de restauration d’images (élimination du bruit et du flou introduits par les systèmes imageurs) offrent une très bonne qualité d’image au prix d’un coût de calcul bien souvent trop important (plusieurs heures voire jours de calcul) pour être employés en pratique. Pour chacun de ces algorithmes itératifs, les opérateurs de base (convolution pour la restauration d'images et projection/rétroprojection pour la tomographie CT) ont été implémentés sur GPUs, ce qui a permis d’accélérer de manière significative ces algorithmes (d’un facteur 10 à 100). Par ailleurs, la mise en oeuvre de la parallélisation sur un serveur 8 GPUs avec une bonne gestion des transferts de données entre le CPU et les GPUs nous a permis d'obtenir un facteur d'accélération supplémentaire.

  • Marius Vasiliu, IEF

    Sujet : Analyse temps-réel de flux vidéo automotive

    L'exposé présente en détail l'implantation, sur des architectures multi-GPU fixes ou embarquées, de plusieurs blocs de traitement d'images destinés à l'analyse des scène routières en vue de l'aide actif à la conduite (projet ANR LOVe). L'application exploite l'ensemble des ressources de calcul, de communication et d'affichage offert par Cuda dans contexte d'une architecture multiprocesseur asynchrone (multi-CPU et multi-GPU). L'exposé montre l'approche up-down dans le découpage fonctionnel des algorithmes (calibration et rectification, calcul de disparité stéréo, calcul d'histogrammes de U et V disparité, détection de la position de la route, affichage etc.), l'optimisation par Cuda-Profiler ainsi que leur implantation spécifique avec allocation de ressources en vue de la maximisation du degré de parallélisme actif réellement obtenu.

  • Eric Chauvineau, VEGA Technologies Toulouse

    Sujet : Traitement d'images d'observation de la Terre sur GPU

    VEGA Technologies présente les résultats d'une étude R&T émise par le CNES en 2008 et portant sur l'utilisation des processeurs graphiques pour les traitements d'imagerie spatiale à la volée. Cette étude, achevée en mai 2009 s'est scindée en deux phases : tout d'abord une étude large des possibilités des GPU quant au traitement d'image (état de l'art et étude de faisabilité) puis un portage complet (incluant la fourniture du matériel) de trois algorithmes sur GPU permettant à la fois de mesurers les gains de performances (jusqu'à x50) et de valider les résultats obtenus. Cette étude, terminée de puis près d'un an a permis au CNES de lancer une phase de portage massif de bibliothèques de traitements d'images vers le GPU.

  • Cyril Crassin, Inria Rhones-Alpes

    Sujet : GPU et rendu haute performance

    Le domaine de l'informatique graphique et en particulier le rendu temps-réel sont en train de vivre une véritable mutation de pars l'évolution des GPU vers des architectures génériques de calcul parallèle. Cette évolution ouvre la voie vers l'utilisation de nouvelles structures de données et de toutes nouvelles méthodes de rendu temps réel très éloignées du pipeline graphique historiquement implémenté par les GPU. Dans ce contexte, nous développons GigaVoxels, un pipeline de rendu de voxels haute performance implémenté avec CUDA. Cet exposé présentera les problématiques de calcul parallèle soulevées dans ce contexte: codage et parcours de structure hiérarchique, utilisation des caches, ordonnancement, gestion de données out-of-core.

  • David Michea, BRGM Orléans

    Sujet : Calcul scientifique haute performance sur GPU(s)

    Le monde du calcul scientifique haute performance, historiquement très gros consommateur de ressources de calcul s'intéresse de plus en plus aux approches GPGPU avec l'arrivée des premières grappes de machines hybrides GPU+CPU. Les codes de simulation de phénomènes physiques effectuent la plupart du temps des calculs dans des domaines à 4 dimensions et exhibent très souvent un grand parallélisme de données (modèle SIMD), ce qui en fait des candidats naturels à un portage sur GPU. Pour cette école d'été, on présentera le portage de deux codes de propagation d'ondes sismiques sur cartes graphiques NVIDIA en utilisant l'API CUDA. Ces codes utilisent deux méthodes différentes de discrétisation : méthode des éléments spectraux (éléments finis) et méthode des différences finies. Chaque méthode pose des problématiques différentes qui appellent des solutions personnalisées. On discutera des problèmes rencontrés et des choix réalisés afin d'optimiser les performances. Finalement, on évoquera quelques solutions pour les problèmes trop grand pour tenir en GRAM : grappes hybrides avec MPI, algorithmes "out of core".

  • Tomasz Toczek, GIPSA-Lab

    Sujet : Lancé de rayons, traversée de grille

    Le rendu par lancer de rayons est une alternative à la rasterisation permettant d'obtenir des images de grande qualité exhibant des phénomènes lumineux potentiellement complexes. Cette technique a longtemps été réservée aux images précalculées, mais l'évolution des GPUs rend envisageable son utilisation dans des contextes temps réel. Nous présentons les différents aspects liés à l'implémentation et l'optimisation des algorithmes basés sur le lancer de rayons sur GPU, notamment les problématiques d'ordonnancement des threads, d'utilisation des différentes mémoires on-chip, et des accès vers la mémoire DRAM externe.

  • Tim Legrand, CAPS entreprise

    Sujet : GPU Computing with directives

    Based on C and FORTRAN directives, HMPP offers a high level abstraction for hybrid programming that fully leverages the computing power of stream processors without the complexity associated with GPU programming.
    HMPP compiler integrates powerful data-parallel backends for NVIDIA CUDA and OpenCL that drastically reduce development time. The HMPP runtime ensures application deployment on multi-GPU systems. Software assets are kept independent from both hardware platforms and commercial software. While preserving portability and hardware interoperability, HMPP increases application performance and development productivity.
 

 

Last update of this page : Monday May 23 2011
For comments on this site, please contact
Deprecated: Function eregi() is deprecated in /data/summerschools/gpu/includes/config.inc.nmpc on line 41