Parmi les pratiques vocales artistiques
actuelles, le Human Beatbox (en français, boîte à rythme humaine) est à
l’avant-garde de l’exploitation des possibilités de l’instrument vocal humain.
Il s’agit d’un mouvement culturel musical en plein essor, qui impacte fortement
les jeunes, mais aussi les moins jeunes (Martino, 2009 ; Bourdin et Navion,
2013). La pratique du Human Beatbox s’est développée au cours des années 1980.
Elle fait partie de la culture hip-hop. Elle consiste en l’imitation vocale de
rythmes et d’instruments afin de former une mélodie créant l’illusion d’une
musique polyphonique (Ojamaa et Ross, 2009). Cette mélodie peut être la
superposition de quatre voire cinq sortes de sons et de bruits. Le beatbox peut
se pratiquer a capella ou avec amplification, en individuel ou en groupe. Le
musicien pratiquant le Human Beatbox, le beatboxeur, utilise une large palette
de techniques vocales afin de reproduire au mieux un son désiré, en donnant
éventuellement l’illusion que ce son ne provient pas d’une voix humaine. Jusqu’à
présent, rares sont les études scientifiques qui se sont intéressées à ce style
musical émergent (Lederer, 2005 ; Stowell et Plumbley, 2008 ; Proctor et al,
2013). Il s’agit pourtant d’une pratique vocale à risque (Clouet et De Torcy,
2010 ; De Torcy et al., 2014). De plus, l’étude des différents gestes mis en
place par les beatboxeurs présente un intérêt majeur pour des
recherches plus fondamentales sur les interactions pneumo-phono-résonantielles
en voix humaine.
Pour ces raisons, nous nous y intéressons depuis 2010.
Une première étude pilote menée sur trois beatboxeurs
professionnels a permis d’explorer la riche palette sonore de ces beatboxeurs et de
constituer une première base de données physiologiques, acoustiques et
aérodynamiques (Henrich et al., 2011). Ces beatboxeurs jouent de leur instrument
vocal avec virtuosité et inventivité, cherchant sans cesse à produire des sons
nouveaux.
Nous nous sommes ensuite focalisés
sur les principaux sons percussifs du human beatbox qui imitent différents
éléments de la batterie, suivant la classification proposée par Proctor et al.
(2013) : la grosse caisse (kick), la caisse claire (snare), la charleston
(hi-hat), les cymbales (cymbal), ainsi que la technique du Rimshot (Rimshot).
Une méthode de transmission du beatbox fréquemment utilisée est de s'appuyer sur
des séquences syllabiques où le voisement est progressivement supprimé pour ne
laisser émerger que la structure consonantique (Bourdin et Navion, 2013 ; voir
également l’application BeatboxMaker).
La gestion aérodynamique des sons percussifs du Human Beatbox, ainsi
que leur efficacité acoustique, ont été explorés comparativement à d’autres
formes d’expression vocale dont la parole et le chant dans une seconde étude
portant sur 4 beatboxeurs (Bourdin et Navion, 2013 ; Paroni, 2016). Les analyses
menées confirment que les sons percussifs beatboxés sont produits de façon plus
efficace que les sons occlusifs parlés ayant un lieu articulatoire équivalent.
Dans le cadre de cette même étude, une enquête a été menée sur une population de
53 beatboxeurs pratiquant le Human Beatbox de façon professionnelle (19%) ou amateure (81%)
pour mieux comprendre leur rapport à leur instrument (hygiène de vie, hygiène
vocale, préparation et entraînement, choix des sons). Les réponses ont montré
que le Human Beatbox est pratiqué de façon intensive, quotidienne et que les
beatboxeurs ont une grande conscience des besoins d’hygiène de vie et d’hygiène
vocale que requiert leur pratique vocale. Ils ne semblent pas souffrir de
troubles de la voix chroniques, mais font état de fatigue vocale possible après
la pratique.
Une troisième étude s’est intéressée aux gestes articulatoires (larynx, langue,
lèvres) d’un beatboxeur professionnel (Paroni, 2014). Ces gestes ont été observés
par imagerie ultra-sonore de la langue et visualisation par cinématographie
rapide des lèvres. Cette étude exploratoire a permis de catégoriser de façon
articulatoire et phonétique la palette des sons de Human Beatbox produit par ce
beatboxeur, et de décrire précisément les mouvements des lèvres et d’une partie de
la langue associés aux sons produits.
Une quatrième base de données a
été enregistrée pour explorer la dynamique articulatoire par articulographie
électromagnétique (EMA 3D) conjointement à la dynamique respiratoire par
plethysmographie à variation d’inductance (système Visuresp) et l’analyse
acoustique et électroglottographique de la production vocale (Paroni, 2016 ;
Paroni et al., 2017). Une analyse phonétique descriptive des sons les plus
communs du human beatbox a ainsi été proposée (Paroni, 2014, 2016 ; Paroni et
al., 2017). La présence de consonnes éjectives, que l’on retrouve dans de
nombreuses langues du monde, a été montrée (Paroni, 2014, 2016 ; Paroni et al.,
2017 ; Paroni, 2018). La production de sons percussifs dans le human beatbox
s’accompagne d’une plosion plus intense et de vitesses articulatoires labiales
et linguales plus élevées que pour la production des consonnes occlusives
équivalentes, d’un déplacement dans l’espace plus ample des points de chair
étudiés.
Human Beatbox et rééducation orthophonique
L’application d’exercices de Human Beatbox en rééducation orthophonique a
été explorée dans une étude de cas. Une campagne de mesures physiologiques,
acoustiques et aérodynamiques a été menée en préalable et à la suite d’une série
de 9 séances de rééducation. Nous avons exploré l’impact des exercices sur les
capacités de déglutition des patients (Navarro, 2019) et sur leur comportement
phonatoire et articulatoire (Le Meillour, 2019). L’analyse des séquences filmées
de rééducation a permis de mettre en évidence le côté ludique de ces exercices
(Benaghmouch, 2019).
Reconnaissance automatique de sons beatboxés
Le besoin d’un outil de reconnaissance automatique des sons du Human Beatbox se fait de plus en plus
pressant. Pour les recherches actuelles en phonétique expérimentale et clinique
qui portent sur la production des sons du Human Beatbox, les bases de données
sont annotées manuellement , ce qui implique un travail long et fastidieux qui
pourrait être effectué avec le soutien des outils d’annotation automatiques
(Henrich et al., 2011; Bourdin et Navion, 2013; Paroni, 2014; Paroni, 2016 ;
Paroni, 2017). Les applications technologiques d’aide à l’apprentissage du Human
Beatbox, telle que BeatboxMaker, ne permettent pas à l’usager la reconnaissance
des sons produits. Actuellement, quelques travaux ont exploré la reconnaissance
automatique de beatbox (Synior 2005 ; Picart et al 2015), mais le font avec des
sons isolés et ne considèrent pas le beatbox comme un langage. Nous voyons le
Human Beatbox comme une langue à part entière, un langage musical comprenant un
nombre fini d’unités sonores que l’on peut appeler des boxèmes. Dans ce contexte
et afin d’avoir un outil pour l’annotation de nos bases de données, nous
travaillons à développer des méthodes permettant de reconnaître automatiquement les
productions des sons du Human Beatbox, en s’appuyant sur des recherches issues
de la reconnaissance automatique de la parole. Des outils de classification
non-supervisée ont été testés. Par la suite, l’application des outils de
reconnaissance automatique de la parole à la détection et classification supervisée des
sons percussifs du Human Beatbox a été entrepris dans le cadre d’un stage de
master (Evain, 2019 ; Evain et al., 2019).
Projet Art-Sciences BEATBOX
S’ils sont acoustiquement facilement identifiables par l’humain, les sons
beatboxés sont complexe à annoter et transcrire. L’approche phonétique qui
consiste à associer un caractère à un son de la parole à l’aide de l’Alphabet
Phonétique International montre sa limitation pour le Human Beatbox (Proctor et
al., 2013 ; Paroni, 2016 ; Paroni et al., 2017). Il existe une notation du
beatbox (Standard Beatbox Notation) qui ne permet pas non plus de transcrire par
écrit la variété des sons les plus usités.
De ce fait, une approche
morpho-graphique a été conçue par Adrien Contesse, dans le cadre d’un projet de
fin d’études (DNSEP) à l’École Supérieure d’Art et de Design d’Amiens. Intitulé
Vocal Grammatics , ce système d’écriture
morpho-graphique représente les sons du beatbox grâce à des signes
modulaires pouvant se combiner les uns avec les autres. La graphie des signes
qui compose ce système d’écriture innovant est basée sur des études en
phonétique articulatoire. Ces signes représentent de manière visuelle et
intuitive le point d’articulation et le mode d’articulation. À ce répertoire
glyphique de base s’ajoute une série de signes complémentaires qui indiquent
entre autres la tonalité et la rythmique. Une première sélection de signes a été
effectuée dans la collaboration initiée avec GIPSA-lab.
S’inspirant des techniques de reconnaissance automatique de la parole et
d’association en signe morpho-graphique, nous avons souhaité appliquer cette
approche aux sons beatboxés et mettre cette reconnaissance vocale en scène,
par une installation interactive, une projection des signes morpho-graphique
correspondant dans Vocal Grammatics accompagné par des informations
physiologiques sur la production du son.
Ce projet est en cours de finalisation. Lors de la production vocale par le
public, cette installation didactique sera augmentée d’animations graphiques
(formes, couleurs, textures) afin de permettre une entrée ludique, artistique et
intuitive du dispositif.
Collaborateurs:
Grenoble Images Parole Signal Automatique laboratoire
UMR 5216 CNRS - Grenoble INP - Université Grenoble Alpes