Le 5 décembre 2018, Lyor Cohen, directeur international de la division musique de YouTube, défendait un raisonnement qui semblait au départ futile, mais sur un fond de vérité. « L’industrie de la musique a commencé en tant qu’industrie audio, puis elle devenue audiovisuelle. Aujourd’hui, il y a de grande chance qu’elle devienne une industrie d’ “audiobusiness visuel” ».

Lyor Cohen n’a pas interverti les mots « audio » et « visuel » pour le plaisir : c’est la nouvelle économie de la musique et des médias numériques qui le demande.


À son apogée dans les années 90, MTV a fourni aux grandes maisons de disques un réseau précieux pour façonner l’attrait visuel de ses plus grandes vedettes, de Michael Jackson à Madonna. Mais réussir ce placement vidéo a toujours été relégué au second plan, afin de mettre l’accent sur les ventes de disques. Dans l’ensemble, à l’âge d’or de la musique entre 1980 et 2000, les clips vidéos et les tournées n’étaient souvent considérées comme rien d’autre que de la publicité. La priorité était en effet donnée à la performance commerciale de l’audio plutôt qu’à celle du visuel.

Aujourd’hui, c’est l’inverse. Les marges sur le streaming sont beaucoup plus faibles que sur les achats physiques, et bien que le placement sur des playlists importantes puisse donner jusqu’à six chiffres de revenus supplémentaires aux artistes, beaucoup ont exprimé leur désillusion quant à l’efficacité de la stratégie à développer un engagement à long terme chez les fans. Par conséquent, les artistes intègrent de plus en plus de clips vidéos et autres éléments visuels non seulement dans leurs processus créatifs, mais également dans leurs modèles commerciaux en début de projet. Ils se tournent ensuite vers des publics ciblés en passant par Instagram, YouTube, TikTok et même Netflix pour obtenir leur soutien.

« Même s’il n’existe rien de comparable à MTV aujourd’hui, le format vidéo prend plus d’ampleur que jamais, parce que tout le monde possède un smartphone », explique Dre London, manager de Post Malone et fondateur de London Entertainment. « La plupart des gens dans le monde entier vont immédiatement sur YouTube dès qu’ils entendent une chanson qu’ils aiment. Les clips permettent de montrer les artistes sous un jour différent de celui d’un concert. »

En fait, la musique joue un rôle crucial pour convaincre les investisseurs de capital-risque du potentiel de la vidéo à développer des sociétés de consommation à tous les niveaux. Par exemple, dans un article sur l’avenir des start-up de consommation, Andrew Chen, associé de Andreessen Horowitz, explique que la vidéo est « la nouvelle technologie à l’échelle ». Pour étayer son point de vue, il cite à juste titre qu’il a fallu près de cinq ans à la vidéo de « Gangnam Style » de Psy pour atteindre trois milliards de vues en 2012, alors que la vidéo de « Despacito » en 2017 a réalisé le même exploit en un an seulement.

Alors que la technologie vidéo continue d’évoluer et de monter en puissance en 2019, il en sera de même pour les avantages et les défis qu’elle offrira à l’industrie musicale. Voici quatre façons dont l’industrie des clips vidéos changera cette année, en termes d’esthétique, de diffusion et de monétisation, avec des exemples précis d’artistes qui font déjà bouger les choses.

 

1. Ils seront retransmis en direct

La musique favorise les liens émotionnels partagés, que ce soit entre un artiste et un fan sur une plateforme de streaming, ou en personne entre une scène et des dizaines de milliers de fans dans un stadium. Pour de nombreux artistes, les concerts constituent également une source de revenus plus rentable que la musique enregistrée, car il peut falloir quelques années à une chanson pour trouver des bénéfices quand elle paraît directement sur le marché du streaming.

L’élite des artistes ne cesse de répéter que les fans ont autant envie de partager ces événements en ligne qu’en personne, surtout si les artistes eux-mêmes sont aux commandes de la réalisation. Kanye West a utilisé WAV, une petite application de streaming en direct, pour diffuser la soirée de lancement de son album Ye, qui a propulsé WAV au sommet des meilleures ventes de l’iOS App Store dans la catégorie Musique. Ariana Grande a également attiré un record de 829 000 téléspectateurs simultanés à la première en direct de son clip vidéo pour « thank u, next », qu’elle et son équipe ont orchestré avec la fonction Premiere de YouTube.

L’un des points forts de la diffusion en direct est l’écosystème de contenu dérivé qui peut être créé suite à une émission donnée. Dans son article, Andrew Chen souligne le potentiel des produits « générateurs de vidéo », qu’il définit comme « tout produit qui engendre automatiquement de la vidéo lorsque les utilisateurs participent.» Minimiser la friction à la création vidéo peut encourager « plus de partages de vidéos, donc plus d’acquisition et d’engagement viral ».

L’Esport est l’exemple parfait d’un produit « générateur de vidéo », en grande partie grâce à sa culture dynamique de streaming en direct sur des plateformes comme Twitch mais aussi de plus en plus, YouTube et Facebook. Ce n’est pas un hasard si de plus en plus d’artistes et de maisons de disques s’associent à des sociétés d’Esports pour profiter de ces dynamiques virales.

Bien sûr, les clips vidéos sont par défaut des « vidéos natives ». Mais ils ont à ce jour peu croisé la route du livestreaming, peut-être parce que le modèle économique autour de ce format reste relativement instable pour beaucoup d’artistes. Alors que les marques semblent se satisfaire d’opportunités de sponsoring ponctuelles pour les livestreams de grands événements comme Coachella ou California Roots, le marché de la publicité dynamique d’artistes et personnalités émergents est toujours plus libre que le livestream, même sur les plus grandes plateformes comme Twitch.

Outre les publicités, une autre source de revenus potentiels du livestreaming est la contribution directe des utilisateurs, sous la forme de dons libres ou de « pourboires », un modèle qui est déjà en cours de normalisation sur certains marchés non occidentaux et dont on va tout de suite parler.

 

2. Ils permettront d’obtenir plus de soutien financier de la part des fans

Le financement des clips vidéo par autrui n’a rien de nouveau. Des plateformes comme Patreon permettent aux artistes de mettre en place des structures de financement libre sur une base de projet par projet, de sorte que les fans puissent contribuer entre 1 $ et 100 $ pour chaque vidéo d’un artiste.

Ce qui est relativement récent dans le monde de la musique, c’est le concept de micro paiement pour les clips.

Lorsque le géant musical chinois Tencent Music a déposé son projet d’introduction à la Bourse de New York, les états financiers de la société ont révélé un modèle économique alternatif surprenant par rapport à celui d’une plateforme de streaming occidentale standard. Tencent a réalisé plus de 70% de ses revenus musicaux du 2ème trimestre 2018 non pas grâce au streaming audio, mais grâce aux « services de divertissement social », comprenant les « pourboires » monétaires in-app et autres cadeaux virtuels que les utilisateurs peuvent s’envoyer. Beaucoup d’influenceurs en Asie et dans le monde entier considèrent ces micro paiements comme une source de revenu de base, qui peut rapporter jusqu’à 50 000 yuans par mois rien qu’avec les pourboires.

Sur les plateformes occidentales, l’économie du micro paiement est encore jeune et est souvent étroitement liée au streaming. Les utilisateurs de Twitch peuvent acheter des cadeaux virtuels appelés « Bits » pour leurs streamers préférés, tandis que certains utilisateurs de YouTube peuvent payer pour mettre en valeur leurs messages pendant la diffusion en direct d’une chaîne donnée (qui inclut la fonction Premiere utilisée par Ariana Grande pour « thank u, next ») en achetant « Super Chats ».

WAV expérimente également avec des monnaies in-app, Beats et Diamonds, que les fans peuvent acheter immédiatement ou gagner au fil du temps grâce à leur participation sociale, pour ensuite offrir à leurs artistes préférés, qu’ils soient ou non en direct (captures d’écran ci-dessous). Il est important de noter que plusieurs magazines de musique, dont Mixmag et The Fader, possèdent et alimentent également leurs propres comptes vidéos sur WAV et peuvent obtenir un soutien financier par le biais de ces mêmes mécanismes de micro paiement, modèle qui pourrait changer la donne pour l’avenir du journalisme musical.

 

Captures d’écran de l’application mobile de WAV Media, présentant les capacités de micropaiement. Photo de Cherie Hu, avec l‘autorisation de WAV.

 

Le monde des pourboires in-app pour les vidéos reste toutefois une boîte de Pandore lorsqu’il s’agit de licences, car certaines des applications les plus populaires qui autorisent les contributions directes des fans, y compris Twitch et la myriade d’applications musicales de Tencent, ne partagent peu voire aucun de ces revenus avec les labels et les éditeurs.

C’est peut-être la raison pour laquelle les détenteurs de droits sur la musique enregistrée investissent encore davantage dans des micropaiements plus passifs, par le biais de Content ID et des empreintes digitales numériques. Popularisé par YouTube, Content ID devient de plus en plus répandu et lucratif dans les médias sociaux, en partie grâce aux contrats de licence que Facebook a signés avec tous les principaux labels et éditeurs au cours des dernières années.

« Bon nombre d’artistes n’ont aucune idée qu’ils peuvent être payés à chaque fois que les fans utilisent leurs chansons sur les réseaux sociaux », éclaire Dre London. « La communication sur la façon d’y parvenir n’est pas non plus très claire. Les gens doivent comprendre comment fonctionne Content ID, parce qu’il y a tellement d’endroits où une vidéo peut être vue et où une chanson peut être entendue. »

 

3. Ils seront de plus en plus courts, ou de plus en plus longs

Des contenus vidéos de toutes durées sont proposés sur Internet, mais les types de vidéos dans lesquels les artistes, les labels et les marques sont prêts à investir semblent se situer aux deux extrémités d’un spectre de plus en plus polarisé de longueur, de prix et de portée d’attention.

Alex Chung, PDG de GIPHY, a prédit en 2018 que l’avenir du contenu allait forger deux voies opposées mais complémentaires. D’un côté, « cela va coûter cher, si vous êtes Netflix, vous pouvez payer pour être dans les créneaux de prime-time. Mais le reste d’entre nous doit commencer à raccourcir. Nous devons commencer à rapetisser de six secondes ou moins. La durée moyenne d’une prise dans un film est de quatre secondes. La durée moyenne de visionnement d’une vidéo Facebook est de 10 secondes. Si vous voulez comprendre où se trouve l’argent, il faut savoir qu’il ne faut que trois secondes de visionnage pour qu’une vidéo soit considérée comme vue. »

Pour ce qui est de la vidéo, la stratégie marketing de l’industrie musicale semble suivre cette voie. D’une part, beaucoup dans l’industrie continuent de soutenir que la forme courte est la plus efficace : Geffen Records continue son partenariat avec Snapchat, de nouveaux hashtags et défis de danse apparaissent en continu sur TikTok, Dubsmash et Triller, et les stories Instagram sont devenues ces dernières années un indispensable pour le marketing musical et les campagnes de fidélité.

Mais de nombreux musiciens n’ont pas peur d’inclure plus de vidéos dans leurs projets visuels, et ironiquement, utilisent souvent des médias courts pour les aider à atteindre leurs objectifs de long format.

Par exemple, même si vous écoutiez Whack World, de Tierra Whack, sur Spotify trente fois de suite, vous ne seriez pas en mesure de comprendre l’esthétique et le contexte derrière les paroles ou la production, sans regarder la vidéo de l’album de 15 minutes sur YouTube. Mais les utilisateurs qui ne veulent pas avaler 15 minutes d’affilée de contenu peuvent également profiter des visuels petit à petit sur le profil Instagram de la rappeuse, sur lequel elle a posté 15 vidéos d’une minute chacune pour chaque chanson sur l’album (capture d’écran ci-dessous).

 

Capture d’écran du profil Instagram de Tierra Whack, montrant les 15 courtes vidéos que l’artiste a posté pour promouvoir son album “Whack World”. Photo de Cherie Wu.

 

Au niveau des grands labels, si les budgets globaux ont diminué depuis les années 80 et 90, la quantité d’efforts créatifs et de travail manuel pour produire des vidéos de haute qualité n’a pas diminué. Andrew Listermann, PDG de la société de production Riveting Entertainment, qui a travaillé avec Tyga, Post Malone, G-Eazy et Lady Gaga, affirme qu’il faut en moyenne 1 000 heures pour créer un clip.

« L’essentiel de ces heures se déroule le jour même du tournage, pour lequel nous embauchons entre 70 et 150 personnes », il explique. « Les tournages durent généralement de 14 à 18 heures, mais il y a certains cas, comme pour le clip de ‘G.U.Y.’ de Lady Gaga, où le tournage a duré sept jours. Nous passons aussi de 20 à 40 heures avec les directeurs artistiques au préalable pour faire des ébauches de concept vidéo à présenter à l’artiste. Il y a aussi évidemment tout le travail de montage, d’étalonnage et de post-production qui vient ensuite. »

 

De gauche à droite : Andrew Listermann, le rappeur Post Malone et le réalisateur Ryan Philippe sur le plateau. Avec la permission de Riveting Entertainment

 

De plus, à mesure que les budgets des labels pour les clips diminuent, « beaucoup d’artistes sont non seulement impliqués dans le processus créatif d’une vidéo, mais ils contribuent également deux à trois fois plus que le label pour financer la production », raconte Andrew Listermann. « Les gens ne réalisent pas combien de temps, de ressources et de concentration mentale il faut aux artistes pour surprendre et donner aux fans de quoi s’enthousiasmer visuellement. »

 

4. Ils seront personnalisés, hyper-localisés et contextuels

Le secteur des clips vidéo s’inspire de plus en plus de Netflix lorsqu’il s’agit de repousser les limites de la personnalisation et de la localisation.

Greg Peters, chef de produit chez Netflix, a partagé quelques statistiques intéressantes sur l’importance de la localisation de contenu sur la plateforme vidéo lors du Web Summit en novembre 2018.

D’une part, les séries localisées : celles qui ont « des réalités locales et des thèmes universels », pour reprendre les mots de Greg Peters, et qui sont produites dans une langue autochtone locale, ont une audience internationale élevée sur Netflix. Le thriller brésilien dystopique « 3 % » a reçu plus de 50 % de visionnement de la part d’abonnés extérieurs au Brésil, tandis que la série allemande Dark a reçu 90 % de ses visionnages à l’extérieur de l’Allemagne et figurait parmi le top 10 des séries dans 136 pays un mois avant son lancement.

Deuxièmement, le doublage : l’enregistrement d’un dialogue dans une langue différente, superposé à l’original, est une forme d’art et une science sous-estimée. Il a une influence significative sur les taux de visionnage et de réussite sur Netflix. Selon Greg Peters, 85 % des abonnés américains regardent du contenu international doublé et sont beaucoup plus susceptibles de finir ce contenu s’il reste doublé. Actuellement, Netflix traduit en 10 langues pour les contenus destinés aux adultes et en 26 langues pour ceux destinés aux enfants. La plateforme de streaming s’attache en priorité à « améliorer la qualité des traductions, à préserver l’intention originale du créateur grâce à ce processus de localisation », a déclaré l’encodeur de Netflix.

Ces efforts s’alignent sur la grande maîtrise de Netflix en matière de personnalisation : le service est allé jusqu’à personnaliser la couverture de toutes les séries et films sur sa page d’accueil pour chaque utilisateur. Avec son nouveau film interactif Bandersnatch, sorti dans le cadre de la franchise Black Mirror, Netflix laisse même entrevoir un avenir dans lequel les utilisateurs pourront choisir leur propre bande sonore pour leurs films favoris.

Certaines plateformes de streaming musical comme Spotify prennent déjà conscience de l’importance de la localisation. Par exemple, cette dernière a créé des pages sur mesure pour les playlists K-pop, latines, afro et arabes afin d’accompagner l’expansion du service sur des marchés internationaux en Amérique du Sud, en Asie, en Afrique et au Moyen-Orient. La compagnie prend également en compte le contexte temporel en organisant automatiquement les pages d’accueil des utilisateurs par moment de la journée (par exemple, les playlists « Afternoon chill » l’après-midi, les playlists « Coffeehouse » le matin).

Mais est-il possible de transposer ce type de stratégie du niveau des grandes plateformes au niveau de l’artiste seul et de la maison de disques ?

En fait, certains genres comme le K-pop expérimentent déjà la localisation depuis quelques années. Le boys band EXO, qui est maintenant un seul et même groupe, était divisé en deux sous-groupes, Exo-K et Exo-M, qui interprétaient exactement les mêmes chansons, mais en coréen et en mandarin respectivement. En 2016, l’une des plus grandes sociétés de production de K-pop, SM Entertainment, a lancé Neo Culture Technology (NCT), un groupe expérimental avec des « équipes » locales à travers le monde, qui peuvent sortir différents albums simultanément dans plusieurs langues. Inspirés par ces idées, les managers et les labels des marchés occidentaux commencent également à réfléchir à la manière de doubler les clips vidéos de leurs artistes avec des paroles internationales pour s’adresser à des publics plus divers.

Mais même si cette localisation ne se fait pas au niveau des paroles, le processus de doublage exige beaucoup de travail, d’autant plus que le nombre de langues s’accumule. Un autre domaine en pleine croissance pour les clips vidéos est la localisation visuelle, à la manière sur-mesure de Netflix.

Par exemple, tout au long du second semestre 2018, Universal Music Group a sorti non pas une mais six vidéos verticales du single de Chantel Jeffries « Wait (featuring Offset & Vory) » sur Spotify. Chaque vidéo était adaptée à une playlist différente du service, plus exactement les playlists skate, travel, latino, pride, DJ et party.

« Au cours des derniers mois, il est devenu impératif pour les principaux clients de notre label d’inclure des vidéos verticales dans le contenu qu’ils offrent », explique Andrew Listermann. « Dans 90 % des cas, le client cherche à réduire ses dépenses en réutilisant les séquences de son clip principal, donc on recadre simplement ses vidéos horizontales de manière à ce qu’elles correspondent bien au cadre vertical. Mais parfois, si le label dispose d’un budget plus important, ou si l’artiste a conclu un marché avec Spotify grâce auquel il sait qu’il obtiendra un excellent placement, il investira dans du contenu entièrement nouveau et dépensera entre 1 000 et 3 000 $ de plus pour que nous puissions tourner une vidéo verticale complètement différente ».

Alors que Spotify essaie d’étendre ses horizons à d’autres types de contenu multimédia pour ses utilisateurs, y compris, mais sans s’y limiter, la vidéo, on peut s’attendre à ce que les grandes maisons de disques plongent également dans la personnalisation, autant visuelle qu’auditive. De telles stratégies augmentent considérablement le nombre de contextes dans lesquels une chanson peut être entendue pour la première fois, créant ainsi plus de flexibilité pour le public et les fans, tout en restant fidèle à la vision créative et aux désirs d’évolution de l’artiste.