En 2020, lorsque Clubhouse a fait son apparition sur la scène des médias sociaux, un vent d’enthousiasme a soufflé sur l’industrie tech. Cette application exclusive, accessible uniquement sur invitation, promettait une nouvelle ère de communication numérique basée sur la voix plutôt que sur le texte ou l’image. Les salons de discussion audio en temps réel ont attiré des millions d’utilisateurs durant la pandémie, y compris des célébrités et des PDG de grandes entreprises. Mais trois ans plus tard, l’engouement initial s’est considérablement refroidi, soulevant une question légitime : l’audio social n’était-il qu’une mode éphémère ?
La montée fulgurante puis la chute de Clubhouse
Lorsque Clubhouse a été lancé en mars 2020, sa croissance a été exponentielle. En janvier 2021, l’application atteignait une valorisation de 1 milliard de dollars après un tour de financement mené par Andreessen Horowitz. Son système d’invitation créait une rareté artificielle qui a généré un sentiment d’exclusivité très recherché. Les utilisateurs passaient en moyenne plus de 60 minutes par jour sur l’application, un taux d’engagement remarquable pour une nouvelle plateforme.
Mais dès la fin 2021, les signaux d’essoufflement étaient perceptibles. Selon les données d’App Annie, les téléchargements de Clubhouse ont chuté de 80% entre février et mai 2021. L’ouverture de l’application à tous les utilisateurs en juillet 2021 n’a pas inversé la tendance. La magie de l’exclusivité s’était dissipée, et les utilisateurs commençaient à se lasser du format.
Plusieurs facteurs expliquent ce déclin rapide. D’abord, la fin des confinements a réduit le temps disponible pour de longues conversations audio. Ensuite, la concurrence féroce des géants comme Twitter (Spaces), Facebook (Live Audio Rooms) et Spotify (Greenroom) a fragmenté l’audience. Enfin, le modèle économique restait flou, sans source claire de monétisation pour les créateurs comme pour la plateforme.
Le paradoxe de l’attention audio
L’audio social se heurte à un paradoxe fondamental : il demande une attention soutenue dans un monde numérique caractérisé par la distraction et la consommation rapide de contenus. Contrairement au texte qu’on peut parcourir rapidement ou à la vidéo qu’on peut regarder en accéléré, l’audio en direct exige une écoute en temps réel, sans possibilité d’accélération ou de sélection des moments intéressants.
Cette contrainte temporelle s’est avérée problématique pour beaucoup d’utilisateurs. Des études de comportement digital montrent que la durée d’attention moyenne sur les réseaux sociaux est d’environ 8 secondes, bien loin des 30 à 90 minutes typiquement nécessaires pour une session Clubhouse productive.
De plus, l’audio social souffre d’un problème d’indexabilité. Sans transcription automatique efficace, les conversations restent difficiles à rechercher, à référencer ou à partager de manière pertinente. Cette caractéristique limite sérieusement la viralité du contenu, pourtant moteur principal de l’engagement sur les plateformes sociales contemporaines.
Le problème de la densité informationnelle
Les conversations audio non éditées contiennent souvent beaucoup de « bruit » pour peu de « signal » – une faible densité informationnelle comparée à un article ou une vidéo montée. Les auditeurs se sont souvent plaints du ratio temps investi/valeur reçue, particulièrement dans les salles bondées où la modération laissait à désirer.
La réponse des géants du numérique
Face à l’émergence de Clubhouse, les plateformes établies ont rapidement déployé leurs propres fonctionnalités d’audio social. Twitter a lancé Spaces en décembre 2020, Facebook a introduit Live Audio Rooms en juin 2021, et Spotify a acquis Betty Labs pour créer Greenroom (devenu plus tard Spotify Live).
Cette stratégie défensive typique des géants du numérique a eu deux conséquences majeures. D’une part, elle a validé le concept d’audio social, confirmant son potentiel perçu. D’autre part, elle a dilué l’avantage compétitif de Clubhouse en intégrant des fonctionnalités similaires dans des écosystèmes existants disposant déjà de millions d’utilisateurs actifs.
Twitter Spaces semblait particulièrement bien positionné, s’appuyant sur une base d’utilisateurs déjà habituée aux conversations publiques. Pourtant, même cette implémentation n’a pas connu le succès escompté. En 2022, Twitter a réduit l’équipe dédiée à Spaces, signalant un intérêt décroissant pour le format.
- LinkedIn a abandonné son projet de clone Clubhouse après des tests préliminaires
- Spotify a transformé Greenroom en fonctionnalité intégrée plutôt qu’en application autonome
Ces ajustements stratégiques témoignent d’une réévaluation du potentiel de l’audio social par les acteurs majeurs. La question n’était plus de savoir s’il fallait proposer cette fonctionnalité, mais plutôt comment l’intégrer dans une offre plus large sans y consacrer des ressources disproportionnées.
Les niches de résistance
Si l’audio social de masse semble en déclin, certaines niches spécifiques continuent de prospérer. Les communautés professionnelles, les groupes d’apprentissage et les cercles d’intérêts très spécifiques trouvent encore une valeur substantielle dans ce format.
Discord, bien que n’étant pas strictement une plateforme d’audio social, a vu son usage des salons vocaux augmenter de 50% en 2021-2022. Son approche des communautés fermées, contrairement au modèle ouvert de Clubhouse, semble mieux adaptée aux contraintes de l’audio. Les conversations y sont plus pertinentes car entre personnes partageant déjà un intérêt commun.
Dans le domaine professionnel, des plateformes comme Wisdom ou Geneva ont trouvé leur public en se concentrant sur le mentorat audio et les échanges d’expertise. Ces services plus spécialisés ne visent pas les centaines de millions d’utilisateurs, mais plutôt des communautés engagées de quelques milliers ou dizaines de milliers de membres.
Le cas des podcasts conversationnels
Une évolution intéressante est l’émergence de formats hybrides entre le podcast traditionnel et l’audio social. Des applications comme Callin permettent d’enregistrer des conversations audio en direct avec participation de l’audience, puis de les éditer et de les distribuer comme des podcasts. Cette approche combine l’interactivité de l’audio social avec la pérennité du podcast, résolvant partiellement le problème de la densité informationnelle.
Le futur redessiné de la voix numérique
L’échec relatif de l’audio social dans sa forme originale ne signifie pas la disparition de la voix comme interface numérique. Au contraire, nous assistons à une réorientation vers des formats plus adaptés aux contraintes cognitives et aux habitudes des utilisateurs.
Les messages vocaux courts continuent de gagner en popularité sur WhatsApp, Telegram et autres applications de messagerie. Contrairement aux salons audio qui demandent une présence synchrone, ces messages permettent une communication asynchrone qui respecte le temps et l’attention de chacun. Telegram a d’ailleurs noté une augmentation de 300% de l’usage des messages vocaux entre 2020 et 2022.
L’intelligence artificielle ouvre également de nouvelles perspectives. Des outils comme Descript permettent désormais de transcrire, éditer et remixer l’audio aussi facilement que du texte. Ces avancées pourraient résoudre le problème fondamental de l’indexabilité et de la densité informationnelle qui a handicapé l’audio social.
Enfin, l’émergence des assistants vocaux conversationnels de nouvelle génération pourrait réinventer notre rapport à l’audio interactif. Des expériences comme Character.AI ou les avatars vocaux de Replica suggèrent un futur où l’interaction vocale serait plus structurée, plus informative et moins chronophage que les salons audio actuels.
- Les formats courts (30-90 secondes) semblent mieux adaptés à l’attention fragmentée des utilisateurs
L’audio social tel que conçu par Clubhouse apparaît aujourd’hui comme une étape transitoire plutôt qu’une destination finale dans l’évolution des médias sociaux. Son héritage réside davantage dans les questions qu’il a soulevées sur notre rapport au temps, à l’attention et à l’oralité numérique que dans son succès commercial.