Musique: Beluga voudrait faire du caviar avec les données de Grooveshark

par Sophian Fanen
publié le 31 mai 2012 à 18h05

À côté de ses ennuis judiciaires à répétition, le service de streaming musical Grooveshark se lance dans la big data avec son site Beluga . Soit les grooooosses données en français, ces informations factuelles ou chiffrées qui font tourner de plus en plus de services en ligne, générant des recommandations chez Amazon, déclenchant des publicités ciblées chez Facebook ou Google, permettant de faire remonter un chanteur inconnu du fin fond du catalogue de Deezer...

Grooveshark permet à n'importe qui (label, artiste, fan...) d'uploader n'importe quelle œuvre sonore afin de la mettre à disposition d'une vaste communauté (30 millions d'utilisateurs revendiqués), et Beluga s'inscrit dans cette même logique «ouverte» -- mais propriétaire.

Beluga se présente comme un moteur de recherche épuré où l'on rentre un nom d'artiste. Essayons avec Modest Mouse, très bon groupe de rock indé américain qui n'a jamais vraiment explosé en France. Ses disques sont disponibles dans la base de Grooveshark, ça tombe bien (et très peu dans Spotify au passage, alors que le groupe est signé chez Sony, mais bon).

S'affiche alors une page de résumé qui contient déjà pas mal de données. Beluga nous apprend ainsi que 90% des internautes qui écoutent le groupe sur Grooveshark disent partager au moins deux fois par semaine «de la musique avec des amis, leur famille et/ou sur les réseaux sociaux» . Que les Etats-Unis sont très amateurs de la musique du groupe mais que c'est le Yukon, dans l'extrême nord-ouest du Canada, qui adhère le plus à ses chansons. Sinon, une nette majorité des auditeurs de Modest Mouse sur Grooveshark sont des femmes.

En allant plus en avant dans les onglets proposés, on tombe sur une carte navigable des pays qui aiment le plus Modest Mouse (par rapport à d'autres artistes). Puis, en vrac, que les auditeurs du groupe se disent majoritairement blancs, célibataires, aiment surtout les reptiles et les rongeurs, parlent davantage japonais qu'indien et sont fans du service de VOD Netflix. Autant de données qui peuvent intéresser selon Grooveshark des publicitaires (pour le placement de musique dans les spots) ou des organisateurs de tournée, par exemple.

On s'arrêtera là, mais il y en a comme ça des pages et des pages, portant sur des données socio-économiques, le matériel informatique ou hi-fi, les habitudes musicales ou les revenus du foyer... Beluga est d'une richesse sans fin. Mais on se pose vite des questions sur la pertinence des informations qu'il propose.

Selon les détails fournis sur son site, il se base uniquement sur des «informations anonymes» fournies par les utilisateurs de Grooveshark «sur eux-mêmes» , tels que «leur sexe» ou des réponses à «des enquêtes auxquelles ils choisissent de répondre» . Le site assure au passage prendre des «mesures proactives pour anonymiser ces données» .

«La jonction de la musique numérique avec des big datas est déjà partout autour de nous, continue le site dans sa foire aux questions. Nous croyons que les artistes, les fans et tous les autres tirent profit de connaissances librement accessibles. Nous pensons que les artistes devraient avoir un accès gratuit et facile à ces informations afin de mieux connaître leurs fans. Nous avons découvert qu'il y a quelques tendances intéressantes qui se dessinent entre la musique de nos utilisateurs écoutent et la façon dont ils se sont décrits [dans nos questionnaires]. Nous avons construit Beluga pour tenter de révéler ces corrélations statistiques [...].»

Ces questionnaires remplis par ses utilisateurs volontaires, Grooveshark les échange contre des «points» qui permettent de gagner un mois d'abonnement à Grooveshark Plus (sans pub) ou Grooveshark Anywhere (sans pub et accès mobile), qui sont normalement vendus respectivement 6 et 9 dollars.

La méthode choisie pour ramasser des données est assez maline, mais impossible de savoir sur combien de questionnaires Grooveshark base aujourd'hui les données croisées dans Beluga. Impossible également de garantir la fiabilité de ces données, tant il est courant pour les internautes, toujours méfiants quant à la réutilisation de leurs informations personnelles, de donner une fausse date de naissance ou toute autre information choisie au hasard. Egalement, on se demande si le profil des utilisateurs de Grooveshark, plutôt branchés musique et technologie, peut donner des informations statistiques suffisamment générales.

En l'état actuel, Beluga n'est donc pas recevable comme source d'informations, mais la démarche entamée par Grooveshark n'en sera pas moins alléchante pour tout le marché actuel de la musique. À ce jour, des entreprises comme The Echo Nest , qui vient d' associer ses informations avec la précieuse base d'informations sur la musique de Discogs , savent croiser un nombre important d'informations sur la musique elle-même: données factuelles (nom, alias, famille musicale, label, ville...), et données sonores (battement par minute, ton, timbre, structure, compression...) principalement.

Dès lors, le Graal est de réussir à associer ces données techniques, qui grossissent et s'affinent sans cesse à mesure que les catalogues numériques sont enrichis, à des informations toujours plus personnelles sur les utilisateurs. Celles-ci sont encore tenues à l'écart, propriété d'administrations (impôts, sécurité sociale) ou de grosses entreprises (banques, assurances, Facebook...). Grooveshark entreprend de créer sa propre base de données, sans trop que l'on sache ce qui se trame derrière l'apparente gratuité de Beluga. D'autant que les données accessibles et exportables dans de nombreux formats (png, jpg, pdf, psv...) ne sont pas livrées dans un format ouvert, ni manipulables ni exportables.

La plateforme de streaming sait très bien que ces données ont et auront une grande valeur (si elles peuvent être fiables un jour...) dans le monde de la musique qui se dessine. Spotify, iTunes et toutes les maisons de disques savent déjà beaucoup de choses sur les habitudes d'écoute de leurs utilisateurs, mais ils veulent pouvoir construire des playlists vraiment intelligentes et surtout proposer sans presque jamais se tromper le bon disque à la bonne personne, afin de l'attirer dans un concert, à acheter un produit dérivé ou une édition collector.

Tout ça n'est pas très sexy et néglige la part d'insaisissable de la création. Mais c'est désormais la réalité du commerce de la musique. En lançant Beluga et en révélant pas mal d'informations sur ses utilisateurs que ses concurrents gardent pour eux, Grooveshark continue de faire le malin et d'occuper le terrain.

Lire les réactions à cet article.

Pour aller plus loin :

Dans la même rubrique

Les plus lus