Un moteur de recherche sémantique pour sonothèques


Date : 2018
Auteur : Théo Serror
Directeur(s) de mémoire : Sylvain Lambinet & Aymeric Devoldère

Son

Résumé : Le faible coût des supports de stockage numérique permets que monteurs son d’avoir à disposition des sonothèques composées de plusieurs dizaines de milliers de sons. Se souvenir de tous ces sons est alors impossible Et malgré l’avènement de moteurs de recherche puissants comme ceux de Google et de Spotify, les outils à disposition des monteurs sons sont encore limités à une simple recherche littérale de chaînes de caractères. Dans ce travail, nous analysons les conséquences du fonctionnement de ces moteurs sur la pratique du montage sone À partir de ces observations, nous envisageons la représentation du contenu sémantique des noms de fichiers comme une solution possible. Nous étudions pour cela deux approches. D’abord, une décomposition sémantique manuelle, avec la construction d’une structure hiérarchisée pour recueillir cette décomposition. Cette décomposition est appliquée au cas particulier des sons « d’ambiance d’intérieur ». Nous explorons ensuite une méthode automatique : l’analyse sémantique latente, appliquée à des sons issus de sonothèques commerciales. Dans les deux cas, nous étudions l’implication de telles représentations sur le processus de recherche. Enfin, nous proposons, à travers le développement d’un gestionnaire de sonothèques rudimentaire, une implémentation concrète de ces deux méthodes.

Mots-clés : moteur de recherche, sémantique, sonothèque, montage son, lexème, analyse sémantique latente, base de données, recherche d’information.

Abstract: With digital storage devices being cost efective, sound designers can nowadays gather sound libraries consisting of dozens of thousands samplese Therefore, it is impossible to remember all these samplese Despite the advent of powerful search engines, such as Google’s and Spotify’s engines, the tools available to sound designers are still limited to simple characters string matching. This paper analyses the consequences of these search engine’s operation towards sound designers’ creative workfowe From these observations, we study how sounds’ flenames’ semantic content can be a potential solution. Two separate solutions are then studiede The frst consists in a manual decomposition of flenames’ semantic content with the construction of a hierarchical structure to collect such a decompositione This decomposition is carried out over the eeample of “indoor ambiences”. An automatic solution is then eeplored: latent semantic analysis, carried out over samples from retail sound librariese In both case, the consequences of such representations regarding the sound retrieval process are studied. Finally, through the programming of a simplistic asset management software, implementations for both methods are presented.

Keywords: search engine, semantic, sound library, sound design, leeeme, latent semantic analysis, database, information retrieval.

Lire le mémoire


LIENS VERS DOCUMENT PDF

Mémoires similaires