Analyse macroscopique des grands systèmes. Émergence épistémique et agrégation spatio-temporelle

Thèse
Robin Lamarche-Perrin
Lundi 14 Oct 2013

L’analyse des systèmes de grande taille est confrontée à des difficultés d’ordre syntaxique et sémantique : comment observer un million d’entités distribuées et asynchrones ? Comment interpréter le désordre résultant de l’observation microscopique de ces entités ? Comment produire et manipuler des abstractions pertinentes pour l’analyse macroscopique des systèmes ? Face à l’échec de l’approche analytique, le concept d’émergence épistémique - relatif à la nature de la connaissance - permet de définir une stratégie d’analyse alternative, motivée par le constat suivant : l’activité scientifique repose sur des processus d’abstraction fournissant des éléments de description macroscopique pour aborder la complexité des systèmes. Cette thèse s’intéresse plus particulièrement à la production d’abstractions spatiales et temporelles par agrégation de données. Afin d’engendrer des représentations exploitables lors du passage à l’échelle, il apparaît nécessaire de contrôler deux aspects essentiels du processus d’abstraction. Premièrement, la complexité et le contenu informationnel des représentations macroscopiques doivent être conjointement optimisés afin de préserver les détails pertinents pour l’observateur, tout en minimisant le coût de l’analyse. Nous proposons des mesures de qualité (critères internes) permettant d’évaluer, de comparer et de sélectionner les représentations en fonction du contexte et des objectifs de l’analyse. Deuxièmement, afin de conserver leur pouvoir explicatif, les abstractions engendrées doivent être cohérentes avec les connaissances mobilisées par l’observateur lors de l’analyse. Nous proposons d’utiliser les propriétés organisationnelles, structurelles et topologiques du système (critères externes) pour contraindre le processus d’agrégation et pour engendrer des représentations viables sur les plans syntaxique et sémantique. Par conséquent, l’automatisation du processus d’agrégation nécessite de résoudre un problème d’optimisation sous contraintes. Nous proposons dans cette thèse un algorithme de résolution générique, s’adaptant aux critères formulés par l’observateur. De plus, nous montrons que la complexité de ce problème d’optimisation dépend directement de ces critères. L’approche macroscopique défendue dans cette thèse est évaluée sur deux classes de systèmes. Premièrement, le processus d’agrégation est appliqué à la visualisation d’applications parallèles de grande taille pour l’analyse de performance. Il permet de détecter les anomalies présentes à plusieurs niveaux de granularité dans les traces d’exécution et d’expliquer ces anomalies à partir des propriétés syntaxiques du système. Deuxièmement, le processus est appliqué à l’agrégation de données médiatiques pour l’analyse des relations internationales. L’agrégation géographique et temporelle de l’attention médiatique permet de définir des évènements macroscopiques pertinents sur le plan sémantique pour l’analyse du système international. Pour autant, nous pensons que l’approche et les outils présentés dans cette thèse peuvent être généralisés à de nombreux autres domaines d’application.