Parallel algorithmic and

high performance computing dedicated to a

simulation of a host-macroparasite system

 

 

Abstract:    

 

We are interested in a host-macroparasite system.  Ecological and epidemiologic interests are motivating the study of their population dynamics.  The model we have contributed to is both deterministic and stochastic, and includes non-uniform dynamics within the cohort of parasites.  Several biological processes are combined in order to reach a good level of realism, such as the parasite aggregation.  Therefore, the parasite distribution on the hosts is not predetermined but explicitly computed.

 

For this system, a previous deterministic discrete simulations brought about too large computations, and some simulations had very long execution times.  We implemented a high-performance simulator working on parallel machines (IBM SP2, IBM SP3, SGI Origin 3800, IBM Regatta) which provides more accurate computations.  The algorithmic study and the performance analysis establish the efficiency and scalability (checked up to 448 processors) of the parallel algorithm.  The parallel efficiency reaches 77% on 448 processors for a complete simulation, and the computation kernel corresponds to an efficiency of 92%. A study of memory accesses and cache utilization lead to an implementation reaching 60 % of peak performance in the computation kernel on the IBM SP3. We give qualitative results for the Sea bass-Diplectanum aequans system (corresponding to a pathological problem in fish farming). A full analysis of numerical simulations has allowed us to tune the model to get a realistic qualitative behavior.  Results of numerical simulations show the effect of overdispersion, parasite and host mortality on the parasite distribution, and host regulation (occurring through cycles).

 

We developed another individual-based model.  We describes the Monte Carlo algorithm of the stochastic simulator and its three levels of parallelism.  Analysis and performance, up to 256 processors, of a hybrid MPI/OpenMP code are then presented for a cluster of SMP nodes.  The qualitative results of both parallel simulators are finally compared.  The detailed quantitative study gives some insights to the interaction of mechanisms taking place in a host-parasite system with parasite-induced host mortality. Improving the model leads to a deeper understanding of the processes occurring in the real biological system.

 

Keywords :    parallel algorithmics, numerical simulation, host-parasite system, discrete model, stochastic simulation

 

Discipline:    Computer Science

 

LaBRI, Bordeaux 1 University,

ScAlApplix Project, INRIA UR Futurs,

351, cours de la libération,

33405 Talence Cedex (FRANCE).

 

Algorithmique parallèle et

calcul haute performance dédiés à la

simulation d’un système hôte-macroparasite

 

 

Résumé :   

 

Ce travail contribue à un modèle déterministe discret d’un système hôte-macroparasite et propose un modèle stochastique équivalent. Le phénomène d’agrégation des macroparasites est classiquement pris en compte par une distribution des parasites sur les hôtes de type loi binomiale négative.  Les hétérogénéités de la population parasitaire y sont reproduites plus finement, ce qui constitue une approche originale.  Une application du modèle est donnée pour un macroparasite constituant un élément pathogène en aquaculture :  le système Bar-Diplectanum aequans. Ce système est étudié quantitativement à l’aide de deux simulateurs numériques parallèles.

 

Les temps d’exécution d’un simulateur séquentiel déterministe étant rédhibitoires, une mise en œuvre parallèle est incontournable.  Nous présentons deux distributions des données et des calculs, ainsi qu’une étude algorithmique détaillée des solutions parallèles.  Des résultats expérimentaux sont donnés sur IBM SP2, SP3, Regatta et SGI Origin 3800. Après optimisation, une simulation engendre des coûts de calcul allant jusqu’à 105 TFLOP, voire 1.45 PFLOP. L’extensibilité de très bonne qualité est évaluée théoriquement et testée.  Nous avons pu constater plus de 77 % d’efficacité sur 448 processeurs au niveau de simulations entières, le noyau de calcul parallèle utilisé atteignant lui 92 %. Une étude sur l’utilisation des mémoires caches permet d’atteindre 60 % de la puissance crête au cœur des calculs.  La précision des calculs a été améliorée, on reproduit ainsi des dynamiques observées sur le terrain qui n’étaient pas accessibles avec le simulateur précédent.

 

Les techniques algorithmiques mises en œuvre pour un deuxième simulateur basé sur une méthode de type Monte-Carlo sont présentées.  Ce simulateur individu-centré utilise 3 niveaux de parallélisme différents.  On donne les performances associées à une programmation hybride sur une grappe de nœuds SMP, particulièrement bien adaptée à ce type d’application.  On compare les simulateurs stochastiques et déterministes en termes de résultats qualitatifs.  L’étude quantitative effectuée donne un éclairage nouveau sur l’interaction des mécanismes des systèmes hôte-macroparasite régulés principalement par la mort des hôtes sur-infestés.  L’analyse des simulations conduit à améliorer le modèle ; elle permet de mieux comprendre et clarifier les mécanismes du système biologique réel.

 

Mots clés :    Algorithmique parallèle, simulation numérique haute performance, système hôte-parasite, modèle discret, simulation stochastique

 

Discipline:    Informatique

 

LaBRI, Université Bordeaux 1,

Projet ScAlApplix, INRIA UR Futurs,
351, cours de la libération,
33405 Talence Cedex (FRANCE).