Fechar

%0 Thesis
%4 sid.inpe.br/mtc-m21c/2020/04.20.16.10
%2 sid.inpe.br/mtc-m21c/2020/04.20.16.10.04
%T Study and optimization for high performance processing with GALPHAT
%J Estudo e otimização para processamento de alto desempenho com GALPHAT
%D 2021
%8 2020-04-23
%9 Dissertação (Mestrado em Computação Aplicada)
%P 63
%A Kolesnikov, Igor,
%E Santos, Rafael Duarte Coelho dos (presidente),
%E Mendes, Celso Luiz (orientador),
%E Rosa, Reinaldo Roberto (orientador),
%E Queiroz, Gilberto Ribeiro de,
%E Oliveira Filho, Irapuan Rodrigues de,
%I Instituto Nacional de Pesquisas Espaciais (INPE)
%C São José dos Campos
%K computational cosmology, elliptical galaxies, Bayesian statistics, galaxies structure and environment, high performance computing, cosmologia computacional, galáxias elípticas, estatística Bayesiana, galáxias estrutura e ambiente, computação de alta performance.
%X The parametric computational modeling of galaxies is a process with a high computational cost. The statistical component of modeling, which may involve model refinements in relation to the source brightness distribution achieves more satisfactory results when the approach is Bayesian. In this research, we are using GALaxy PHotometric ATtributes (GALPHAT) as our main tool for data processing. The GALPHAT modeling of a galaxy observed by the Sloan Digital Sky Survey (SDSS) can last about 6 hours. In the current scenario of cosmology, this type of modeling, to be scientifically effective, must be performed on a set containing about thousands of objects. The sample analyzed within the scope of the FAPESP thematic project that LABAC participates contains more than 24,309 objects, an amount that demands the use of high-performance computing (HPC) to enable effective modeling of the entire sample. In this postgraduate project, we have as the main objective to study and optimize HPC solutions that allow GALPHAT processing on a SDSS sample in the fastest possible way. For this, we have two HPC systems that can work in a coordinated way to optimize the modeling strategies. The first system belongs to LABAC and is based on Intel Xeon Phi 7250 platform. The second system belongs to the partition of the multi-core platform of the Santos Dumont supercomputer. The research, therefore, includes the initial process done to set up and run GALPHAT on both platforms, thus using different types of processors and compilers. Considering the different processing steps, in different modeling strategies we applied refactoring and complete modules rewriting. Our studies have found the optimal combination of software, hardware and optimizations to minimize processing time. This is the first step in implementing and integrating the graphical user interface to make GALPHAT easier to use. This dissertation, therefore, presents all of the activities that were performed to allow, as a final result, to process, in a timely manner, via HPC, the entire selected sample including the description of benchmark among the computational systems used. It includes the development of the auxiliary visualization system as well. RESUMO: A modelagem computacional paramétrica de galáxias é um processo com alto custo computacional. O componente estatístico da modelagem, que pode envolver refinamentos do modelo em relação à distribuição do brilho da fonte, obtém resultados mais satisfatórios quando a abordagem é bayesiana. Nesta pesquisa, estamos usando o GALaxy PHotome-tric ATtributes (GALPHAT) como nossa principal ferramenta para processamento de dados. A modelagem usando o GALPHAT de uma galáxia observada pelo Sloan Digital Sky Survey (SDSS) pode durar cerca de 6 horas. No cenário atual da cosmologia, esse tipo de modelagem, para ser cientificamente eficaz, deve ser realizado em um conjunto contendo milhares de objetos. A amostra analisada dassa pesquisa, que faz parte de projeto temático da FAPESP da qual o LABAC participa contém mais de 24.309 objetos, quantidade que exige o uso do processamento de alto desempenho (PAD) para permitir a modelagem eficaz de toda a amostra. Neste projeto de pós-graduação, temos como principal objetivo estudar e otimizar soluções de PAD que permitem o processamento com GALPHAT em uma amostra de SDSS da maneira mais rápida possível. Para isso, temos dois sistemas PAD que podem funcionar de maneira coordenada para otimizar as estratégias de modelagem. O primeiro sistema pertence ao LABAC e é baseado na plataforma Intel Xeon Phi 7250. O segundo sistema pertence à partição da plataforma multinúcleo do supercomputador Santos Dumont. A pesquisa, portanto, inclui o processo inicial feito para configurar e executar o GALPHAT nas duas plataformas, usando diferentes tipos de processadores e compiladores. Considerando as diferentes etapas de processamento, nas diferentes estratégias de modelagem, aplicamos a refatoração e a reescrita completa dos módulos de pipeline. Nossos estudos descobriram a combinação ideal de software, hardware e otimizações para minimizar o tempo de processamento. Este é o primeiro passo na implementação e integração da interface gráfica do usuário para facilitar o uso do GALPHAT. Esta dissertação, portanto, apresenta todas as atividades realizadas para permitir, como resultado final, processar em tempo hábil, via PAD, toda a amostra selecionada, incluindo a descrição de uma referência entre os sistemas computacionais utilizados. Inclui também o desenvolvimento do sistema de visualização auxiliar.
%@language en
%3 publicacao_FA provisoria.pdf


Fechar