Fechar

@MastersThesis{Kolesnikov:2021:StOpHi,
               author = "Kolesnikov, Igor",
                title = "Study and optimization for high performance processing with 
                         GALPHAT",
               school = "Instituto Nacional de Pesquisas Espaciais (INPE)",
                 year = "2021",
              address = "S{\~a}o Jos{\'e} dos Campos",
                month = "2020-04-23",
             keywords = "computational cosmology, elliptical galaxies, Bayesian statistics, 
                         galaxies structure and environment, high performance computing, 
                         cosmologia computacional, gal{\'a}xias el{\'{\i}}pticas, 
                         estat{\'{\i}}stica Bayesiana, gal{\'a}xias estrutura e 
                         ambiente, computa{\c{c}}{\~a}o de alta performance.",
             abstract = "The parametric computational modeling of galaxies is a process 
                         with a high computational cost. The statistical component of 
                         modeling, which may involve model refinements in relation to the 
                         source brightness distribution achieves more satisfactory results 
                         when the approach is Bayesian. In this research, we are using 
                         GALaxy PHotometric ATtributes (GALPHAT) as our main tool for data 
                         processing. The GALPHAT modeling of a galaxy observed by the Sloan 
                         Digital Sky Survey (SDSS) can last about 6 hours. In the current 
                         scenario of cosmology, this type of modeling, to be scientifically 
                         effective, must be performed on a set containing about thousands 
                         of objects. The sample analyzed within the scope of the FAPESP 
                         thematic project that LABAC participates contains more than 24,309 
                         objects, an amount that demands the use of high-performance 
                         computing (HPC) to enable effective modeling of the entire sample. 
                         In this postgraduate project, we have as the main objective to 
                         study and optimize HPC solutions that allow GALPHAT processing on 
                         a SDSS sample in the fastest possible way. For this, we have two 
                         HPC systems that can work in a coordinated way to optimize the 
                         modeling strategies. The first system belongs to LABAC and is 
                         based on Intel Xeon Phi 7250 platform. The second system belongs 
                         to the partition of the multi-core platform of the Santos Dumont 
                         supercomputer. The research, therefore, includes the initial 
                         process done to set up and run GALPHAT on both platforms, thus 
                         using different types of processors and compilers. Considering the 
                         different processing steps, in different modeling strategies we 
                         applied refactoring and complete modules rewriting. Our studies 
                         have found the optimal combination of software, hardware and 
                         optimizations to minimize processing time. This is the first step 
                         in implementing and integrating the graphical user interface to 
                         make GALPHAT easier to use. This dissertation, therefore, presents 
                         all of the activities that were performed to allow, as a final 
                         result, to process, in a timely manner, via HPC, the entire 
                         selected sample including the description of benchmark among the 
                         computational systems used. It includes the development of the 
                         auxiliary visualization system as well. RESUMO: A modelagem 
                         computacional param{\'e}trica de gal{\'a}xias {\'e} um processo 
                         com alto custo computacional. O componente estat{\'{\i}}stico da 
                         modelagem, que pode envolver refinamentos do modelo em 
                         rela{\c{c}}{\~a}o {\`a} distribui{\c{c}}{\~a}o do brilho da 
                         fonte, obt{\'e}m resultados mais satisfat{\'o}rios quando a 
                         abordagem {\'e} bayesiana. Nesta pesquisa, estamos usando o 
                         GALaxy PHotome-tric ATtributes (GALPHAT) como nossa principal 
                         ferramenta para processamento de dados. A modelagem usando o 
                         GALPHAT de uma gal{\'a}xia observada pelo Sloan Digital Sky 
                         Survey (SDSS) pode durar cerca de 6 horas. No cen{\'a}rio atual 
                         da cosmologia, esse tipo de modelagem, para ser cientificamente 
                         eficaz, deve ser realizado em um conjunto contendo milhares de 
                         objetos. A amostra analisada dassa pesquisa, que faz parte de 
                         projeto tem{\'a}tico da FAPESP da qual o LABAC participa 
                         cont{\'e}m mais de 24.309 objetos, quantidade que exige o uso do 
                         processamento de alto desempenho (PAD) para permitir a modelagem 
                         eficaz de toda a amostra. Neste projeto de 
                         p{\'o}s-gradua{\c{c}}{\~a}o, temos como principal objetivo 
                         estudar e otimizar solu{\c{c}}{\~o}es de PAD que permitem o 
                         processamento com GALPHAT em uma amostra de SDSS da maneira mais 
                         r{\'a}pida poss{\'{\i}}vel. Para isso, temos dois sistemas PAD 
                         que podem funcionar de maneira coordenada para otimizar as 
                         estrat{\'e}gias de modelagem. O primeiro sistema pertence ao 
                         LABAC e {\'e} baseado na plataforma Intel Xeon Phi 7250. O 
                         segundo sistema pertence {\`a} parti{\c{c}}{\~a}o da plataforma 
                         multin{\'u}cleo do supercomputador Santos Dumont. A pesquisa, 
                         portanto, inclui o processo inicial feito para configurar e 
                         executar o GALPHAT nas duas plataformas, usando diferentes tipos 
                         de processadores e compiladores. Considerando as diferentes etapas 
                         de processamento, nas diferentes estrat{\'e}gias de modelagem, 
                         aplicamos a refatora{\c{c}}{\~a}o e a reescrita completa dos 
                         m{\'o}dulos de pipeline. Nossos estudos descobriram a 
                         combina{\c{c}}{\~a}o ideal de software, hardware e 
                         otimiza{\c{c}}{\~o}es para minimizar o tempo de processamento. 
                         Este {\'e} o primeiro passo na implementa{\c{c}}{\~a}o e 
                         integra{\c{c}}{\~a}o da interface gr{\'a}fica do usu{\'a}rio 
                         para facilitar o uso do GALPHAT. Esta disserta{\c{c}}{\~a}o, 
                         portanto, apresenta todas as atividades realizadas para permitir, 
                         como resultado final, processar em tempo h{\'a}bil, via PAD, toda 
                         a amostra selecionada, incluindo a descri{\c{c}}{\~a}o de uma 
                         refer{\^e}ncia entre os sistemas computacionais utilizados. 
                         Inclui tamb{\'e}m o desenvolvimento do sistema de 
                         visualiza{\c{c}}{\~a}o auxiliar.",
            committee = "Santos, Rafael Duarte Coelho dos (presidente) and Mendes, Celso 
                         Luiz (orientador) and Rosa, Reinaldo Roberto (orientador) and 
                         Queiroz, Gilberto Ribeiro de and Oliveira Filho, Irapuan Rodrigues 
                         de",
         englishtitle = "Estudo e otimiza{\c{c}}{\~a}o para processamento de alto 
                         desempenho com GALPHAT",
             language = "en",
                pages = "63",
                  ibi = "8JMKD3MGP3W34R/42C2DGH",
                  url = "http://urlib.net/ibi/8JMKD3MGP3W34R/42C2DGH",
           targetfile = "publicacao_FA provisoria.pdf",
        urlaccessdate = "28 mar. 2024"
}


Fechar