@MastersThesis{Kolesnikov:2021:StOpHi,
author = "Kolesnikov, Igor",
title = "Study and optimization for high performance processing with
GALPHAT",
school = "Instituto Nacional de Pesquisas Espaciais (INPE)",
year = "2021",
address = "S{\~a}o Jos{\'e} dos Campos",
month = "2020-04-23",
keywords = "computational cosmology, elliptical galaxies, Bayesian statistics,
galaxies structure and environment, high performance computing,
cosmologia computacional, gal{\'a}xias el{\'{\i}}pticas,
estat{\'{\i}}stica Bayesiana, gal{\'a}xias estrutura e
ambiente, computa{\c{c}}{\~a}o de alta performance.",
abstract = "The parametric computational modeling of galaxies is a process
with a high computational cost. The statistical component of
modeling, which may involve model refinements in relation to the
source brightness distribution achieves more satisfactory results
when the approach is Bayesian. In this research, we are using
GALaxy PHotometric ATtributes (GALPHAT) as our main tool for data
processing. The GALPHAT modeling of a galaxy observed by the Sloan
Digital Sky Survey (SDSS) can last about 6 hours. In the current
scenario of cosmology, this type of modeling, to be scientifically
effective, must be performed on a set containing about thousands
of objects. The sample analyzed within the scope of the FAPESP
thematic project that LABAC participates contains more than 24,309
objects, an amount that demands the use of high-performance
computing (HPC) to enable effective modeling of the entire sample.
In this postgraduate project, we have as the main objective to
study and optimize HPC solutions that allow GALPHAT processing on
a SDSS sample in the fastest possible way. For this, we have two
HPC systems that can work in a coordinated way to optimize the
modeling strategies. The first system belongs to LABAC and is
based on Intel Xeon Phi 7250 platform. The second system belongs
to the partition of the multi-core platform of the Santos Dumont
supercomputer. The research, therefore, includes the initial
process done to set up and run GALPHAT on both platforms, thus
using different types of processors and compilers. Considering the
different processing steps, in different modeling strategies we
applied refactoring and complete modules rewriting. Our studies
have found the optimal combination of software, hardware and
optimizations to minimize processing time. This is the first step
in implementing and integrating the graphical user interface to
make GALPHAT easier to use. This dissertation, therefore, presents
all of the activities that were performed to allow, as a final
result, to process, in a timely manner, via HPC, the entire
selected sample including the description of benchmark among the
computational systems used. It includes the development of the
auxiliary visualization system as well. RESUMO: A modelagem
computacional param{\'e}trica de gal{\'a}xias {\'e} um processo
com alto custo computacional. O componente estat{\'{\i}}stico da
modelagem, que pode envolver refinamentos do modelo em
rela{\c{c}}{\~a}o {\`a} distribui{\c{c}}{\~a}o do brilho da
fonte, obt{\'e}m resultados mais satisfat{\'o}rios quando a
abordagem {\'e} bayesiana. Nesta pesquisa, estamos usando o
GALaxy PHotome-tric ATtributes (GALPHAT) como nossa principal
ferramenta para processamento de dados. A modelagem usando o
GALPHAT de uma gal{\'a}xia observada pelo Sloan Digital Sky
Survey (SDSS) pode durar cerca de 6 horas. No cen{\'a}rio atual
da cosmologia, esse tipo de modelagem, para ser cientificamente
eficaz, deve ser realizado em um conjunto contendo milhares de
objetos. A amostra analisada dassa pesquisa, que faz parte de
projeto tem{\'a}tico da FAPESP da qual o LABAC participa
cont{\'e}m mais de 24.309 objetos, quantidade que exige o uso do
processamento de alto desempenho (PAD) para permitir a modelagem
eficaz de toda a amostra. Neste projeto de
p{\'o}s-gradua{\c{c}}{\~a}o, temos como principal objetivo
estudar e otimizar solu{\c{c}}{\~o}es de PAD que permitem o
processamento com GALPHAT em uma amostra de SDSS da maneira mais
r{\'a}pida poss{\'{\i}}vel. Para isso, temos dois sistemas PAD
que podem funcionar de maneira coordenada para otimizar as
estrat{\'e}gias de modelagem. O primeiro sistema pertence ao
LABAC e {\'e} baseado na plataforma Intel Xeon Phi 7250. O
segundo sistema pertence {\`a} parti{\c{c}}{\~a}o da plataforma
multin{\'u}cleo do supercomputador Santos Dumont. A pesquisa,
portanto, inclui o processo inicial feito para configurar e
executar o GALPHAT nas duas plataformas, usando diferentes tipos
de processadores e compiladores. Considerando as diferentes etapas
de processamento, nas diferentes estrat{\'e}gias de modelagem,
aplicamos a refatora{\c{c}}{\~a}o e a reescrita completa dos
m{\'o}dulos de pipeline. Nossos estudos descobriram a
combina{\c{c}}{\~a}o ideal de software, hardware e
otimiza{\c{c}}{\~o}es para minimizar o tempo de processamento.
Este {\'e} o primeiro passo na implementa{\c{c}}{\~a}o e
integra{\c{c}}{\~a}o da interface gr{\'a}fica do usu{\'a}rio
para facilitar o uso do GALPHAT. Esta disserta{\c{c}}{\~a}o,
portanto, apresenta todas as atividades realizadas para permitir,
como resultado final, processar em tempo h{\'a}bil, via PAD, toda
a amostra selecionada, incluindo a descri{\c{c}}{\~a}o de uma
refer{\^e}ncia entre os sistemas computacionais utilizados.
Inclui tamb{\'e}m o desenvolvimento do sistema de
visualiza{\c{c}}{\~a}o auxiliar.",
committee = "Santos, Rafael Duarte Coelho dos (presidente) and Mendes, Celso
Luiz (orientador) and Rosa, Reinaldo Roberto (orientador) and
Queiroz, Gilberto Ribeiro de and Oliveira Filho, Irapuan Rodrigues
de",
englishtitle = "Estudo e otimiza{\c{c}}{\~a}o para processamento de alto
desempenho com GALPHAT",
language = "en",
pages = "63",
ibi = "8JMKD3MGP3W34R/42C2DGH",
url = "http://urlib.net/ibi/8JMKD3MGP3W34R/42C2DGH",
targetfile = "publicacao_FA provisoria.pdf",
urlaccessdate = "28 mar. 2024"
}