Desafios e oportunidades para análise de dados em grandes pesquisas astronômicas
Em setembro, o Dr. Alessandro Ederoclite, do Centro de Estudios de Física del Cosmos de Aragón, Teruel, Espanha , visitará o Instituto Nacional de Pesquisas Espaciais (INPE) para algumas palestras e conversas sobre levantamentos astronômicos, ferramentas computacionais e aplicações.
A visita do Dr. Ederoclite será patrocinada por uma bolsa CAPES (Impresso).
Datas : 9 e 10 de setembro , das 9h30 às 11h30 e das 13h00 às 14h00
Instrutor : Dr. Alessandro Ederoclite, Centro de Estudos de Física do Cosmos de Aragão, Teruel, Espanha
Duração : 6 horas
Location: Sergio Sobral Auditorium at INPE – Instituto Nacional de Pesquisas Espaciais, São José dos Campos, SP (https://maps.app.goo.gl/oBp983yTic6rFGzH7)
Público : Estudantes de pós-graduação (mestrado e doutorado) em Ciência da Computação, Astronomia e Astrofísica (não exclusivo).
Objetivo : Apresentar pesquisas astronômicas, acesso e processamento de dados, ferramentas, desafios e oportunidades na ciência de dados dentro da astronomia.
Lugares disponíveis : Lugares limitados disponíveis! Garanta seu lugar com antecedência.
Inscrições : https://espacovirtual.inpe.br/moodle/course/view.php?id=41
Contato e dúvidas : Rafael Santos ( rafael.santos@inpe.br )
Dia 1
Introdução a Grandes Pesquisas Astronômicas
Objetivo : Fornecer uma compreensão fundamental dos levantamentos astronômicos e sua importância.
Tópicos :
– Visão geral dos levantamentos astronômicos:
o Breve história e evolução dos levantamentos astronômicos.
o Exemplos de pesquisas importantes: Sloan Digital Sky Survey (SDSS), Gaia, LSST (Legacy Survey of Space and Time), DES (Dark Energy Survey), etc.
– Principais objetivos científicos:
o Mapear o cosmos, entender a evolução cósmica, detectar exoplanetas, estudar matéria/energia escura, etc.
– Tipos de dados coletados:
o Imagem, espectroscopia, dados de séries temporais.
– Atividade: Discussão geral com perguntas e respostas sobre como os dados astronômicos diferem de outros grandes conjuntos de dados.
Acesso aos dados e processamento inicial
Objetivo : Ensinar como acessar dados de pesquisas astronômicas e executar etapas iniciais de processamento.
Tópicos :
– Repositórios de Dados e Acesso:
o Como acessar dados de grandes pesquisas (SDSS, Gaia, etc.).
o APIs e portais de dados (por exemplo, serviços Vizier, Aladin, TAP).
– Formatos de dados:
o Introdução ao FITS (Flexible Image Transport System) e outros formatos de dados comuns.
o Diferenças entre dados brutos e processados.
– Tratamento básico de dados:
o Ferramentas para acesso a dados: bibliotecas Python (AstroPy, Astroquery).
o Introdução à consulta baseada em SQL (por exemplo, CasJobs para SDSS).
– Atividade: Exercício prático: Acessar e baixar um pequeno conjunto de dados de uma pesquisa pública.
Limpeza e preparação de dados
Objetivo : Abordar técnicas de limpeza e preparação de dados astronômicos para análise.
Tópicos :
– Desafios em Dados Astronômicos:
o Lidar com ruído, dados ausentes e artefatos.
o Compreender a calibração de dados (por exemplo, correções fotométricas e espectroscópicas).
– Pré-processamento de dados:
o Manipulação de grandes conjuntos de dados: subamostragem, redução de dimensionalidade.
o Pré-processamento de séries temporais: remoção de tendências, dobramento.
– Ferramentas práticas:
o Ferramentas Python para limpeza de dados (Pandas, NumPy).
o Bibliotecas especializadas (por exemplo, Lightkurve para dados de séries temporais).
– Atividade: Sessão de codificação guiada: Limpeza de um conjunto de dados de amostra usando Python.
Dia 2
Técnicas avançadas de análise de dados
Objetivo : Introduzir técnicas avançadas de análise de dados adaptadas à astronomia.
Tópicos :
– Aprendizado de máquina em astronomia:
o Casos de uso: Classificação de objetos celestes, detecção de anomalias, estimativa de desvio para o vermelho fotométrico.
o Técnicas: Aprendizagem supervisionada vs. não supervisionada, aprendizagem profunda.
– Análise de séries temporais:
o Métodos de detecção de período (Lomb-Scargle, autocorrelação).
o Lidar com amostragens irregulares e lacunas.
– Análise Espectral:
o Técnicas de classificação espectral e determinação de desvio para o vermelho.
o Ferramentas: Specutils, SciPy para dados espectrais.
– Atividade: Codificação prática: Aplicando um modelo de aprendizado de máquina para classificar objetos astronômicos.
Desafios e Direções Futuras
Objetivo : Discutir os desafios atuais e explorar direções futuras na análise de dados astronômicos.
Tópicos :
– Desafios de escalabilidade:
o Trabalhando com conjuntos de dados em escala de petabytes: Computação distribuída, recursos de nuvem.
o Ferramentas: Dask, Apache Spark, Google Cloud/AWS para processamento em larga escala.
– Gestão de Dados:
o Arquivamento de dados, padrões de metadados (padrões VO, IVOA).
o Reprodutibilidade e ciência aberta.
– Desafios emergentes:
o Análise de dados em tempo real (por exemplo, detecção transitória em LSST).
o Integração com astronomia multi-comprimento de onda/multi- mensageiro.
– Discussão: Discussão aberta sobre desafios emergentes e como a ciência da computação pode contribuir para resolvê-los.
Estudos de caso e ideias de projetos
Objetivo : Aplicar conhecimento por meio de estudos de caso e debater ideias de projetos.
Tópicos :
– Estudos de caso:
o Histórias de sucesso de descobertas baseadas em dados em astronomia (por exemplo, ondas gravitacionais, detecção de exoplanetas).
o Aplicações reais de aprendizado de máquina em pesquisas astronômicas.
– Ideias de Projetos:
o Sessão de brainstorming: Identificando potenciais projetos de pesquisa para ciência de dados em astronomia.
o Discutir colaborações interdisciplinares.
– Atividade : Trabalho em grupo: Os alunos propõem um projeto de pequena escala com base no que aprenderam.
Notas Finais
– Recursos: Forneça aos alunos uma lista de leituras importantes, conjuntos de dados e ferramentas on-line.