Desafios e oportunidades para análise de dados em grandes pesquisas astronômicas

Em setembro, o Dr. Alessandro Ederoclite, do Centro de Estudios de Física del Cosmos de Aragón, Teruel, Espanha , visitará o Instituto Nacional de Pesquisas Espaciais (INPE) para algumas palestras e conversas sobre levantamentos astronômicos, ferramentas computacionais e aplicações.

A visita do Dr. Ederoclite será patrocinada por uma bolsa CAPES (Impresso).

Datas : 9 e 10 de setembro , das 9h30 às 11h30 e das 13h00 às 14h00

Instrutor : Dr. Alessandro Ederoclite, Centro de Estudos de Física do Cosmos de Aragão, Teruel, Espanha

Duração : 6 horas

Location: Sergio Sobral Auditorium at INPE – Instituto Nacional de Pesquisas Espaciais, São José dos Campos, SP (https://maps.app.goo.gl/oBp983yTic6rFGzH7)

Público : Estudantes de pós-graduação (mestrado e doutorado) em Ciência da Computação, Astronomia e Astrofísica (não exclusivo).

Objetivo : Apresentar pesquisas astronômicas, acesso e processamento de dados, ferramentas, desafios e oportunidades na ciência de dados dentro da astronomia.

Lugares disponíveis : Lugares limitados disponíveis! Garanta seu lugar com antecedência.

Inscrições : https://espacovirtual.inpe.br/moodle/course/view.php?id=41
Contato e dúvidas : Rafael Santos ( rafael.santos@inpe.br )

Dia 1

Introdução a Grandes Pesquisas Astronômicas

Objetivo : Fornecer uma compreensão fundamental dos levantamentos astronômicos e sua importância.

Tópicos :

–              Visão geral dos levantamentos astronômicos:

o   Breve história e evolução dos levantamentos astronômicos.

o   Exemplos de pesquisas importantes: Sloan Digital Sky Survey (SDSS), Gaia, LSST (Legacy Survey of Space and Time), DES (Dark Energy Survey), etc.

–              Principais objetivos científicos:

o   Mapear o cosmos, entender a evolução cósmica, detectar exoplanetas, estudar matéria/energia escura, etc.

–              Tipos de dados coletados:

o   Imagem, espectroscopia, dados de séries temporais.

–              Atividade: Discussão geral com perguntas e respostas sobre como os dados astronômicos diferem de outros grandes conjuntos de dados.

Acesso aos dados e processamento inicial

Objetivo : Ensinar como acessar dados de pesquisas astronômicas e executar etapas iniciais de processamento.

Tópicos :

–              Repositórios de Dados e Acesso:

o   Como acessar dados de grandes pesquisas (SDSS, Gaia, etc.).

o   APIs e portais de dados (por exemplo, serviços Vizier, Aladin, TAP).

–              Formatos de dados:

o   Introdução ao FITS (Flexible Image Transport System) e outros formatos de dados comuns.

o   Diferenças entre dados brutos e processados.

–              Tratamento básico de dados:

o   Ferramentas para acesso a dados: bibliotecas Python (AstroPy, Astroquery).

o   Introdução à consulta baseada em SQL (por exemplo, CasJobs para SDSS).

–              Atividade: Exercício prático: Acessar e baixar um pequeno conjunto de dados de uma pesquisa pública.

Limpeza e preparação de dados

Objetivo : Abordar técnicas de limpeza e preparação de dados astronômicos para análise.

Tópicos :

–              Desafios em Dados Astronômicos:

o   Lidar com ruído, dados ausentes e artefatos.

o   Compreender a calibração de dados (por exemplo, correções fotométricas e espectroscópicas).

–              Pré-processamento de dados:

o   Manipulação de grandes conjuntos de dados: subamostragem, redução de dimensionalidade.

o   Pré-processamento de séries temporais: remoção de tendências, dobramento.

–              Ferramentas práticas:

o   Ferramentas Python para limpeza de dados (Pandas, NumPy).

o   Bibliotecas especializadas (por exemplo, Lightkurve para dados de séries temporais).

–              Atividade: Sessão de codificação guiada: Limpeza de um conjunto de dados de amostra usando Python.

Dia 2

Técnicas avançadas de análise de dados

Objetivo : Introduzir técnicas avançadas de análise de dados adaptadas à astronomia.

Tópicos :

–              Aprendizado de máquina em astronomia:

o   Casos de uso: Classificação de objetos celestes, detecção de anomalias, estimativa de desvio para o vermelho fotométrico.

o   Técnicas: Aprendizagem supervisionada vs. não supervisionada, aprendizagem profunda.

–              Análise de séries temporais:

o   Métodos de detecção de período (Lomb-Scargle, autocorrelação).

o   Lidar com amostragens irregulares e lacunas.

–              Análise Espectral:

o   Técnicas de classificação espectral e determinação de desvio para o vermelho.

o   Ferramentas: Specutils, SciPy para dados espectrais.

–              Atividade: Codificação prática: Aplicando um modelo de aprendizado de máquina para classificar objetos astronômicos.

Desafios e Direções Futuras

Objetivo : Discutir os desafios atuais e explorar direções futuras na análise de dados astronômicos.

Tópicos :

–              Desafios de escalabilidade:

o   Trabalhando com conjuntos de dados em escala de petabytes: Computação distribuída, recursos de nuvem.

o   Ferramentas: Dask, Apache Spark, Google Cloud/AWS para processamento em larga escala.

–              Gestão de Dados:

o   Arquivamento de dados, padrões de metadados (padrões VO, IVOA).

o   Reprodutibilidade e ciência aberta.

–              Desafios emergentes:

o   Análise de dados em tempo real (por exemplo, detecção transitória em LSST).

o   Integração com astronomia multi-comprimento de onda/multi- mensageiro.

–              Discussão: Discussão aberta sobre desafios emergentes e como a ciência da computação pode contribuir para resolvê-los.

Estudos de caso e ideias de projetos

Objetivo : Aplicar conhecimento por meio de estudos de caso e debater ideias de projetos.

Tópicos :

–              Estudos de caso:

o   Histórias de sucesso de descobertas baseadas em dados em astronomia (por exemplo, ondas gravitacionais, detecção de exoplanetas).

o   Aplicações reais de aprendizado de máquina em pesquisas astronômicas.

–              Ideias de Projetos:

o   Sessão de brainstorming: Identificando potenciais projetos de pesquisa para ciência de dados em astronomia.

o   Discutir colaborações interdisciplinares.

–               Atividade : Trabalho em grupo: Os alunos propõem um projeto de pequena escala com base no que aprenderam.

Notas Finais

–              Recursos: Forneça aos alunos uma lista de leituras importantes, conjuntos de dados e ferramentas on-line.