Gisele Lobo Pappa
CNPq research fellow: 1D
Research areas: Degrees:
Doutor, University of Kent at Canterbury, Inglaterra, 2007
Phone: 7536
glpappa@dcc.ufmg.br
Home page Lattes Google scholar
Information extracted from Lattes platform
Last update: 2023/05/29Current projects
2023 a Atual | Modelos de Linguagem para Classificação de Documentos de Licitações Públicas ***Chamada CNPq/AWS 64/2022 *** No Brasil, todo processo de compra pública se inicia com uma (dispensa de) licitação. Em 2022, foram gastos mais de 85 bilhões de reais em compras públicas de produtos (serviços não são contabilizados) em mais de 100 mil processos licitatórios (https://paineldeprecos.planejamento.gov.br/analise-materiais). Esse grande volume de processos torna o acompanhamento e fiscalização dessas compras um desafio, principalmente porque elas podem ser realizadas em quaisquer uma das 27 unidades federadas e 5.570 cidades brasileiras, além do governo federal. O objetivo maior desse projeto é auxiliar no processo de automatização de detecção de fraudes em licitações, focando na classificação de documentos de licitação de acordo com seu tipo. Ao coletar dados de licitações públicas de Portais da Transparência, principalmente de municípios, nos deparamos com múltiplos arquivos que refletem todo o processo licitatório, incluindo editais, atas, erratas, homologações, avisos, contratos, ratificações, dentre outros. Saber o tipo de arquivo sendo coletado é o primeiro passo para uma extração de entidades (i.e., datas, CNPJs, produtos, valores, etc), que depois poderão ser manipuladas para identificação de diferentes tipos de fraudes. Integrantes: Gisele Lobo Pappa (coordenador). |
2022 a Atual | ProCoReS - Caracterização e Modelagem de Processos de Contágio em Redes Sociais de Diferentes Domínios ********Projeto Universal CNPq - Chamada CNPq/MCTI/FNDCT Nº 18/2021 - Faixa B - Grupos Consolidados. Redes sociais são a base da organização da sociedade, formadas por 2 elementos: pessoas e suas conexões (ex. familiar, amizade, trabalho). Tal combinação resulta em estruturas simples ou extremamente complexas. Em especial, conexões representam padrões de ligações que podem ser efêmeras/duradouras, casuais/intensas e pessoais/anônimas. Atreladas a elas, estão processos de contágio ou fluxos que passam pelas ligações entre as pessoas -- ex., doença, dinheiro, conhecimento, comportamento, obesidade. Para modelar redes e contágio, a maioria das soluções atuais utiliza grafos. Porém, eles não são totalmente realistas, e novos modelos de processos de contágio devem permitir: representação de diferentes classes de indivíduos e conexões, ligação entre processos e ocorrência concomitantes, e conexões com dois ou mais indivíduos ao mesmo tempo. Entender como conexões são formadas e como os tipos de fluxos permeiam tais redes é fundamental para entender como nossa sociedade se organiza e evolui. O objetivo é propor modelos matemáticos, estatísticos, de agentes e de aprendizado de máquina que consideram: múltiplos aspectos complexos de processos de contágio social e parametrização através de fontes de dados (ex., redes sociais online, mobilidade, colaborações). Tais modelos devem permitir classes de indivíduos e relacionamentos; modelar a co-ocorrência, causalidade e ligação entre processos de contágio; e representar multi-relacionamentos.. Integrantes: COUTO DA SILVA, ANA PAULA (coordenador), Gisele Lobo Pappa, Clodoveu Davis. |
2022 a Atual | Instituto Nacional de Inteligência Artificial ** Edital Nº 58/2022 - Programa Institutos Nacionais de Ciência e Tecnologia - INCT do CNPq.*** A criação de um Instituto Nacional de Ciência e Tecnologia em Inteligência Artificial (IAIA) irá reunir e estimular pesquisas científicas, tecnológicas e de inovação colaborativas em Inteligência Artificial, além de tornar a Inteligência Artificial brasileira internacionalmente reconhecida pela qualidade de suas pesquisas. A iniciativa desenvolverá um forte programa de capacitação de formação de recursos humanos em Inteligência Artificial, inclusive Inteligência Artificial aplicada. O IAIA tem 87 pesquisadores. Integrantes: Teresa Ludermir (coordenador), Gisele Lobo Pappa, Meira. |
2021 a Atual | Centro de Inovação em Inteligencia Artifical para a Saúde (CIIA- Saude) ******* Edital FAPESP/MCTI/CGI-Br ********* Pesquisa e o desenvolvimento de soluções avançadas de inteligência artificial (IA), capazes de auxiliar profissionais de saúde no diagnóstico e tratamento de doenças, e orientar gestores de saúde na programação de ações de prevenção e organização da assistência à saúde. Isso permitirá a otimização dos recursos e melhora da atenção à saúde da população no Brasil. Integrantes: Virgilio A. F. Almeida (coordenador), Gisele Lobo Pappa, Wagner Meira. |
2021 a Atual | Captar-Libras: Sistema de Comunicação por vídeos para surdos aplicado ao pré-atendimento médico Pesquisa e desenvolvimento de métodos e técnicas de IHC, Visão Computacional (VC) e Inteligência Artificial (IA) que viabilizem a comunicação entre surdos e profissionais de saúde, no contexto de pré-atendimento médico, sem a necessidade de um intérprete. Integrantes: Mario Fernando Montenegro Campos (coordenador), Gisele Lobo Pappa, Erickson Rangel Nascimento. |
2020 a Atual | Programa de Capacidades Analíticas do Ministério Público do Estado de Minas Gerais - MPMG Consultoria técnica especializada para prestação de serviços de pesquisa e desenvolvimento na área da Inteligência Artificial Aplicada e soluções de Big Data, vinculada ao escopo do Programa de Capacidades Analíticas do MPMG, incluindo transferência de conhecimento, por meio de mentoring e operação assistida.. Integrantes: Wagner Meira (coordenador), Gisele Lobo Pappa, Anisio. |
2017 a Atual | INCT Cyber: Instituto Nacional de Ciência e Tecnologia para uma Sociedade Massivamente Conectada A missão do Instituto Nacional de Ciência e Tecnologia para uma Sociedade Massivamente Conectada: Uma Abordagem Ciberfı́sica e Social (INCT-Cyber) é entender e desenvolver princı́pios cientı́ficos e tecnologias necessárias para as interações futuras entre seres humanos, computadores e o mundo fı́sico. Os princı́pios que norteiam o INCT-MCS são: (1) desenvolver sistemas e tecnologias necessárias para construir sistemas ciberfı́sicos complexos que as pessoas possam usar com grande confiança; (2) acelerar a implantação de sistemas ciberfı́sicos e sociais em uma sociedade massivamente conectada através do desenvolvimento de métodos, ferramentas e componentes de software e hardware baseados em princı́pios transversais, validados por meio protótipos e cenários de teste; (3) transferir os resultados cientı́ficos e tecnológicos alcançados para a indústria. Integrantes: Virgilio A. F. Almeida (coordenador), Gisele Lobo Pappa. |
2017 a Atual | Novos Algoritmos para Geração Automática de Fluxos de tarefas em Aprendizado de Máquina ****************** EDITAL PPM XI FAPEMIG 02/2017 ***************************** Nos últimos anos, o interesse da comunidade científica e da indústria em técnicas de aprendizado de máquina cresceu virtuosamente. Porém, para um leigo na área, utilizar os métodos disponíveis de forma eficaz para extrair conhecimento de bases de dados é um desafio, pois é preciso ter conhecimento de uma variedade de métodos e seus parâmetros. Isso porque, de acordo com o teorema da generalização do aprendizado, não existe algoritmo que seja o melhor para qualquer base de dados. Além de ser uma tarefa difícil, a escolha dos melhores algoritmos e seus parâmetros é massante, pois envolve testar manualmente uma infinidade de combinações possíveis. Esse projeto propõe métodos capazes de gerar automaticamente o que chamamos de fluxos de tarefas para resolver problemas de aprendizado de máquina. Fluxos são definidos como sequências de passos a ser seguidos para resolver com sucesso uma tarefa em uma base de dados específica, como as técnicas de pré-processamento e o algoritmo mais apropriado e seus parâmetros. Iremos modelar dois tipos de algoritmos de programação genética (PG) para gerar automaticamente fluxos de tarefas customizados para uma base de dados específica: PG baseada em gramática e PG semântica. Enquanto a modelagem do primeiro tipo de método é direta, existem muitos desafios na concepção do segundo método. Assim, esse projeto contribuirá também para melhorar o processo de busca de algoritmos de PG semântica. Em particular, trataremos do problema de escalabilidade desses métodos. A escalabilidade é um problema porque esses métodos atuam sobre um espaço semântico, cujo número de dimensões é definido de acordo com o tamanho do conjunto de dados de treinamento. Para resolver esse problema, iremos propor várias formas de realizar uma amostragem do espaço de dados. Como resultados, além dos dois métodos mencionados, geraremos um protótipo de uma ferramenta que permitirá que qualquer usuário leigo seja capaz de gerar o melhor fluxo para sua base de dados de interesse. Integrantes: Gisele Lobo Pappa (coordenador), Alex Alves Freitas, Alex Guimaraes de Sa, Walter J G S Pinto. |
2008 a Atual | Instituto Nacional de Ciência e Tecnologia para Web - InWeb www.inweb.org.br Os Institutos Nacionais de Ciência e Tecnologia deverão ocupar posição estratégica no Sistema Nacional de Ciência e Tecnologia (SNCT) desenvolvendo programas de pesquisas consistentes e prioritários para o desenvolvimento científico e tecnológico e, particularmente, para a sociedade. O ICNT Web é uma rede integrada de pesquisadores de quatro instituições, coordenada pelo prof. Virgilio Almeida, do Departamento de Ciência da Computação da UFMG. A Web é o maior sistema de informação e comunicação já construído, e interfere de forma significativa nas atividades humanas. O INCT Web foi criado para projetar e desenvolver sistemas, tecnologias e aplicações que permitam explorar as possibilidades de uso da Web no futuro de forma benéfica para a sociedade. O INCT Web visa estudar e entender os fundamentos científicos e tecnológicos da Web, bem como suas repercussões sociais, para propor e desenvolver sistemas e tecnologias que poderão compor a Web do futuro. Integrantes: Virgilio A. F. Almeida (coordenador), Gisele Lobo Pappa, Nivio Ziviani. |
Current applied research projects
Recent publications
Articles in journals
Gestational age assessed by optical skin reflection in low-birth-weight newborns: Applications in classification at birth2023. Frontiers in Pediatrics.
Counterfactual inference with latent variable and its application in mental health care
2022. DATA MINING AND KNOWLEDGE DISCOVERY.
Metaheuristics -In the Large-
2022. EUROPEAN JOURNAL OF OPERATIONAL RESEARCH.
Probabilistic topic modeling for short text based on word embedding networks
2022. APPLIED INTELLIGENCE.
Social Determinants in Self-Protective Behavior Related to COVID-19: Association Rule-Mining Study
2022. JMIR PUBLIC HEALTH AND SURVEILLANCE.
Newborn Skin Maturity Medical Device Validation for Gestational Age Prediction: Clinical Trial
2022. JOURNAL OF MEDICAL INTERNET RESEARCH.
Political polarization on Twitter during the COVID-19 pandemic: a case study in Brazil
2022. SOCIAL NETWORK ANALYSIS AND MINING.
Explainable Regression Via Prototypes
2022. ACM Transactions on Evolutionary Learning and Optimization.
Multi-region symbolic regression: combining functions under a multi-objective approach
2021. Natural Computing.
An Instance Space Analysis of Regression Problems
2021. ACM Transactions on Knowledge Discovery from Data.
Towards automatic diagnosis of rheumatic heart disease on echocardiographic exams through video-based deep learning
2021. Journal of the American Medical Informatics Association.
An extensive experimental evaluation of automated machine learning methods for recommending classification algorithms
2021. Evolutionary Intelligence (Print).
Is Rank Aggregation Effective in Recommender Systems? An Experimental Analysis
2020. ACM Transactions on Intelligent Systems and Technology.
A New Non-Deterministic Drama Manager for Adaptive Interactive Storytelling
2020. ENTERTAINMENT COMPUTING.
Elite versus mass polarization on the Brazilian impeachment proceedings of 2016
2020. SOCIAL NETWORK ANALYSIS AND MINING.
Contrasting meta-learning and hyper-heuristic research: the role of evolutionary algorithms
2014. Genetic Programming and Evolvable Machines (Print).
Evolving rule induction algorithms with multi-objective grammar-based genetic programming
2009. Knowledge and Information Systems.
Papers in conferences
Algorithmic Recourse in Mental Healthcare2023. Int. Joint Conference on Neural Networks.
On the effect of solution representation and neighborhood definition in AutoML fitness landscapes
2023. European Conference on Evolutionary Computation in Combinatorial Optimization (EvoCOP).
Symbolic Regression Trees as Embedded Representations
2023. Genetic and Evolutionary Computation Conference (GECCO).
Understanding AutoML Search Spaces with Local Optima Networks
2022. Genetic and Evolutionary Computation Conference (GECCO '22).
Alertas de fraude em licitações: Uma abordagem baseada em redes sociais
2022. XI Brazilian Workshop on Social Network Analysis and Mining (BRASNAM).
Diagnóstico Automático de Cardiopatia Reumática em Exames Ecocardiográficos
2022. Concurso de Teses e Dissertações do Simpósio Brasileiro de Computação Aplicada à Saúde (SBCAS).
Ferramentas open-source de qualidade de dados para licitações públicas: Uma análise comparativa
2022. SBBD - Simpósio Brasileiro de Banco de Dados.
Detecting Inconsistencies in Public Bids: An Automated and Data-based Approach
2022. Webmedia - Simpósio Brasileiro de Sistemas Multimídia e Web.
Fitness Landscape Analysis of Graph Neural Network Architecture Search Spaces
2021. Genetic and Evolutionary Computation Conference (GECCO '21).
Deep Thompson Sampling for Length of Stay Prediction
2021. 2021 International Joint Conference on Neural Networks (IJCNN).
Neural Architecture Search for Resource-Constrained Internet of Things Devices
2021. 2021 IEEE Symposium on Computers and Communications (ISCC).
Automatic Drone Identification Through Rhythm-based Features for the Internet of Drones
2021. 2021 IEEE 33rd International Conference on Tools with Artificial Intelligence (ICTAI).
Fitness Landscape Analysis of Automated Machine Learning Search Spaces
2020. European Conf. on Evolutionary Computation in Combinatorial Optimization (EvoCOP).
A Robust Experimental Evaluation of Automated Multi-Label Classification Methods
2020. Genetic and Evolutionary Computation Conference (GECCO).
Instance Selection for Geometric Semantic Genetic Programming
2020. 2020 IEEE Congress on Evolutionary Computation (CEC).
Explaining Symbolic Regression Predictions
2020. 2020 IEEE Congress on Evolutionary Computation (CEC).
Neural Architecture Search in Graph Neural Networks
2020. Brazilian Conference on Intelligent Systems.
A multi-objective approach for Symbolic Regression with Semantic Genetic Programming
2019. Brazilian Conference on Intelligent Systems (BRACIS).
Solving the exponential growth of symbolic regression trees in geometric semantic genetic programming
2018. the Genetic and Evolutionary Computation Conference.
Automatically Evolving Rule Induction Algorithms
2006. 17th European Conference on Machine Learning.
Extended abstracts in conferences
Reddit Weight Loss Communities: Do They Have What It Takes for Effective Health Interventions?2018. 2018 IEEE/WIC/ACM International Conference on Web Intelligence (WI).
The Effect of Social Feedback in a Reddit Weight Loss Community
2016. the 6th International Conference.
Inferring User Social Class in Online Social Networks
2014. the 8th Workshop.
Observatório do Trânsito: um sistema para detecção e localização de eventos de trânsito no Twitter
2012. Simpósio Brasileiro de Banco de Dados.
Seleção de Atributos Utilizando Algoritmos Genéticos para Detecção do Vandalismo na Wikipedia
2012. Simpósio Brasileiro de Banco de Dados.
Abstracts in conferences
Unificação de Usuários em Redes Sociais2011. Simpósio Brasileiro de Bancos de Dados.
Utilização da Biblioteca JPDA para Construção de Depuradores Java
2000. V Mostra de Trabalhos em Informática da UEM.
PVM-Parallel Virtual Machine
1999. IV Mostra de Trabalhos em Informática da UEM.
PVM - Parallel Virtual Machine
1998. III Mostra de Trabalhos em Informática da UEM.
See all publications in Lattes
Current students
MS
Henrique Ribeiro Hott. Análise de Problemas em Amostras Out of Distribution. Início: 2022. Universidade Federal de Minas Gerais (Orientador principal)Iago Domingues Vaz. Interpretabilidade em Redes Neurais aplicadas a Oftamologia. Início: 2020. Universidade Federal de Minas Gerais (Orientador principal)
Victor Caetano. Métricas para media a Dificuldade de espaços de aprendizado de regressão. Início: 2019. Universidade Federal de Minas Gerais (Orientador principal)
Cristiano Pimenta. Análise de espaços de busca de problemas de AutoML. Início: 2018. Universidade Federal de Minas Gerais (Orientador principal)
PhD
Karen Enes. A definir. Início: 2016. Universidade Federal de Minas Gerais (Orientador principal)See all students in Lattes