Projetos em Andamento
O Laboratório de iNteligência Em Sistemas Pervasivos e Distribuídos: NESPeD-Lab é um laboratório de pesquisa e desenvolvimento na área de sistemas distribuídos e ciência dos dados, que atua em projetos para resolver problemas gerais orientados a dados, de áreas como computação móvel, mobilidade urbana e Internet das Coisas.
O principal propósito do NESPeD é formar pessoas com conhecimento do processo científico, com capacidade de resolver problemas e alinhados com as tecnologias inovadoras do mercado.
O grupo conta com dois pesquisadores e alunos de doutorado, mestrado e iniciação científica, além de parceiros de outras instituições de pesquisa e da iniciativa privada.
Abaixo são apresentados os principais projetos do grupo. Em Produção Científica estão listados os principais resultados científicos e tecnológicos alcançados.
MyMobiConf
O MyMobiConf é um projeto de pesquisa e desenvolvimento na área de computação móvel ciente de contexto que visa avançar a coleta e a utilização de contextos ambientais e dos usuários para tornar a experiência de participação em eventos mais agradável e produtiva. O objetivo principal é coletar contextos relativos à participação em eventos, e oferecer suporte para que ações possam ser tomadas para melhorar a qualidade do evento, em tempo próximo ao real.
Já foram desenvolvidas pesquisas na área de computação móvel, gamificação e análise de sentimentos. Como resultado, tem-se um produto que está em produção e já vem sendo utilizado em diversos eventos acadêmicos.
Enriquecimento Semântico de Dados Geo-Espaciais
Dados geo-espaciais representam localizações geográficas com base em algum sistema de referência (ex. pontos representados por latitudes e longitudes). Esses dados puros, da forma que são coletados originalmente por dispositivos móveis, são inúteis por não contemplarem nenhuma informação relevante. Por isso, é preciso realizar um enriquecimento semântico desses dados, para que conhecimento útil possa ser extraído. Com esse objetivo, nossa equipe tem desenvolvido projetos que facilitam esse enriquecimento a partir de diferentes fontes de dados externas como Bancos Relacionais, APIs e Serviços de Busca Rápida.
Internet das Coisas Cientes de Contexto
As cidades e as casas inteligentes do futuro serão compostos por objetos inteligentes capazes de sensoriar, processar os dados sensoriados, extrair conhecimento desses dados, e tomar decisões sem, ou com o mínimo, da interferência humana. Nessa área, nossa equipe está atuando nos seguintes problemas:
- Modelagem e previsão de deslocamento: as cidades inteligentes do futuro deverão estar integradas com objetos móveis inteligentes que deverão tomar decisões sobre os seus modelos de deslocamento. Para verificar como o conhecimento atual, representado por dados de mobilidade e demográficos, irão afetar essas decisões, estamos aplicando técnicas de Inteligência Artificial para avaliar a evolução de modelos de mobilidade de objetos inteligentes móveis do futuro;
- Contexto das coisas: a computação ciente de contexto se apresenta como alternativa aplicável ao universo IoT que possibilitará a tomada de consciência dos objetos inteligentes de maneira que conheçam suas características (físicas e lógicas) bem como o estado atual de cada uma delas. Com base neste conhecimento, os objetos inteligentes podem construir visões sobre suas características e compartilhá-las com as aplicações e, até mesmo com outros objetos, de modo a viabilizar, negociar e potencializar suas participações e conexões. Considerando especialmente a visão mais ampla e de longo prazo da IoT, em que diversas aplicações massivas e dinâmicas coexistirão, não será viável que a gestão dos complexos sistemas utilizados seja feita com participação humana, tornando-se assim fundamental a construção de soluções que permitam o comportamento autonômico dos mesmos.
Processamento de Grandes Volumes de Dados Geo-Espaciais
O recente avanço tecnológico e a popularização dos dispositivos móveis aumentaram significantemente a disponibilidade de dados geo-localizados, coletados de diferentes fontes. A análise desses dados é um campo ativo de pesquisa e desenvolvimento industrial, com uma gama diversificada de aplicações. No entanto, os dados geo-localizados também têm seguido a tendência de Big Data e as ferramentas atualmente existentes carecem de escalabilidade. Para cobrir essa lacuna, este projeto está desenvolvendo o Sendas — Scalable ENrichment for mobilidade Data Sets –, uma nova biblioteca desenvolvida na linguagem Scala construída em torno da estrutura do Apache Spark, permitindo a execução paralela e distribuída para técnicas de análise de mobilidade.
Descoberta Causal
A tomada de decisão das organizações é frequentemente baseada em dados históricos e métricas observadas. O estudo sobre causalidade tem crescido em interesse por grandes empresas de tecnologia no cenário mundial e gerado novas ferramentas computacionais para a inferência causal em dados observacionais. No entanto, muitas dessas ferramentas são específicas para determinados problemas e pouco exploradas em grandes conjuntos de dados ou comparadas entre si. Este projeto tem como objetivo explorar e comparar ferramentas de inferência causal, identificando relações de causa e efeito em grandes conjuntos de dados observacionais. Além disso, espera-se contribuir para o avanço do conhecimento ao propor uma solução que supere limitações observadas na literatura, especificamente no que diz respeito à descoberta causal em dados de alta dimensionalidade e volume.
Previsão e Otimização de Customer Lifetime Value (CLV)
Nas últimas décadas, foi percebido que é mais vantajoso tentar manter as relações com os clientes atuais, do que prospectar novos clientes. Isto está fazendo com que as empresas mudem suas abordagens centradas no produto, onde o foco é vender mais produtos, para abordagens centradas no cliente. Para isso, entender qual é a previsão de valor que cada cliente irá gerar para a empresa é fundamental. Baseando-se nisso, foi identificado que cada cliente possui um determinado valor financeiro atribuído a seu relacionamento futuro com a companhia, chamado de Lifetime Value (LTV) ou Customer Lifetime Value (CLV). Neste projeto estão sendo investigadas técnicas para prever e otimizar o CLV de um cliente, usando Inteligência Artificial.
Previsão de Churn utilizando Computação na Borda
Com a popularização dos smartphones, os usuários estão se tornando cada vez mais exigentes em relação ao uso de aplicativos móveis. Sendo assim, os processos de instalar e desinstalar um aplicativo são rotinas frequentes e de fácil execução para quem usa um smartphone. Porém, a facilidade de desinstalação é um grande empecilho para as empresas, facilitando o abandono do cliente, conhecido pelo termo em inglês churn.
Neste projeto, é proposta uma solução para previsão de churn de usuários móveis com preservação de privacidade por meio do uso de computação na borda.
Previsão de retorno de Fundos de Investimento Imobiliário (FIIs)
A crescente demanda por investimentos em fundos imobiliários tem chamado a atenção de investidores e acadêmicos, impulsionando a necessidade de uma análise mais aprofundada sobre esses ativos. Devido a sua popularização e recente ascensão, novos investidores são atraídos para o setor, visando ganhos maiores que os obtidos com renda fixa. Os Fundos de Investimento Imobiliário (FIIs) podem ser definidos como condomínios de investimento no Brasil – ou seja, aglomeram investimentos de diversas pessoas em torno de uma mesma finalidade – cujo objetivo é aplicar recursos em produtos ou empreendimentos imobiliários, incluindo alguns de seus derivativos. O objetivo deste trabalho é analisar diferentes estratégias para a construção de modelos de previsão de fundos imobiliários. Serão respondidas perguntas relacionadas a quais técnicas utilizar, como treinar os modelos, se é relevante utilizar dados dos imóveis físicos, se técnicas de séries temporais funcionam bem e traçar caminhos para que outros pesquisadores possam contribuir e avançar na área de previsão de FIIs.
Aprendizado multi-tarefas
O aprendizado profundo tem alcançado bons resultados nos últimos anos em áreas como visão computacional e processamento de linguagem natural. Porém, os resultados principais obtidos com redes neurais profundas são para tarefas específicas, para as quais um modelo individual deve ser treinado para cada problema. Visando melhorar o desempenho computacional do treinamento, a técnica de aprendizado multi-tarefas tem sido proposta e investigada, em que diferentes problemas relacionados são treinados em um mesmo modelo. O objetivo deste projeto é desenvolver um framework multi-tarefa para resolver diferentes problemas de forma compartilhada, alcançando resultados superiores, ou em termos de custo computacional, ou em termos de acurácia, do que usar modelos individuais para cada tarefa.
Explicabilidade de Agrupamentos
Uma das estratégias de aprendizado não-supervisionado é o agrupamento. Essa técnica consiste em agrupar dados com características similares, de modo que dados semelhantes pertençam a um mesmo grupo. Existem diversas métricas para avaliar a qualidade dos grupos criados, como largura de silhueta e o Índice Calinski-Harabasz. Porém, essas métricas não trazem informação acerca dos motivos que fazem uma amostra pertencer a determinado grupo, nem sobre as características dos grupos criados. Portanto, uma tarefa importante após a criação dos grupos é a de interpretá-los. O objetivo da interpretação é entender as características que mais se destacam em cada grupo. Com isso, os interessados nos dados podem tomar decisões mais específicas e direcionadas para cada grupo, dependendo das suas propriedades.