PARC: O software de gestão de crédito da Match Profiler

Cofinanciado pelo COMPETE 2020, o projeto visou a criação de serviços e aplicações que avaliassem de forma automática o risco associado à concessão de crédito. João Cunha, responsável pela área de inovação da Match Profiler faz um balanço. 

 
1. Enquadramento
 
A plataforma PARC tem como objetivo a criação de serviços e aplicações que avaliem de forma automática o risco associado à concessão de crédito e disponibilizem essa informação diretamente a particulares B2C ou fintechs B2B. 
 
 
Os cenários de aplicação são múltiplos, desde a concessão de crédito nas plataformas de peer lending, à obtenção de financiamento para compras em prestações, passando pelo aluguer de casas. A avaliação de risco ocorre não só na concessão, mas também durante a sua vigência para monitorizar o risco de incumprimento ou o risco associado à extensão de crédito.
 
2. Entrevista a João Cunha, responsável pela área de inovação da Match Profiler 
 
João Cunha | Responsável pela área de inovação da Match Profiler
 
Os objetivos definidos para o projeto foram alcançados? 
 
O projeto tinha como objetivo principal a construção de uma plataforma de avaliação de risco de crédito, assente em tecnologias de Machine Learning que permitisse a sua utilização de forma rápida e segura. Neste contexto a rapidez está relacionada com a possibilidade de analisar situações individuais em tempo real ou em forma assíncrona quando se trata de grande número de casos a serem analisados em batch. 
 
A celeridade foi conseguida pela otimização e compilação do modelo que pode correr em forma nativa em plataformas Linux ou Woindows, mas que no nosso caso está assente numa arquitetura serverless na Cloud AWS, que permite desde logo uma escalabilidade de forma quase ilimitada. 
A segurança é aqui um conceito multifacetado. Desde logo um primeiro aspeto é o grau de confiança do modelo de previsão, que assenta nas métricas apropriadas que destacamos mais à frente neste artigo. Um segundo aspeto é a confidencialidade. Os dados recolhidos são totalmente anonimizados, as comunicações e o armazenamento são encriptados. A arquitetura e a infraestrutura tornam a plataforma altamente escalável permitindo alta disponibilidade, e dotada de mecanismos de redundância que garantem também a integridade dos dados.
 
 
Quais foram os principais desafios com que se depararam no desenvolvimento do projeto? 
 
Um projeto de Machine Learning tem à partida dois grandes desafios. O primeiro é a disponibilidade de dados relevantes para o problema que se pretende modelar. O segundo é a criteriosa aplicação de um conjunto de técnicas sobre os dados de modo a obter o melhor resultado. O primeiro desafio foi ultrapassado através de pesquisa intensa em várias fontes, desde o online até à colaboração com instituições financeiras. Uma vez assegurado um conjunto de dados relevante, o segundo desafio foi um processo não linear, altamente iterativo, resultante de uma estratégia de melhoria contínua. O processo resultou num pipeline de operações, que ao longo do tempo se tornou mais sofisticado, por exemplo, na otimização de hiper-parâmetros com Bayesian Search ou no aumento da relevância dos dados com Feature Engineering. Este processo de melhoria contínua permitiu ir afinando o modelo e conseguir métricas mais significativas. De notar que um modelo de Machine Learning não é estático. 
 
 
Há algum resultado que gostaria de destacar. Porquê? 
 
A eficácia de um modelo de previsão tem métricas próprias que no caso em apreço devem traduzir as características do fenómeno que se pretende modelar. No caso da avaliação do risco de crédito, estatisticamente a grande maioria dos créditos são pagos atempadamente. Isto significa que o modelo de previsão deve poder detetar os casos pertencentes à classe minoritária, composta pelos “maus créditos”. A escolha de métricas tem que ter este aspeto crucial em consideração, sem o qual até um modelo aleatório teria bons valores de métricas. Feito este preambulo, os resultados obtidos são competitivos para o uso de uma plataforma automática: AUROC 0.82, Precision 83%, Recall 85%. Estes resultados refletem uma tendência propositada do modelo para minimizar o número de falsos negativos, isto é, o número de casos de crédito erradamente classificados como “bons créditos”, mas que se revelaram “maus créditos”. 
 
Um resultado imediato do desenvolvimento da plataforma prende-se com a sua aplicação a cenários relacionados. De facto, está em curso a analise da colaboração com uma empresa de recuperação de crédito que demonstrou interesse na evolução da plataforma para analisar carteiras. 
 
A aquisição de know-how de Machine Learning tem um impacto muito positivo na diversificação dos projetos. Destacamos também a colaboração com uma empresa da área de logística que com a ajuda de algoritmos de forecasting consegue ter uma melhor perceção dos pedidos, da sua sazonalidade e das tendências anuais.
 
Há um outro resultado do projeto que não deixa de ser relevante. Desde o início, todo o desenvolvimento e exploração da plataforma assentou em tecnologias Cloud, mais concretamente na AWS, com a adoção de arquiteturas Serverless sempre que possível, com substanciais ganhos de performance, segurança, escalabilidade e economia.
 
 
Qual tem sido o contributo do COMPETE 2020 para o desenvolvimento deste projeto? 
 
A inteligência artificial desempenha um papel cada vez mais importante em nossas vidas e na economia. A competição mundial para colher seus benefícios é feroz e liderada por potencias globais, os EUA e os países asiáticos com particular destaque para a China. Os analistas referem, no entanto, que não se trata de uma competição bipolar como era por exemplo a exploração espacial nos anos 60 do seculo passado. Há lugar para PME nesta corrida, e muitos unicórnios surgiram nos últimos anos assentes em tecnologias de AI. Dito isto, o investimento no desenvolvimento de produtos baseados em AI assenta em recursos humanos especializados com alta demanda a nível mundial, e em poder computacional especialmente na fase de treino dos modelos. Trata-se de um nível de investimento que na maioria das vezes não está ao alcance das organizações. O contributo do COMPETE 2020 foi assim fundamental para a implementação deste projeto. 
 
 
3. Apoio do COMPETE 2020 
 
O projeto PARC: Plataforma de Avaliação Automática de Risco de Crédito é cofinanciado pelo COMPETE 2020 no âmbito do Sistema de Incentivos à I&DT, envolveu um investimento elegível de 377 mil euros, o que resultou num incentivo FEDER de cerca de 248 mil euros.
 
 
4. Links
 
Match Profiler
. Website 
. Twitter 

15/10/2021 , Por Cátia Silva Pinto
Portugal 2020
COMPETE 2020
União Europeia