
Pesquisa desenvolvida no INF/UFG recebe prêmio de melhor artigo na trilha principal do SBBD 2023
O artigo intitulado “Approximate Similarity Joins over Dense Vector Embeddings” foi resultado da dissertação de mestrado de Douglas Rolins de Santana, orientado pelo Prof. Leonardo Andrade Ribeiro (INF/UFG). O trabalho recebeu o prêmio de melhor artigo completo no XXXVIII Simpósio Brasileiro de Banco de Dados (SBBD 2023). O SBBD é a principal conferência brasileira e a maior da América Latina na área de Banco de Dados. A edição deste ano ocorreu em Belo Horizonte, Minas Gerais, no período de 25 a 29 de setembro.
Vector embeddings são representações numéricas de informações complexas, como texto, áudio e imagem, que permitem capturar aspectos semânticos e contextuais. Essas representações são usadas em uma ampla variedade de aplicações modernas, incluindo sistemas de recomendação, motores de busca e chatbots como o ChatGPT. Processamento de vector embeddings executa comparações baseadas em similaridade vetorial. Junção por similaridade é uma operação fundamental em gerência de dados que realiza uma quantidade massiva dessas comparações quando aplicadas sobre grandes volumes de dados resultando, com isso, em um elevado custo computacional.
Neste contexto, a pesquisa realizada no INF/UFG desenvolveu algoritmos para processamento eficiente de junções por similaridade sobre vector embeddings. O principal algoritmo proposto adaptou uma estrutura de busca do estado da arte para uso em junções por similaridade. Os resultados obtidos sobre diversos conjuntos de dados mostraram ganhos substanciais de desempenho ao custo de perdas mínimas em acurácia.
Categories: Notícias Noticias Simpósio Brasileiro de Banco de Dados ChatGPT ProcessamentoDeDados Chatbots VectorEmbeddings