Pàgina - Adri Molina Rodríguez

Cerca d'Informació i Patrimoni Històric

Faig recerca al Centre de Visió per Computador en col·laboació amb la Xarxa d'Arxius Comarcals i el Centre d'Estudis Demogràfics.

Resum • Versió Divulgativa

En una època marcada per la saturació informativa i la desinformació automatitzada, el dubte —com a eina crítica per interpretar el món— és progressivament erosionat pels mateixos sistemes que haurien de facilitar-nos l'accés al coneixement. La supressió del dubte en entorns digitals, accelerada per interfícies algorísmiques que presenten la informació amb una aparença d'autoritat indiscutible, posa en risc tant la memòria col·lectiva com la capacitat de dissidència epistemològica.

Les dades patrimonials presenten una característica que sovint passa desapercebuda en altres àmbits de la intel·ligència artificial: els fets històrics no responen a patrons estadístics simples. Si bé és possible inferir patrons entre conceptes físics —per exemple, associar la pluja amb l'aigua o el sol amb la calor—, la història es construeix a partir de casos particulars, basats en noms propis, dates, llocs i esdeveniments concrets. No hi ha cap patró visual universal que permeti identificar el nom d'una persona, ni cap correlació estadística que ens pugui revelar la seva biografia, si no disposem prèviament del coneixement factual que l'acompanya.

❦ ❦ ❦

Més enllà de la recerca, he col·laborat en diversos projectes de divulgació i transferència del coneixement. En aquests projectes he apropat les tecnologies de visió per computador a la ciutadania i entitats de l'ecosistema català de l'arxivística.

Adrià Molina Rodríguez, quan encara tenia llum a la mirada.

Assoliments

Investigador FPI al projecte Graph Reasoning for Automatic Interpretation and Learning.
Guanyador del segon premi a millor artícle científic DAS2024 i millor proposta de tesi doctoral a la International Conference on Document Analysis and Recognition. Autor a reconegudes revistes i congressos en visió per computador, demografia històrica i arxivística.

Feina Actual

Fent recerca en la intersecció entre l'arxivística i la visió per computador: Dono eines a les màquines perque tinguin la oportunitat de dir la veritat.

Altres Notes

Co-fundador de UrbView; start-up d'anàlisi del disseny urbà amb el que intentem donar eines per construir espais urbans en clau de gènere.

Crónica Professional

Investigador Predoctoral - Programa de Doctorat en Visió Artificial

Universitat Autònoma de Barcelona / Centre de Visió per Computador • 2023 - Present

Ara faig recerca en fotografia històrica i, ocasionalment, lectura de documents i llengues minoritzades. Tot i que he tractat temes com la datació, descripció i lectura de documents; l'eix transversal de la meva recerca és l'indexació de documents i fotografies històriques o sensibles a dades factuals. Considero la cerca de formació la tasca primària per garantir el dubte en entorns digitals.

Enginyer de Recerca (CVC)

Document Analysis Group (DAG) • 2021 - 2023

Enginyer de Recerca al Centre de Visió per Computador on, en el marc del conveni de col·laboració amb la Xarxa d'Arxius Comarcals, faig recerca aplicada i proves de concepte en models d'anàlisi d'imatge per l'arxivística.

Research & Development (BMAT)

Charts • 2021

Implemento mètodes de de-duplicació en metadades per la industria musical. Així es pretén accelerar el ritme al que productores i consumidors poden donar resposta als seus interessos.

Enginyer de Recerca (CVC / FECYT)

Document Analysis Group (DAG) • 2021

Amb finançament per part de la FECYT, vaig estar involucrat en un projecte de divulgació científica on vam implementar un (ara difunt) bot de Twitter per la datació de les fotografies dels usuaris de la platforma.

Assistent a la Recerca

Research Internship • (2019 - 2020)

Al maig de 2019 començo la meva trajectoria com a enginyer en visió al Centre de Visió per Computador (CVC). Assistent de la recerca a través de la beca CVC per a estudiants (ara, beca Rosa Sensat) amb la que vaig ajudar a desenvolupar mètodes de cerca a partir d'aproximacions continues a funcions discretes.

❦ ❦ ❦

Nota Editorial

Trajectoria Laboral

En el context de la meva vida laboral, excloent el periode d'explotació al jovent (2017-2019), he adquirit experiència en l'aplicació de mètodes computacionals en el context dels anomenats Domain Specific Languages. Són, en general, contextos d'aplicació on la logica tradicional i estadística de les xarxes neuronals perd el sentit i, per tant, la intel·ligència artificial simbólica hauria de guanyar pes. Així, considero que la meva espertesa està precisament en treballar en la intersecció entre lo especific i lo global.

Research Outputs

Under Review

The Role of Model Editing in Low-Resource Reading Systems

2025

A novel approach to enable recognition models to generalize to under‐represented alphabets and low‐resource domains. Highlights improved transfer learning and out‐of‐domain evaluation on historical ciphers and non‐Latin scripts.

Low-Resource Transfer Learning Document Recognition

Under Review

Visual Model Checking: Graph-Based Inference of Visual Routines for Image Retrieval

2025

Integrates graph-based verification and neural code generation for image retrieval, allowing queries with compositional constraints to be verified atomically for transparency and reliability.

Image Retrieval Formal Verification Graph Inference

Published

Date Estimation in the Wild of Scanned Historical Photos: An Image Retrieval Approach

2023

Presents a retrieval-based date estimation framework that generalizes across diverse historical datasets using smooth-nDCG loss.

Historical Photos Retrieval

Published

The Role of Generative Systems in Historical Photography Management: A Case Study on Catalan Archives

2023

Explores generative models for captioning historical photographs in Catalan archives, emphasizing transfer learning for minoritized languages.

Generative Systems Cultural Heritage

Published

A Transformer-Based Object-Centric Approach for Date Estimation of Historical Photographs

2023

Introduces a new dataset and an object detection + transformer encoder approach using “dating indicators” to improve date estimation in historical photograph collections.

Date Estimation Transformer Object Detection

Published

Fetch-A-Set: A Large-Scale OCR-Free Benchmark for Historical Document Retrieval

2022

Introduces a benchmark for large-scale historical document retrieval tasks, focusing especially on legislative documents. OCR-free approaches and varied legibility.

Document Retrieval Benchmark

Published

Learning to Rank Words: Optimizing Ranking Metrics for Word Spotting

2022

Compares ranking‐based objective functions for word spotting with both query‐by‐string and query‐by‐example settings, across handwritten and scene text.

Word Spotting Ranking Metrics

Published

Structured Analysis of Alphabets in Historical Handwritten Ciphers

2021

Proposes the CSI metric for comparing ciphered documents; uses unsupervised clustering with visual features to help transcription and cryptanalysis.

Ciphers Alphabets Clustering

Published

Faster extraction of matrimonial advertisements from digital archives using a signal processing pipeline: a case study on a 20th-Century Spanish newspaper

2021

Builds a pipeline to extract matrimonial advertisements from digitized newspapers, via identification, segmentation, classification and OCR.

Signal Processing Historical Data Extraction

Student Project

Descripció de Fotografia Històrica en Català

È. Sànchez

Comparació de tècniques d’adaptació de domini històric i lingüístic per generar descripcions d’imatges d’arxiu en català, traslladant coneixement des de models preentrenats en altres idiomes i èpoques històriques.

Image Captioning Catalan Historical Images

Student Project

Sistema de 'Question Answering' en Documentació Legislativa Moderna

A. Fernandez

Desenvolupar un sistema de Question Answering que extregui informació precisa del BOE, integrant-lo amb RAG i models precursors adaptats al llenguatge legal.

Question Answering Legal Documents Retrieval-Augmented Generation

Student Project

Sistema de Word Spotting per Documentació Legislativa Històrica

M. Serra

Desenvolupar un sistema automàtic per recuperar informació de documents històrics, cercant paraules en documents amb errors d’OCR i retornant documents rellevants igualment.

Word Spotting Historical Documents OCR Errors

Student Project

TerritoCAT: Un joc per anotar fotografies històriques de Catalunya

A. Fernandez-Rascón

Desenvolupament d’una aplicació mòbil per fomentar la descoberta del patrimoni històric de Catalunya mitjançant gamificació, geolocalització i gestió de dades visuals col·laboratives.

Heritage Mobile App Gamification

Student Project

Conversational Retrieval and Knowledge Modeling from Historical Documents

P. Font

Sistema de transcripció altament precís seguit de RAG i construcció gradual d’un Knowledge Graph per documents històrics, per permetre respostes contextuals i modelatge del coneixement a través d’interaccions d’usuari.

Conversational AI Knowledge Graph Historical Archives

Student Project

Una perspectiva agèntica per a RAG basat en grafs

J. C. Montero

Proposta d’arquitectura agèntica basada en graf de coneixement per millorar la generació i recuperació de respostes en contextos amb relacions complexes entre entitats.

Graph Agents RAG Information Retrieval

Les Meves Competencies

Programming & Artificial Intelligence

Advanced Object-Oriented Programming
Compentence in Bash
Asyncronous, data-intensitive, infrastructures.
Preffered Dtaabase Managers: MongoDB and Neo4J.
Full proficiency on Relational Database dessign.
Git Version Control Systems
Computer Vision & Deep Learning
Data Science & Visualization

Research & Scientific Analysis

Scientific Research Methodology
Statistical Analysis & Modeling
Architecture Development
Technical Writing & Documentation
Grant Writing & Proposal Development

Linguistic Proficiencies

Catalan (Native Speaker)
Spanish (Native Speaker)
English (Advanced)

❦ ❦ ❦

Els Meus Estudis

Doctorat en Informàtica

Universitat Autònoma de Barcelona (UAB) - Centre de Visió per Computador (CVC)

2023 - Present

Recerca predoctoral en indexació de fotografia i documents històrics amb aplicació en arxivística i demografia històrica.

Master Interuniversitari en Visió per Computador

Centre de Visió per Computador (CVC-UAB) - UPC / UPF / UOC

2022 - 2023

This master is designed to join the research expertise of 5 universities in Barcelona. It offers to the students an updated program of methods and foundations of Computer Vision. After most than a decade of experience we have proved the success of a project-based methodology to learn in this field. Computer vision is a technology within the Artificial Intelligence field, where acts as a fundamental component to perform smart tasks in systems such as assisting medical diagnosis and surgery, autonomous car driving, industry quality control, surveillance applications, or improving interfaces for multimedia data access.

Grau en Enginyeria de Dades

Universitat Autònoma de Barcelona (UAB)

2018 - 2022

El grau en Enginyeria de Dades de la UAB forma professionals capaços de gestionar tot el cicle de vida de les dades, des de l’obtenció i extracció fins a la seva representació, transmissió, emmagatzematge segur, processament eficient i anàlisi amb visualització. Respon a l’augment constant d’informació disponible i a la necessitat de tractar-la per millorar processos productius i la presa de decisions.

Formació en Divulgació Científica (6h)

Universitat Autònoma de Barcelona (UAB) - EDUSCOPI

2025

Formació laboral en comunicació científica i divulgació.

Formació en Salut Mental a l'Entorn Científic (+20h)

Universitat Autònoma de Barcelona (UAB)

2024 - 2025

Formació laboral en gestió de l'estrés, resiliència i salut mental.

ORCiD

◈

Algunes pàgines

locatlitza.amolina.cat