Faig recerca al Centre de Visió per Computador en col·laboació amb la Xarxa d'Arxius Comarcals i el Centre d'Estudis Demogràfics.
Resum • Versió Divulgativa
En una època marcada per la saturació informativa i la desinformació automatitzada, el dubte —com a eina crítica per interpretar el món— és progressivament erosionat pels mateixos sistemes que haurien de facilitar-nos l'accés al coneixement. La supressió del dubte en entorns digitals, accelerada per interfícies algorísmiques que presenten la informació amb una aparença d'autoritat indiscutible, posa en risc tant la memòria col·lectiva com la capacitat de dissidència epistemològica.
Les dades patrimonials presenten una característica que sovint passa
desapercebuda en altres àmbits de la intel·ligència artificial: els fets històrics no
responen a patrons estadístics simples. Si bé és possible inferir patrons entre conceptes
físics —per exemple, associar la pluja amb l'aigua o el sol amb la calor—, la història es
construeix a partir de casos particulars, basats en noms propis, dates, llocs i
esdeveniments concrets. No hi ha cap patró visual universal que permeti identificar el
nom d'una persona, ni cap correlació estadística que ens pugui revelar la seva biografia,
si no disposem prèviament del coneixement factual que l'acompanya.
❦ ❦ ❦
Més enllà de la recerca, he col·laborat en diversos projectes de divulgació i transferència del coneixement. En aquests projectes he apropat les tecnologies de visió per computador a la ciutadania i entitats de l'ecosistema català de l'arxivística.
Adrià Molina Rodríguez, quan encara tenia llum a la mirada.
Assoliments
Investigador FPI al projecte Graph Reasoning for Automatic Interpretation and Learning. Guanyador del segon premi a millor artícle científic DAS2024 i millor proposta de tesi doctoral a la International Conference on Document Analysis and Recognition. Autor a reconegudes revistes i congressos en visió per computador, demografia històrica i arxivística.
Feina Actual
Fent recerca en la intersecció entre l'arxivística i la visió per computador: Dono eines a les màquines perque tinguin la oportunitat de dir la veritat.
Altres Notes
Co-fundador de UrbView; start-up d'anàlisi del disseny urbà amb el que intentem donar eines per construir espais urbans en clau de gènere.
Crónica Professional
Investigador Predoctoral - Programa de Doctorat en Visió Artificial
Universitat Autònoma de Barcelona / Centre de Visió per Computador • 2023 - Present
Ara faig recerca en fotografia històrica i, ocasionalment, lectura de documents i llengues minoritzades. Tot i que he tractat temes com la datació, descripció i lectura de documents; l'eix transversal de la meva recerca és l'indexació de documents i fotografies històriques o sensibles a dades factuals. Considero la cerca de formació la tasca primària per garantir el dubte en entorns digitals.
Enginyer de Recerca (CVC)
Document Analysis Group (DAG) • 2021 - 2023
Enginyer de Recerca al Centre de Visió per Computador on, en el marc del conveni de col·laboració amb la Xarxa d'Arxius Comarcals, faig recerca aplicada i proves de concepte en models d'anàlisi d'imatge per l'arxivística.
Research & Development (BMAT)
Charts • 2021
Implemento mètodes de de-duplicació en metadades per la industria musical. Així es pretén accelerar el ritme al que productores i consumidors poden donar resposta als seus interessos.
Enginyer de Recerca (CVC / FECYT)
Document Analysis Group (DAG) • 2021
Amb finançament per part de la FECYT, vaig estar involucrat en un projecte de divulgació científica on vam implementar un (ara difunt) bot de Twitter per la datació de les fotografies dels usuaris de la platforma.
Assistent a la Recerca
Research Internship • (2019 - 2020)
Al maig de 2019 començo la meva trajectoria com a enginyer en visió al Centre de Visió per Computador (CVC).
Assistent de la recerca a través de la beca CVC per a estudiants (ara, beca Rosa Sensat) amb la que vaig ajudar a desenvolupar mètodes de cerca a partir d'aproximacions continues a funcions discretes.
❦ ❦ ❦
Nota Editorial
Trajectoria Laboral
En el context de la meva vida laboral, excloent el periode d'explotació al jovent (2017-2019), he adquirit experiència en l'aplicació de mètodes computacionals en el context dels anomenats Domain Specific Languages. Són, en general, contextos d'aplicació on la logica tradicional i estadística de les xarxes neuronals perd el sentit i, per tant, la intel·ligència artificial simbólica hauria de guanyar pes.
Així, considero que la meva espertesa està precisament en treballar en la intersecció entre lo especific i lo global.
A novel approach to enable recognition models to generalize to under‐represented alphabets and low‐resource domains. Highlights improved transfer learning and out‐of‐domain evaluation on historical ciphers and non‐Latin scripts.
Integrates graph-based verification and neural code generation for image retrieval, allowing queries with compositional constraints to be verified atomically for transparency and reliability.
Introduces a new dataset and an object detection + transformer encoder approach using “dating indicators” to improve date estimation in historical photograph collections.
Introduces a benchmark for large-scale historical document retrieval tasks, focusing especially on legislative documents. OCR-free approaches and varied legibility.
Compares ranking‐based objective functions for word spotting with both query‐by‐string and query‐by‐example settings, across handwritten and scene text.
Builds a pipeline to extract matrimonial advertisements from digitized newspapers, via identification, segmentation, classification and OCR.
Signal ProcessingHistorical Data Extraction
Student Project
Descripció de Fotografia Històrica en Català
È. Sànchez
Comparació de tècniques d’adaptació de domini històric i lingüístic per generar descripcions d’imatges d’arxiu en català, traslladant coneixement des de models preentrenats en altres idiomes i èpoques històriques.
Image CaptioningCatalanHistorical Images
Student Project
Sistema de 'Question Answering' en Documentació Legislativa Moderna
A. Fernandez
Desenvolupar un sistema de Question Answering que extregui informació precisa del BOE, integrant-lo amb RAG i models precursors adaptats al llenguatge legal.
Sistema de Word Spotting per Documentació Legislativa Històrica
M. Serra
Desenvolupar un sistema automàtic per recuperar informació de documents històrics, cercant paraules en documents amb errors d’OCR i retornant documents rellevants igualment.
Word SpottingHistorical DocumentsOCR Errors
Student Project
TerritoCAT: Un joc per anotar fotografies històriques de Catalunya
A. Fernandez-Rascón
Desenvolupament d’una aplicació mòbil per fomentar la descoberta del patrimoni històric de Catalunya mitjançant gamificació, geolocalització i gestió de dades visuals col·laboratives.
HeritageMobile AppGamification
Student Project
Conversational Retrieval and Knowledge Modeling from Historical Documents
P. Font
Sistema de transcripció altament precís seguit de RAG i construcció gradual d’un Knowledge Graph per documents històrics, per permetre respostes contextuals i modelatge del coneixement a través d’interaccions d’usuari.
Proposta d’arquitectura agèntica basada en graf de coneixement per millorar la generació i recuperació de respostes en contextos amb relacions complexes entre entitats.
Graph AgentsRAGInformation Retrieval
Les Meves Competencies
Programming & Artificial Intelligence
Advanced Object-Oriented Programming
Compentence in Bash
Asyncronous, data-intensitive, infrastructures.
Preffered Dtaabase Managers: MongoDB and Neo4J.
Full proficiency on Relational Database dessign.
Git Version Control Systems
Computer Vision & Deep Learning
Data Science & Visualization
Research & Scientific Analysis
Scientific Research Methodology
Statistical Analysis & Modeling
Architecture Development
Technical Writing & Documentation
Grant Writing & Proposal Development
Linguistic Proficiencies
Catalan (Native Speaker)
Spanish (Native Speaker)
English (Advanced)
❦ ❦ ❦
Els Meus Estudis
Doctorat en Informàtica
Universitat Autònoma de Barcelona (UAB) - Centre de Visió per Computador (CVC)
2023 - Present
Recerca predoctoral en indexació de fotografia i documents històrics amb aplicació en arxivística i demografia històrica.
Master Interuniversitari en Visió per Computador
Centre de Visió per Computador (CVC-UAB) - UPC / UPF / UOC
2022 - 2023
This master is designed to join the research expertise of 5 universities in Barcelona. It offers to the students an updated program of methods and foundations of Computer Vision. After most than a decade of experience we have proved the success of a project-based methodology to learn in this field.
Computer vision is a technology within the Artificial Intelligence field, where acts as a fundamental component to perform smart tasks in systems such as assisting medical diagnosis and surgery, autonomous car driving, industry quality control, surveillance applications, or improving interfaces for multimedia data access.
Grau en Enginyeria de Dades
Universitat Autònoma de Barcelona (UAB)
2018 - 2022
El grau en Enginyeria de Dades de la UAB forma professionals capaços de gestionar tot el cicle de vida de les dades, des de l’obtenció i extracció fins a la seva representació, transmissió, emmagatzematge segur, processament eficient i anàlisi amb visualització. Respon a l’augment constant d’informació disponible i a la necessitat de tractar-la per millorar processos productius i la presa de decisions.
Formació en Divulgació Científica (6h)
Universitat Autònoma de Barcelona (UAB) - EDUSCOPI
2025
Formació laboral en comunicació científica i divulgació.
Formació en Salut Mental a l'Entorn Científic (+20h)
Universitat Autònoma de Barcelona (UAB)
2024 - 2025
Formació laboral en gestió de l'estrés, resiliència i salut mental.
“Truth is like a blanket that always leaves your feet cold. You push at it, stretch it, it will never be enough. You kick at it, beat at it, it will never cover any of us. From the moment we enter crying to the moment you leave dying".