{rfName}
Bi

Indexat a

Llicència i ús

Citacions

Altmetrics

Anàlisi d'autories institucional

Iglesias, GuillermoAutor (correspondència)

Compartir

22 d’abril de 2025
Publicacions
>
Reunió
No

Binary Classification Optimisation with AI-Generated Data

Publicat a:Lecture Notes In Computer Science. 15383 210-216 - 2025-01-01 15383(), DOI: 10.1007/978-3-031-80889-0_15

Autors: Mazon, Manuel Jesus Cerezo; Garcia, Ricardo Moya; Garcia, Ekaitz Arriola; del Castillo, Miguel Herencia Garcia; Iglesias, Guillermo

Afiliacions

Ainovis, Colquide 6, Madrid 28231, Spain - Autor o coautor
Univ Politecn Madrid, Madrid, Spain - Autor o coautor

Resum

In the field of machine learning, obtaining sufficient and high-quality data is a persistent challenge. This report explores the innovative solution of using synthetic data generated from existing datasets to overcome this limitation. By employing synthetic data, we not only increase the quantity of available information but also maintain the integrity and essential characteristics of natural data. This methodology allows the application of conventional data augmentation techniques, ensuring a more robust and efficient learning process. The study is based on a dataset provided by the International Skin Imaging Collaboration (ISIC), consisting of 3,323 cases divided equally between melanomas and Basal Cell Carcinoma (BCC). Using Generative Adversarial Networks (GANs), specifically StyleGAN2 with transfer learning from the Flickr-Faces-HQ (FFHQ) model, synthetic images were generated, expanding the dataset fourfold to a total of 26,584 synthetic records. The quality of the synthetic images was ensured using the Frechet Inception Distance (FID) metric [5], with BCC obtaining 22.2534 and melanomas obtaining 20.4577 according to this metric. Models trained with a hybrid approach using both real and synthetic data showed improved performance metrics (F1 0.71 to 0.79), highlighting the effectiveness of this method in enhancing binary classification tasks in medical imaging. The source code for all the research, along with the generated dataset is publicly available.

Paraules clau

Data augmentationFidGanIsicMachine learningMedical imaginMedical imagingSkin lesion classificationSynthetic data

Indicis de qualitat

Impacte bibliomètric. Anàlisi de la contribució i canal de difusió

El treball ha estat publicat a la revista Lecture Notes In Computer Science a causa de la seva progressió i el bon impacte que ha aconseguit en els últims anys, segons l'agència WoS (JCR), s'ha convertit en una referència en el seu camp. A l'any de publicació del treball, 2025, es trobava a la posició 13/61, aconseguint així situar-se com a revista Q1 (Primer Cuartil), en la categoria Computer Science, Theory & Methods. Destacable, igualment, el fet que la revista està posicionada per sobre del Percentil 90.

Impacte i visibilitat social

Des de la dimensió d'influència o adopció social, i prenent com a base les mètriques associades a les mencions i interaccions proporcionades per agències especialitzades en el càlcul de les denominades "Mètriques Alternatives o Socials", podem destacar a data 2025-07-12:

  • L'ús d'aquesta aportació en marcadors, bifurcacions de codi, afegits a llistes de favorits per a una lectura recurrent, així com visualitzacions generals, indica que algú està fent servir la publicació com a base del seu treball actual. Això pot ser un indicador destacat de futures cites més formals i acadèmiques. Aquesta afirmació està avalada pel resultat de l'indicador "Capture", que aporta un total de: 2 (PlumX).

Anàlisi del lideratge dels autors institucionals

Hi ha un lideratge significatiu, ja que alguns dels autors pertanyents a la institució apareixen com a primer o últim signant, es pot apreciar en el detall: Últim Autor (IGLESIAS HERNANDEZ, GUILLERMO).

l'autor responsable d'establir les tasques de correspondència ha estat IGLESIAS HERNANDEZ, GUILLERMO.