{rfName}
Bi

Indexado en

Licencia y uso

Citaciones

Altmetrics

Análisis de autorías institucional

Iglesias, GuillermoAutor (correspondencia)

Compartir

Publicaciones
>
Reunión

Binary Classification Optimisation with AI-Generated Data

Publicado en:Lecture Notes In Computer Science. 15383 210-216 - 2025-01-01 15383(), DOI: 10.1007/978-3-031-80889-0_15

Autores: Mazon, Manuel Jesus Cerezo; Garcia, Ricardo Moya; Garcia, Ekaitz Arriola; del Castillo, Miguel Herencia Garcia; Iglesias, Guillermo

Afiliaciones

Ainovis, Colquide 6, Madrid 28231, Spain - Autor o Coautor
Univ Politecn Madrid, Madrid, Spain - Autor o Coautor

Resumen

In the field of machine learning, obtaining sufficient and high-quality data is a persistent challenge. This report explores the innovative solution of using synthetic data generated from existing datasets to overcome this limitation. By employing synthetic data, we not only increase the quantity of available information but also maintain the integrity and essential characteristics of natural data. This methodology allows the application of conventional data augmentation techniques, ensuring a more robust and efficient learning process. The study is based on a dataset provided by the International Skin Imaging Collaboration (ISIC), consisting of 3,323 cases divided equally between melanomas and Basal Cell Carcinoma (BCC). Using Generative Adversarial Networks (GANs), specifically StyleGAN2 with transfer learning from the Flickr-Faces-HQ (FFHQ) model, synthetic images were generated, expanding the dataset fourfold to a total of 26,584 synthetic records. The quality of the synthetic images was ensured using the Frechet Inception Distance (FID) metric [5], with BCC obtaining 22.2534 and melanomas obtaining 20.4577 according to this metric. Models trained with a hybrid approach using both real and synthetic data showed improved performance metrics (F1 0.71 to 0.79), highlighting the effectiveness of this method in enhancing binary classification tasks in medical imaging. The source code for all the research, along with the generated dataset is publicly available.

Palabras clave

Data augmentationFidGanIsicMachine learningMedical imaginMedical imagingSkin lesion classificationSynthetic data

Indicios de calidad

Impacto bibliométrico. Análisis de la aportación y canal de difusión

El trabajo ha sido publicado en la revista Lecture Notes In Computer Science debido a la progresión y el buen impacto que ha alcanzado en los últimos años, según la agencia WoS (JCR), se ha convertido en una referencia en su campo. En el año de publicación del trabajo, 2025, se encontraba en la posición 13/61, consiguiendo con ello situarse como revista Q1 (Primer Cuartil), en la categoría Computer Science, Theory & Methods. Destacable, igualmente, el hecho de que la Revista está posicionada por encima del Percentil 90.

Impacto y visibilidad social

Desde la dimensión de Influencia o adopción social, y tomando como base las métricas asociadas a las menciones e interacciones proporcionadas por agencias especializadas en el cálculo de las denominadas “Métricas Alternativas o Sociales”, podemos destacar a fecha 2025-05-27:

  • La utilización de esta aportación en marcadores, bifurcaciones de código, añadidos a listas de favoritos para una lectura recurrente, así como visualizaciones generales, indica que alguien está usando la publicación como base de su trabajo actual. Esto puede ser un indicador destacado de futuras citas más formales y académicas. Tal afirmación es avalada por el resultado del indicador “Capture” que arroja un total de: 1 (PlumX).

Análisis de liderazgo de los autores institucionales

Existe un liderazgo significativo ya que algunos de los autores pertenecientes a la institución aparecen como primer o último firmante, se puede apreciar en el detalle: Último Autor (IGLESIAS HERNANDEZ, GUILLERMO).

el autor responsable de establecer las labores de correspondencia ha sido IGLESIAS HERNANDEZ, GUILLERMO.