medigraphic.com
ENGLISH

MediSur

ISSN 1727-897X (Digital)
  • Mostrar índice
  • Números disponibles
  • Información
    • Información general        
    • Directorio
  • Publicar
    • Instrucciones para autores        
  • medigraphic.com
    • Inicio
    • Índice de revistas            
    • Registro / Acceso
  • Mi perfil

2022, Número 2

<< Anterior Siguiente >>

Medisur 2022; 20 (2)


Clasificación de cáncer de mama con técnicas de análisis de la componente principal-Kernel PCA, algoritmos de máquina de vectores de soporte y regresión logística

Pirchio R
Texto completo Cómo citar este artículo Artículos similares

Idioma: Español
Referencias bibliográficas: 7
Paginas: 199-209
Archivo PDF: 844.08 Kb.


PALABRAS CLAVE

aprendizaje automático, inteligencia artificial, manejo de datos.

RESUMEN

Fundamento: existen muchas herramientas computacionales para administrar imágenes y conjuntos de datos; reducir la dimensión de estos favorece el manejo de la información.
Objetivo: reducir la dimensión de un conjunto de datos para un mejor manejo de la información.
Métodos: se utilizó el conjunto de datos de Breast Cancer Wisconsin (información de biopsias - células nucleares) y la plataforma Python Jupyter. Se implementaron técnicas de análisis de la componente principal (PCA) y Kernel PCA (kPCA) para reducir la dimensión a 2, 4, 6. Se hizo una validación cruzada para seleccionar los mejores hiperparámetros de los algoritmos de máquina de vectores de soporte y regresión logística. La clasificación se realizó con el training test original, training test (PCA y kPCA) y training test (datos transformados de PCA y kPCA). Se analizó la exactitud, precisión, exhaustividad, recuperación y el área bajo la curva.
Resultados: la PCA con seis componentes explicó la tasa de variación casi en 90 %. Los mejores hiperparámetros hallados para máquina de soporte de vectores: kernel lineal y C = 100, para regresión logística fueron C = 100, Newton-cg solución (solver) e I2. Los mejores resultados de las métricas fueron para PCA 2 y 4(0,99; 0,99; 1; 0,99; 0,99). Para el training set con datos originales fueron 0,96; 0,95; 0,99; 0,97; 0,95. Para regresión logística los mejores resultados fueron para kPCA con seis componentes. Los resultados estadísticos fueron iguales a 1. Para el training set con datos originales, esos valores fueron 0,96; 0,95; 0,99; 0,97; 0.95.
Conclusiones: los resultados de las métricas mejoraron utilizando PCA y kPCA.


REFERENCIAS (EN ESTE ARTÍCULO)

  1. Universidad de California. Breast Cancer Wisconsin (Diagnostic). In: UCI Machine Learning Repository Wisconsin[Internet]. Irvine: Universidad de California; 2000[citado 07/09/2020]. Disponible en: Disponible en: https://archive.ics.uci.edu/ml/setsets/Breast+Cancer+Wisconsin+(Diagnostic) 1.

  2. Akinnuwesi BA, Macaulay BO, Aribisala BS. Breast cancer risk assessment and early diagnosis using Principal Component Analysis and support vector machine techniques. Informatics in Medicine Unlocked. 2020;21:1-13.

  3. Mushtaq Z, Yaqub A, Hassan A, Su SF. Performance Analysis of Supervised Classifiers Using PCA Based Techniques on Breast Cancer, 2019. In: International Conference on Engineering and Emerging Technologies[Internet]. Lahore: IEEE; 2019.p. 1-6. Disponible en: https://ieeexplore.ieee.org/document/87118683.

  4. Mert A, Kilic N, Bilgili E, Akan A. Breast Cancer Detection with Reduced Feature Set, Comput Math Methods Med. 2015;2015:265138.

  5. Saxena S, Gyanchandani M. A Model for Classification of Wisconsin Breast Cancer Datasets using Principal Component Analysis and Back Propagation Neural Network. IJSR. 2019;8(7):1324-7.

  6. You H, Rumbe G. Comparative Study of Classification Techniques on Breast Cancer FNA Biopsy Data. Int J Interact Multim Artif Intell. 2010;1:5-12.

  7. Galarza Hernández J. Reducción de dimensionalidad en Machine Learning. Diagnóstico de cáncer de mama basado en datos genómicos y de imagen[Internet]. Valencia: Universitat Politècnica de València. 2017[citado 06/07/2021]. Disponible en: https://riunet.upv.es/handle/10251/925657.




2020     |     www.medigraphic.com

Mi perfil

C?MO CITAR (Vancouver)

Medisur. 2022;20

ARTíCULOS SIMILARES

CARGANDO ...