medigraphic.com
ENGLISH

Revista Cubana de Información en Ciencias de la Salud (ACIMED)

ISSN 2307-2113 (Digital)
Revista Cubana de Información en Ciencias de la Salud (ACIMED)
  • Mostrar índice
  • Números disponibles
  • Información
    • Información general        
    • Directorio
  • Publicar
    • Instrucciones para autores        
  • medigraphic.com
    • Inicio
    • Índice de revistas            
    • Registro / Acceso
  • Mi perfil

2021, Número 4

<< Anterior Siguiente >>

Revista Cubana de Información en Ciencias de la Salud (ACIMED) 2021; 32 (4)


Caracterización de un corpus extraído de historias clínicas electrónicas de maternas a través de técnicas de procesamiento de lenguaje natural

Durango BMC, Torres SEA, Florez-Arango JF, Orozgo-Duque A
Texto completo Cómo citar este artículo Artículos similares

Idioma: Español
Referencias bibliográficas: 17
Paginas: 1-22
Archivo PDF: 600.83 Kb.


PALABRAS CLAVE

procesamiento de lenguaje natural, historia clínica electrónica, aprendizaje de máquina, word embedding, redes neuronales artificiales.

RESUMEN

Este artículo tuvo como propósito caracterizar el texto libre disponible en una historia clínica electrónica de una institución orientada a la atención de pacientes en embarazo. La historia clínica electrónica, más que ser un repositorio de datos, se ha convertido en un sistema de soporte a la toma de decisiones clínicas. Sin embargo, debido al alto volumen de información y a que parte de la información clave de las historias clínicas electrónicas está en forma de texto libre, utilizar todo el potencial que ofrece la información de la historia clínica electrónica para mejorar la toma de decisiones clínicas requiere el apoyo de métodos de minería de texto y procesamiento de lenguaje natural. Particularmente, en el área de Ginecología y Obstetricia, la implementación de métodos del procesamiento de lenguaje natural podría ayudar a agilizar la identificación de factores asociados al riesgo materno. A pesar de esto, en la literatura no se registran trabajos que integren técnicas de procesamiento de lenguaje natural en las historias clínicas electrónicas asociadas al seguimiento materno en idioma español. En este trabajo se obtuvieron 659 789 tokens mediante los métodos de minería de texto, un diccionario con palabras únicas dado por 7 334 tokens y se estudiaron los n-grams más frecuentes. Se generó una caracterización con una arquitectura de red neuronal CBOW (continuos bag of words) para la incrustación de palabras. Utilizando algoritmos de clustering se obtuvo evidencia que indica que palabras cercanas en el espacio de incrustación de 300 dimensiones pueden llegar a representar asociaciones referentes a tipos de pacientes, o agrupar palabras similares, incluyendo palabras escritas con errores ortográficos. El corpus generado y los resultados encontrados sientan las bases para trabajos futuros en la detección de entidades (síntomas, signos, diagnósticos, tratamientos), la corrección de errores ortográficos y las relaciones semánticas entre palabras para generar resúmenes de historias clínicas o asistir el seguimiento de las maternas mediante la revisión automatizada de la historia clínica electrónica.


REFERENCIAS (EN ESTE ARTÍCULO)

  1. Chen J, Wei W, Guo C, Tang L, Sun L. Textual analysis and visualization ofresearch trends in data mining for electronic health records. Heal Policy Technol. 2017;6(4):389–400. DOI: http://dx.doi.org/10.1016/j.hlpt.2017.10.003

  2. González Bernaldo de Quirós F, Otero C, Luna D. Terminology Services:Standard Terminologies to Control Health Vocabulary. Yearb Med Inform.2018;27(1):227–33. DOI: http://dx.doi.org/10.1055/s-0038-1641200

  3. Resnik P, Niv M, Nossal M, Kapit A, Toren R. Communication of ClinicallyRelevant Information in Electronic Health Records: A Comparison betweenStructured Data and Unrestricted Physician Language. Perspect Health Inf Manag.2008 [acceso: 12/11/202012]. Disponible en:https://perspectives.ahima.org/communication

  4. Peng X, Long G, Pan S, Jiang J, Niu Z. Attentive dual embedding forunderstanding medical concepts in electronic health records. Proc Int Jt ConfNeural Networks. 2019;2019. DOI:http://dx.doi.org/10.1109/IJCNN.2019.8852429

  5. Giamouzi M. Discover research from City, University of London. City.2008;34(2019):51–79. Available from: http://openaccess.city.ac.uk/1189/

  6. Neuraz A, Looten V, Rance B, Garcelon N, Llanos LC, et al. Do you needembeddings trained on a massive specialized corpus for your clinical naturallanguage processing task? Stud Health Technol Inform. 2019;264:1558–9. DOI:http://dx.doi.org/10.3233/SHTI190533

  7. Khattak FK, Jeblee S, Pou-Prom C, Abdalla M, Meaney C, Rudzicz F. A surveyof word embeddings for clinical text. J Biomed Informatics X. 2019;4. DOI:https://doi.org/10.1016/j.yjbinx.2019.100057

  8. Khan W, Daud A, Alotaibi F, Aljohani N, Arafat S. Deep recurrent neuralnetworks with word embeddings for Urdu named entity recognition. ETRI J.2020;42(1):90–100. DOI: https://doi.org/10.4218/etrij.2018-0553

  9. Ruas T, Ferreira CHP, Grosky W, de França FO, de Medeiros DMR. Enhancedword embeddings using multi-semantic representation through lexical chains. InfSci. 2020;532:16–32. DOI: https://doi.org/10.1016/j.ins.2020.04.048

  10. Liu Y, Li Z, Xiong H, Gao X, Wu J. Understanding of internal clusteringvalidation measures. IEEE International Conference on Data Mining (ICDM); 2010.

  11. Arrieta Rodríguez EL, Martínez Santos JC. Predicción temprana de morbilidadmaterna extrema usando aprendizaje automático. Cartagena de Indias:Universidad Tecnológica de Bolívar; 2017.

  12. Mohamed EH, Shokry EM. QSST: A quranic semantic search tool based on wordembedding. J King Saud Univ - Comput Inf Sci. 2020;(40). DOI:https://doi.org/10.1016/j.jksuci.2020.01.004

  13. McDonald S, Ramscar M. Testing the distributional hypothesis: The influenceof context on judgements of semantic similarity. University of Edinburgh,Institute for Communicating and Collaborative Systems; 2021.

  14. Zakrzewska D. Cluster analysis in personalized e-learning systems. StudComput Intell. 2009 [acceso: 12/11/2020];252:29–50. Disponible en:https://link.springer.com/chapter/10.1007/978-3-642-04170-9_10

  15. Berzal F. Clustering jerárquico: métodos de agrupamiento. Universidad deGranada; 2020 [acceso: 12/11/2020]. Disponible en:https://elvex.ugr.es/idbis/dm/slides/42Clustering-Hierarchical.pdf

  16. García-Alonso CR, Pérez-Naranjo LM, Fernández-Caballero JC. Multiobjectiveevolutionary algorithms to identify highly autocorrelated areas: The case ofspatial distribution in financially compromised farms. Ann Oper Res. 2014[acceso: 12/11/2020];219(1):187–202. Disponible en:https://link.springer.com/article/10.1007/s10479-011-0841-3

  17. Vilà R, Rubio MJ, Berlanga V, Torrado M. Cómo aplicar un cluster jerárquicoen SPSS. REIRE Rev d’Innovació i Recer en Educ. 2014 [acceso:12/11/2020];7(2):113–27. Disponible en: http://revistes.ub.edu/index.php/REIRE




2020     |     www.medigraphic.com

Mi perfil

C?MO CITAR (Vancouver)

Revista Cubana de Información en Ciencias de la Salud (ACIMED). 2021;32

ARTíCULOS SIMILARES

CARGANDO ...