• nosotros

Validación de un modelo de minería de datos contra métodos tradicionales de estimación de edad dental entre adolescentes coreanos y adultos jóvenes

Gracias por visitar Nature.com. La versión del navegador que está utilizando tiene soporte CSS limitado. Para obtener los mejores resultados, recomendamos usar una versión más nueva de su navegador (o desactivar el modo de compatibilidad en Internet Explorer). Mientras tanto, para garantizar el soporte continuo, estamos mostrando el sitio sin estilo o JavaScript.
Los dientes se consideran el indicador más preciso de la edad del cuerpo humano y a menudo se usan en la evaluación de la edad forense. Nuestro objetivo fue validar las estimaciones de edad dental basadas en la minería de datos comparando la precisión de la estimación y el rendimiento de la clasificación del umbral de 18 años con los métodos tradicionales y las estimaciones de edad basadas en la minería de datos. Se recolectaron un total de 2657 radiografías panorámicas de ciudadanos coreanos y japoneses de 15 a 23 años. Se dividieron en un conjunto de entrenamiento, cada uno que contenía 900 radiografías coreanas y un conjunto de pruebas internas que contenía 857 radiografías japonesas. Comparamos la precisión de clasificación y la eficiencia de los métodos tradicionales con conjuntos de pruebas de modelos de minería de datos. La precisión del método tradicional en el conjunto de pruebas internas es ligeramente mayor que la del modelo de minería de datos, y la diferencia es pequeña (error absoluto medio <0.21 años, error de cuadrado medio de raíz <0.24 años). El rendimiento de clasificación para el límite de 18 años también es similar entre los métodos tradicionales y los modelos de minería de datos. Por lo tanto, los métodos tradicionales pueden ser reemplazados por modelos de minería de datos al realizar una evaluación de la edad forense utilizando la madurez de la segunda y tercera molares en adolescentes coreanos y adultos jóvenes.
La estimación de la edad dental se usa ampliamente en medicina forense y odontología pediátrica. En particular, debido a la alta correlación entre la edad cronológica y el desarrollo dental, la evaluación de la edad por las etapas del desarrollo dental es un criterio importante para evaluar la edad de los niños y adolescentes 1,2,3. Sin embargo, para los jóvenes, estimar la edad dental basada en la madurez dental tiene sus limitaciones porque el crecimiento dental está casi completo, con la excepción de los terceros molares. El propósito legal de determinar la edad de los jóvenes y los adolescentes es proporcionar estimaciones precisas y evidencia científica de si han alcanzado la mayoría de edad. En la práctica médica-legal de adolescentes y adultos jóvenes en Corea, se estimó la edad utilizando el método de Lee, y se predijo un umbral legal de 18 años en base a los datos reportados por Oh et al 5.
El aprendizaje automático es un tipo de inteligencia artificial (IA) que aprende y clasifica repetidamente grandes cantidades de datos, resuelve problemas por sí solo e impulsa la programación de datos. El aprendizaje automático puede descubrir patrones ocultos útiles en grandes volúmenes de datos6. Por el contrario, los métodos clásicos, que son intensivos en mano de obra y requieren mucho tiempo, pueden tener limitaciones al tratar con grandes volúmenes de datos complejos que son difíciles de procesar manualmente7. Por lo tanto, se han realizado recientemente muchos estudios utilizando las últimas tecnologías informáticas para minimizar los errores humanos y procesar eficientemente datos multidimensionales8,9,10,11,12. En particular, el aprendizaje profundo se ha utilizado ampliamente en el análisis de imágenes médicas, y se ha informado que varios métodos para la estimación de la edad analizan automáticamente radiografías para mejorar la precisión y eficiencia de la estimación de edad 13,14,15,16,17,18,190 . Por ejemplo, Halabi et al 13 desarrollaron un algoritmo de aprendizaje automático basado en redes neuronales convolucionales (CNN) para estimar la edad esquelética utilizando radiografías de las manos de los niños. Este estudio propone un modelo que aplica el aprendizaje automático a las imágenes médicas y muestra que estos métodos pueden mejorar la precisión del diagnóstico. Li et al14 estimó la edad de las imágenes de rayos X pélvicos utilizando un CNN de aprendizaje profundo y las comparó con los resultados de la regresión utilizando la estimación de la etapa de osificación. Descubrieron que el modelo CNN de aprendizaje profundo mostraba el mismo rendimiento de estimación de edad que el modelo de regresión tradicional. El estudio de Guo et al. [15] evaluó el rendimiento de clasificación de tolerancia a la edad de la tecnología CNN basada en ortophotos dentales, y los resultados del modelo CNN demostraron que los humanos superaron su rendimiento de clasificación de edad.
La mayoría de los estudios sobre la estimación de la edad utilizando el aprendizaje automático utilizan métodos de aprendizaje profundo13,14,15,16,17,18,19,20. Se informa que la estimación de edad basada en el aprendizaje profundo es más precisa que los métodos tradicionales. Sin embargo, este enfoque brinda pocas oportunidades para presentar la base científica para las estimaciones de edad, como los indicadores de edad utilizados en las estimaciones. También hay una disputa legal sobre quién realiza las inspecciones. Por lo tanto, la estimación de edad basada en el aprendizaje profundo es difícil de aceptar por las autoridades administrativas y judiciales. La minería de datos (DM) es una técnica que puede descubrir no solo información esperada sino también inesperada como un método para descubrir correlaciones útiles entre grandes cantidades de datos6,21,22. El aprendizaje automático a menudo se usa en la minería de datos, y tanto la minería de datos como el aprendizaje automático usan los mismos algoritmos clave para descubrir patrones en los datos. La estimación de edad utilizando el desarrollo dental se basa en la evaluación del examinador de la madurez de los dientes objetivo, y esta evaluación se expresa como una etapa para cada diente objetivo. DM puede usarse para analizar la correlación entre la etapa de evaluación dental y la edad real y tiene el potencial de reemplazar el análisis estadístico tradicional. Por lo tanto, si aplicamos técnicas de DM a la estimación de la edad, podemos implementar el aprendizaje automático en la estimación de la edad forense sin preocuparnos por la responsabilidad legal. Se han publicado varios estudios comparativos sobre posibles alternativas a los métodos manuales tradicionales utilizados en la práctica forense y los métodos basados ​​en EBM para determinar la edad dental. Shen et al23 mostraron que el modelo DM es más preciso que la fórmula de Camerer tradicional. Galibourg et al24 aplicaron diferentes métodos de DM para predecir la edad de acuerdo con el criterio de Demirdjian25 y los resultados mostraron que el método DM superó a los métodos Demirdjian y Willems para estimar la edad de la población francesa.
Para estimar la era dental de los adolescentes coreanos y los adultos jóvenes, el método 4 de Lee se usa ampliamente en la práctica forense coreana. Este método utiliza el análisis estadístico tradicional (como la regresión múltiple) para examinar la relación entre los sujetos coreanos y la edad cronológica. En este estudio, los métodos de estimación de edad obtenidos utilizando métodos estadísticos tradicionales se definen como "métodos tradicionales". El método de Lee es un método tradicional, y su precisión ha sido confirmada por Oh et al. 5; Sin embargo, la aplicabilidad de la estimación de edad basada en el modelo DM en la práctica forense coreana sigue siendo cuestionable. Nuestro objetivo era validar científicamente la utilidad potencial de la estimación de edad basada en el modelo DM. El propósito de este estudio fue (1) comparar la precisión de dos modelos de DM en la estimación de la edad dental y (2) comparar el rendimiento de clasificación de los modelos de 7 DM a la edad de 18 años con los obtenidos utilizando métodos estadísticos tradicionales Madurez of Second y tercer molar en ambas mandíbulas.
Las medias y las desviaciones estándar de la edad cronológica por etapa y tipo de diente se muestran en línea en la tabla complementaria S1 (conjunto de capacitación), la tabla complementaria S2 (conjunto de pruebas internas) y la tabla complementaria S3 (conjunto de pruebas externas). Los valores de Kappa para la confiabilidad intra e interobservador obtenida del conjunto de capacitación fueron 0.951 y 0.947, respectivamente. Los valores de P y los intervalos de confianza del 95% para los valores de Kappa se muestran en la Tabla complementaria en línea S4. El valor de Kappa se interpretó como "casi perfecto", consistente con los criterios de Landis y Koch26.
Al comparar el error absoluto medio (MAE), el método tradicional supera ligeramente el modelo DM para todos los géneros y en el conjunto de pruebas masculinas externos, con la excepción de Perceptron multicapa (MLP). La diferencia entre el modelo tradicional y el modelo DM en el conjunto interno de prueba MAE fue de 0.12-0.19 años para los hombres y 0.17–0.21 años para las mujeres. Para la batería de prueba externa, las diferencias son más pequeñas (0.001–0.05 años para los hombres y 0.05–0.09 años para las mujeres). Además, el error cuadrado medio de la raíz (RMSE) es ligeramente más bajo que el método tradicional, con diferencias más pequeñas (0.17-0.24, 0.2-0.24 para el conjunto de pruebas internos masculinos y 0.03-0.07, 0.04-0.0.08 para un conjunto de pruebas externas). ). MLP muestra un rendimiento ligeramente mejor que el perceptrón de una sola capa (SLP), excepto en el caso del conjunto de pruebas externas femeninas. Para MAE y RMSE, el conjunto de pruebas externas puntajes más altos que el conjunto de pruebas internas para todos los géneros y modelos. Todos los MAE y RMSE se muestran en la Tabla 1 y la Figura 1.
MAE y RMSE de los modelos de regresión de minería tradicional y de datos. Error absoluto medio MAE, RMSE RMSE RMSE, Perceptron SLP de una sola capa, Perceptron multicapa MLP, método CM tradicional.
El rendimiento de clasificación (con un límite de 18 años) de los modelos tradicionales y DM se demostró en términos de sensibilidad, especificidad, valor predictivo positivo (PPV), valor predictivo negativo (VPN) y área bajo la curva característica operativa del receptor (AUROC) 27 (Tabla 2, Figura 2 y suplementaria Figura 1 en línea). En términos de la sensibilidad de la batería de prueba interna, los métodos tradicionales funcionaron mejor entre los hombres y peor entre las mujeres. Sin embargo, la diferencia en el rendimiento de la clasificación entre los métodos tradicionales y la SD es del 9,7% para los hombres (MLP) y solo el 2.4% para las mujeres (xgboost). Entre los modelos de DM, la regresión logística (LR) mostró una mejor sensibilidad en ambos sexos. Con respecto a la especificidad del conjunto de pruebas internas, se observó que los cuatro modelos SD funcionaban bien en los hombres, mientras que el modelo tradicional funcionaba mejor en las mujeres. Las diferencias en el rendimiento de clasificación para hombres y mujeres son del 13.3% (MLP) y del 13.1% (MLP), respectivamente, lo que indica que la diferencia en el rendimiento de clasificación entre los modelos excede la sensibilidad. Entre los modelos de DM, la máquina de vectores de soporte (SVM), el árbol de decisión (DT) y los modelos de bosque aleatorio (RF) funcionaban mejor entre los hombres, mientras que el modelo LR funcionó mejor entre las hembras. El AUROC del modelo tradicional y todos los modelos SD fueron superiores a 0,925 (K-Nearest Vecin-Nears (KNN) en hombres), lo que demuestra un excelente rendimiento de clasificación para discriminar muestras de 18 años28. Para el conjunto de pruebas externas, hubo una disminución en el rendimiento de la clasificación en términos de sensibilidad, especificidad y AUROC en comparación con el conjunto de pruebas internas. Además, la diferencia en la sensibilidad y la especificidad entre el rendimiento de clasificación de los mejores y peores modelos varió del 10% al 25% y fue mayor que la diferencia en el conjunto de pruebas internas.
Sensibilidad y especificidad de los modelos de clasificación de minería de datos en comparación con los métodos tradicionales con un límite de 18 años. Knn K vecino más cercano, máquina vectorial de soporte SVM, regresión logística LR, árbol de decisión DT, bosque aleatorio de RF, XGB XGBOost, perceptrón multicapa MLP, método tradicional de CM.
El primer paso en este estudio fue comparar la precisión de las estimaciones de edad dental obtenidas de siete modelos de DM con los obtenidos utilizando regresión tradicional. MAE y RMSE se evaluaron en conjuntos de pruebas internas para ambos sexos, y la diferencia entre el método tradicional y el modelo DM varió de 44 a 77 días para MAE y de 62 a 88 días para RMSE. Aunque el método tradicional fue ligeramente más preciso en este estudio, es difícil concluir si una diferencia tan pequeña tiene un significado clínico o práctico. Estos resultados indican que la precisión de la estimación de la edad dental utilizando el modelo DM es casi la misma que la del método tradicional. La comparación directa con los resultados de estudios anteriores es difícil porque ningún estudio ha comparado la precisión de los modelos de DM con métodos estadísticos tradicionales utilizando la misma técnica de registro de dientes en el mismo rango de edad que en este estudio. Galibourg et al24 comparó MAE y RMSE entre dos métodos tradicionales (Demirjian Method25 y Willems Method29) y 10 modelos DM en una población francesa de 2 a 24 años. Informaron que todos los modelos de DM eran más precisos que los métodos tradicionales, con diferencias de 0.20 y 0.38 años en MAE y 0.25 y 0.47 años en RMSE en comparación con los métodos Willems y Demirdjianos, respectivamente. La discrepancia entre el modelo SD y los métodos tradicionales que se muestran en el estudio de Halibourg tienen en cuenta numerosos informes 30,31,32,33 que el método Demirdjian no estimula con precisión la edad dental en poblaciones distintas de los canadienses franceses en los que se basó el estudio. en este estudio. Tai et al 34 utilizaron el algoritmo MLP para predecir la edad de los dientes de 1636 fotografías de ortodoncia china y comparó su precisión con los resultados del método Demirjian y Willems. Informaron que MLP tiene mayor precisión que los métodos tradicionales. La diferencia entre el método Demirdjian y el método tradicional es <0.32 años, y el método Willems es de 0.28 años, que es similar a los resultados del presente estudio. Los resultados de estos estudios anteriores24,34 también son consistentes con los resultados del presente estudio, y la precisión de la estimación de edad del modelo DM y el método tradicional son similares. Sin embargo, según los resultados presentados, solo podemos concluir con cautela que el uso de modelos DM para estimar la edad puede reemplazar los métodos existentes debido a la falta de estudios anteriores comparativos y de referencia. Se necesitan estudios de seguimiento que usen muestras más grandes para confirmar los resultados obtenidos en este estudio.
Entre los estudios que prueban la precisión de la SD en la estimación de la edad dental, algunos mostraron una mayor precisión que nuestro estudio. Stepanovsky et al 35 aplicaron 22 modelos SD a radiografías panorámicas de 976 residentes checos de 2.7 a 20.5 años y probaron la precisión de cada modelo. Evaluaron el desarrollo de un total de 16 dientes permanentes superiores e inferiores utilizando los criterios de clasificación propuestos por Moorrees et al 36. El MAE varía de 0.64 a 0.94 años y el RMSE varía de 0.85 a 1.27 años, que son más precisos que los dos modelos DM utilizados en este estudio. Shen et al23 utilizaron el método Cameriere para estimar la edad dental de siete dientes permanentes en la mandíbula izquierda en los residentes del este de los chinos de 5 a 13 años y lo comparó con las edades estimadas usando regresión lineal, SVM y RF. Mostraron que los tres modelos DM tienen mayor precisión en comparación con la fórmula Cameriere tradicional. El MAE y el RMSE en el estudio de Shen fueron más bajos que los del modelo DM en este estudio. La mayor precisión de los estudios por Stepanovsky et al. 35 y Shen et al. 23 puede deberse a la inclusión de sujetos más jóvenes en sus muestras de estudio. Debido a que las estimaciones de edad para los participantes con dientes en desarrollo se vuelven más precisos a medida que aumenta el número de dientes durante el desarrollo dental, la precisión del método de estimación de edad resultante puede verse comprometido cuando los participantes del estudio son más jóvenes. Además, el error de MLP en la estimación de edad es ligeramente más pequeño que el de SLP, lo que significa que MLP es más preciso que SLP. MLP se considera ligeramente mejor para la estimación de edad, posiblemente debido a las capas ocultas en MLP38. Sin embargo, hay una excepción para la muestra externa de mujeres (SLP 1.45, MLP 1.49). El hallazgo de que el MLP es más preciso que el SLP para evaluar la edad requiere estudios retrospectivos adicionales.
También se comparó el rendimiento de clasificación del modelo DM y el método tradicional en un umbral de 18 años. Todos los modelos SD probados y los métodos tradicionales en el conjunto de pruebas internas mostraron niveles de discriminación prácticamente aceptables para la muestra de 18 años. La sensibilidad para hombres y mujeres fue mayor que 87.7% y 94.9%, respectivamente, y la especificidad fue mayor que 89.3% y 84.7%. El AUROC de todos los modelos probados también excede 0.925. Hasta donde sabemos, ningún estudio ha probado el rendimiento del modelo DM para la clasificación de 18 años basada en el vencimiento dental. Podemos comparar los resultados de este estudio con el rendimiento de clasificación de los modelos de aprendizaje profundo en radiografías panorámicas. Guo et al.15 calculó el rendimiento de clasificación de un modelo de aprendizaje profundo basado en CNN y un método manual basado en el método de Demirjian para un cierto umbral de edad. La sensibilidad y la especificidad del método manual fueron 87.7% y 95.5%, respectivamente, y la sensibilidad y especificidad del modelo CNN superó el 89.2% y el 86.6%, respectivamente. Llegaron a la conclusión de que los modelos de aprendizaje profundo pueden reemplazar o superar la evaluación manual en la clasificación de los umbrales de edad. Los resultados de este estudio mostraron un rendimiento de clasificación similar; Se cree que la clasificación utilizando modelos DM puede reemplazar los métodos estadísticos tradicionales para la estimación de la edad. Entre los modelos, DM LR fue el mejor modelo en términos de sensibilidad para la muestra masculina y la sensibilidad y la especificidad para la muestra femenina. LR ocupa el segundo lugar en especificidad para los hombres. Además, la LR se considera uno de los modelos DM35 más fáciles de usar y es menos complejo y difícil de procesar. Según estos resultados, LR se consideró el mejor modelo de clasificación de corte para los jóvenes de 18 años en la población coreana.
En general, la precisión de la estimación de la edad o el rendimiento de la clasificación en el conjunto de pruebas externas fue pobre o menor en comparación con los resultados en el conjunto de pruebas internas. Algunos informes indican que la precisión de la clasificación o la eficiencia disminuyen cuando las estimaciones de edad basadas en la población coreana se aplican a la población japonesa 5,39, y se encontró un patrón similar en el presente estudio. Esta tendencia de deterioro también se observó en el modelo DM. Por lo tanto, para estimar con precisión la edad, incluso cuando se usa DM en el proceso de análisis, los métodos derivados de los datos de la población nativa, como los métodos tradicionales, deben preferirse 5,39,40,41,42. Dado que no está claro si los modelos de aprendizaje profundo pueden mostrar tendencias similares, los estudios que comparan la precisión de la clasificación y la eficiencia utilizando métodos tradicionales, modelos de DM y modelos de aprendizaje profundo en las mismas muestras son necesarios para confirmar si la inteligencia artificial puede superar estas disparidades raciales en edad limitada. evaluaciones.
Demostramos que los métodos tradicionales pueden ser reemplazados por la estimación de edad basada en el modelo de DM en la práctica de estimación de edad forense en Corea. También descubrimos la posibilidad de implementar el aprendizaje automático para la evaluación de la edad forense. Sin embargo, existen limitaciones claras, como el número insuficiente de participantes en este estudio para determinar definitivamente los resultados y la falta de estudios previos para comparar y confirmar los resultados de este estudio. En el futuro, los estudios de DM deben realizarse con un mayor número de muestras y poblaciones más diversas para mejorar su aplicabilidad práctica en comparación con los métodos tradicionales. Para validar la viabilidad de usar la inteligencia artificial para estimar la edad en múltiples poblaciones, se necesitan futuros estudios para comparar la precisión de clasificación y la eficiencia de los modelos de DM y aprendizaje profundo con métodos tradicionales en las mismas muestras.
El estudio utilizó 2.657 fotografías ortográficas recolectadas de adultos coreanos y japoneses de 15 a 23 años. Las radiografías coreanas se dividieron en 900 conjuntos de entrenamiento (19.42 ± 2.65 años) y 900 conjuntos de pruebas internas (19.52 ± 2.59 años). El conjunto de capacitación se recolectó en una institución (Seúl St. Mary's Hospital), y el propio set de prueba se recogió en dos instituciones (Hospital Dental de la Universidad Nacional de Seúl y Hospital Dental de la Universidad de Yonsei). También recopilamos 857 radiografías de otros datos basados ​​en la población (Iwate Medical University, Japón) para pruebas externas. Se seleccionaron radiografías de sujetos japoneses (19.31 ± 2.60 años) como el conjunto de pruebas externas. Los datos se recopilaron retrospectivamente para analizar las etapas del desarrollo dental en radiografías panorámicas tomadas durante el tratamiento dental. Todos los datos recopilados fueron anónimos, excepto el género, la fecha de nacimiento y la fecha de la radiografía. Los criterios de inclusión y exclusión fueron los mismos que los estudios publicados anteriormente 4, 5. La edad real de la muestra se calculó restando la fecha de nacimiento desde la fecha en que se tomó la radiografía. El grupo de muestra se dividió en nueve grupos de edad. Las distribuciones de edad y sexo se muestran en la Tabla 3 Este estudio se realizó de acuerdo con la Declaración de Helsinki y aprobada por la Junta de Revisión Institucional (IRB) del Hospital de Seúl St. Mary's de la Universidad Católica de Corea (KC22WISI0328). Debido al diseño retrospectivo de este estudio, no se pudo obtener el consentimiento informado de todos los pacientes sometidos a un examen radiográfico con fines terapéuticos. La Universidad de Seúl Corea, el Hospital St. Mary's Hospital (IRB) renunció al requisito de consentimiento informado.
Las etapas de desarrollo de los segundos y terceros molares bimaxilares se evaluaron de acuerdo con los criterios de Demircan25. Solo se seleccionó un diente si se encontraba el mismo tipo de diente en los lados izquierdo y derecho de cada mandíbula. Si los dientes homólogos en ambos lados estaban en diferentes etapas de desarrollo, el diente con la etapa de desarrollo más baja se seleccionó para explicar la incertidumbre en la edad estimada. Cien radiografías seleccionadas al azar del conjunto de capacitación fueron calificadas por dos observadores experimentados para probar la confiabilidad interobservador después de la precalibración para determinar la etapa de madurez dental. La fiabilidad del intraobservador se evaluó dos veces a intervalos de tres meses por el observador primario.
La etapa sexual y de desarrollo del segundo y tercer molares de cada mandíbula en el conjunto de entrenamiento fue estimada por un observador primario entrenado con diferentes modelos de DM, y la edad real se estableció como el valor objetivo. Los modelos SLP y MLP, que se usan ampliamente en el aprendizaje automático, se probaron contra los algoritmos de regresión. El modelo DM combina funciones lineales utilizando las etapas de desarrollo de los cuatro dientes y combina estos datos para estimar la edad. SLP es la red neuronal más simple y no contiene capas ocultas. SLP funciona basado en la transmisión de umbral entre nodos. El modelo SLP en regresión es matemáticamente similar a la regresión lineal múltiple. A diferencia del modelo SLP, el modelo MLP tiene múltiples capas ocultas con funciones de activación no lineal. Nuestros experimentos utilizaron una capa oculta con solo 20 nodos ocultos con funciones de activación no lineal. Use el descenso de gradiente como método de optimización y MAE y RMSE como la función de pérdida para entrenar nuestro modelo de aprendizaje automático. El modelo de regresión mejor obtenido se aplicó a los conjuntos de pruebas internas y externas y se estimó la edad de los dientes.
Se desarrolló un algoritmo de clasificación que utiliza la madurez de cuatro dientes en el conjunto de entrenamiento para predecir si una muestra tiene 18 años o no. Para construir el modelo, derivamos siete algoritmos de aprendizaje automático de representación6,43: (1) LR, (2) KNN, (3) SVM, (4) DT, (5) RF, (6) XGBOOST y (7) MLP . LR es uno de los algoritmos de clasificación más utilizados44. Es un algoritmo de aprendizaje supervisado que utiliza la regresión para predecir la probabilidad de que los datos pertenecieran a una determinada categoría de 0 a 1 y clasifica los datos como pertenecientes a una categoría más probable basada en esta probabilidad; Principalmente utilizado para la clasificación binaria. KNN es uno de los algoritmos de aprendizaje automático más simples45. Cuando se les dan nuevos datos de entrada, encuentra K datos cercanos al conjunto existente y luego los clasifica en la clase con la frecuencia más alta. Establecimos 3 para el número de vecinos considerados (k). SVM es un algoritmo que maximiza la distancia entre dos clases mediante el uso de una función de núcleo para expandir el espacio lineal en un espacio no lineal llamado Fields46. Para este modelo, usamos sesgo = 1, potencia = 1 y gamma = 1 como hiperparámetros para el núcleo polinomial. DT se ha aplicado en varios campos como un algoritmo para dividir un conjunto de datos completos en varios subgrupos al representar las reglas de decisión en una estructura de árbol47. El modelo está configurado con un número mínimo de registros por nodo de 2 y utiliza el índice Gini como medida de calidad. RF es un método de conjunto que combina múltiples DTS para mejorar el rendimiento utilizando un método de agregación de bootstrap que genera un clasificador débil para cada muestra dibujando muestras aleatorias del mismo tamaño varias veces desde el DataSet48 original. Utilizamos 100 árboles, 10 profundidades de árbol, 1 tamaño de nodo mínimo e índice de mezcla de Gini como criterios de separación de nodos. La clasificación de nuevos datos está determinada por una votación mayoritaria. XGBOOST es un algoritmo que combina técnicas de impulso utilizando un método que toma como datos de entrenamiento el error entre los valores reales y predichos del modelo anterior y aumenta el error usando Gradients49. Es un algoritmo ampliamente utilizado debido a su buen rendimiento y eficiencia de recursos, así como una alta confiabilidad como una función de corrección de sobreajuste. El modelo está equipado con 400 ruedas de soporte. MLP es una red neuronal en la que uno o más perceptrones forman múltiples capas con una o más capas ocultas entre las capas de entrada y salida38. Usando esto, puede realizar una clasificación no lineal donde cuando agrega una capa de entrada y obtiene un valor de resultado, el valor de resultado previsto se compara con el valor de resultado real y el error se propaga hacia atrás. Creamos una capa oculta con 20 neuronas ocultas en cada capa. Cada modelo que desarrollamos se aplicó a conjuntos internos y externos para probar el rendimiento de la clasificación calculando la sensibilidad, la especificidad, el PPV, el VPN y el AUROC. La sensibilidad se define como la relación de una muestra estimada en 18 años de edad o más para una muestra estimada en 18 años de edad o más. La especificidad es la proporción de muestras menores de 18 años y las que se estima que tienen menos de 18 años.
Las etapas dentales evaluadas en el conjunto de entrenamiento se convirtieron en etapas numéricas para el análisis estadístico. Se realizaron regresión lineal y logística multivariada para desarrollar modelos predictivos para cada sexo y derivar fórmulas de regresión que pueden usarse para estimar la edad. Utilizamos estas fórmulas para estimar la edad de los dientes para conjuntos de pruebas internas y externas. La Tabla 4 muestra los modelos de regresión y clasificación utilizados en este estudio.
La confiabilidad intra e interobservador se calculó utilizando la estadística de Kappa de Cohen. Para probar la precisión de DM y modelos de regresión tradicionales, calculamos MAE y RMSE utilizando las edades estimadas y reales de los conjuntos de pruebas internas y externas. Estos errores se usan comúnmente para evaluar la precisión de las predicciones del modelo. Cuanto menor sea el error, mayor es la precisión del pronóstico24. Compare el MAE y RMSE de conjuntos de pruebas internas y externas calculados usando DM y regresión tradicional. El rendimiento de clasificación del límite de 18 años en las estadísticas tradicionales se evaluó utilizando una tabla de contingencia de 2 × 2. La sensibilidad calculada, la especificidad, el PPV, el VPN y el AUROC del conjunto de prueba se compararon con los valores medidos del modelo de clasificación DM. Los datos se expresan como media ± desviación estándar o número (%) según las características de los datos. Los valores de P de dos lados <0.05 se consideraron estadísticamente significativos. Todos los análisis estadísticos de rutina se realizaron utilizando SAS versión 9.4 (SAS Institute, Cary, NC). El modelo de regresión de DM se implementó en Python utilizando KERAS50 2.2.4 Backend y TensorFlow51 1.8.0 específicamente para operaciones matemáticas. El modelo de clasificación DM se implementó en el entorno de análisis de conocimiento de Waikato y la plataforma de análisis de Konstanz Information Miner (KNIME) 4.6.152.
Los autores reconocen que los datos que respaldan las conclusiones del estudio se pueden encontrar en el artículo y los materiales complementarios. Los conjuntos de datos generados y/o analizados durante el estudio están disponibles del autor correspondiente con solicitud razonable.
Ritz-Timme, S. et al. Evaluación de edad: estado del arte para cumplir con los requisitos específicos de la práctica forense. internacionalidad. J. Medicina legal. 113, 129–136 (2000).
Schmeling, A., Reisinger, W., Geserik, G. y Olze, A. Estado actual de la evaluación de la edad forense de los sujetos vivos para fines de enjuiciamiento penal. Forense. medicamento. Patología. 1, 239–246 (2005).
Pan, J. et al. Un método modificado para evaluar la edad dental de los niños de 5 a 16 años en el este de China. clínico. Encuesta oral. 25, 3463–3474 (2021).
Lee, SS, etc. Cronología del desarrollo de segundos y terceros molares en coreanos y su aplicación para evaluación de la edad forense. internacionalidad. J. Medicina legal. 124, 659–665 (2010).
Oh, S., Kumagai, A., Kim, Sy y Lee, SS Precisión de la estimación de edad y la estimación del umbral de 18 años basado en la madurez de la segunda y tercera molares en coreanos y japoneses. Plos One 17, E0271247 (2022).
Kim, JY, et al. El análisis de datos preoperatorios basados ​​en el aprendizaje automático puede predecir el resultado del tratamiento de la cirugía de sueño en pacientes con AOS. La ciencia. Informe 11, 14911 (2021).
Han, M. et al. ¿Estimación de edad precisa del aprendizaje automático con o sin intervención humana? internacionalidad. J. Medicina legal. 136, 821–831 (2022).
Khan, S. y Shaheen, M. De la minería de datos a la minería de datos. J.Información. La ciencia. https://doi.org/10.1177/01655515211030872 (2021).
Khan, S. y Shaheen, M. Wisrule: El primer algoritmo cognitivo para la minería de reglas de asociación. J.Información. La ciencia. https://doi.org/10.1177/01655515221108695 (2022).
Shaheen M. y Abdullah U. Karm: minería de datos tradicional basada en reglas de asociación basadas en el contexto. calcular. Mate. continuar. 68, 3305–3322 (2021).
Muhammad M., Rehman Z., Shaheen M., Khan M. y Habib M. Detección de similitud semántica basada en el aprendizaje profundo utilizando datos de texto. informar. tecnologías. control. https://doi.org/10.5755/j01.itc.49.4.27118 (2020).
Tabish, M., Tanoli, Z. y Shahin, M. Un sistema para reconocer la actividad en videos deportivos. multimedia. Aplicaciones de herramientas https://doi.org/10.1007/S11042-021-10519-6 (2021).
Halabi, SS et al. Desafío de aprendizaje automático de RSNA en la era del hueso pediátrico. Radiology 290, 498–503 (2019).
Li, Y. et al. Estimación de la edad forense a partir de radiografías pélvicas utilizando el aprendizaje profundo. EURO. radiación. 29, 2322–2329 (2019).
Guo, YC, et al. Clasificación de edad precisa utilizando métodos manuales y redes neuronales convolucionales profundas de imágenes de proyección ortográfica. internacionalidad. J. Medicina legal. 135, 1589–1597 (2021).
Alabama Dalora et al. Estimación de la edad ósea utilizando diferentes métodos de aprendizaje automático: una revisión sistemática de la literatura y un metanálisis. Plos One 14, E0220242 (2019).
Du, H., Li, G., Cheng, K. y Yang, J. Estimación de edad específica de la población de afroamericanos y chinos basados ​​en volúmenes de cámara de pulpa de los primeros molares utilizando tomografía computarizada de haz de cono. internacionalidad. J. Medicina legal. 136, 811–819 (2022).
Kim S., Lee YH, Noh YK, Park FK y OH KS determinando grupos de edad de personas vidas utilizando imágenes de primeros molares basadas en inteligencia artificial. La ciencia. Informe 11, 1073 (2021).
Stern, D., Payer, C., Giuliani, N. y Urschler, M. Estimación de edad automática y clasificación de edad mayoritaria a partir de datos de resonancia magnética multivariada. IEEE J. Biomed. Alertas de salud. 23, 1392–1403 (2019).
Cheng, Q., Ge, Z., Du, H. y Li, G. Estimación de edad basada en la segmentación de la cámara de pulpa 3D de los primeros molares de la tomografía computarizada del haz de cono integrando el aprendizaje profundo y los conjuntos de niveles. internacionalidad. J. Medicina legal. 135, 365–373 (2021).
Wu, WT, et al. Minería de datos en big data clínico: bases de datos comunes, pasos y modelos de métodos. Mundo. medicamento. recurso. 8, 44 (2021).
Yang, J. et al. Introducción a bases de datos médicas y tecnologías de minería de datos en la era de Big Data. J. Avid. Medicina básica. 13, 57–69 (2020).
Shen, S. et al. Método de Camerer para estimar la edad de los dientes utilizando el aprendizaje automático. BMC Oral Health 21, 641 (2021).
Galliburg A. et al. Comparación de diferentes métodos de aprendizaje automático para predecir la edad dental utilizando el método de estadificación Demirdjian. internacionalidad. J. Medicina legal. 135, 665–675 (2021).
Demirdjian, A., Goldstein, H. y Tanner, JM Un nuevo sistema para evaluar la edad dental. bufido. biología. 45, 211–227 (1973).
Landis, Jr y Koch, GG Medidas del Acuerdo de Observador sobre datos categóricos. Biometrics 33, 159–174 (1977).
Bhattacharjee S, Prakash D, Kim C, Kim HK y Choi HK. Análisis textural, morfológico y estadístico de imágenes de resonancia magnética bidimensional utilizando técnicas de inteligencia artificial para la diferenciación de tumores cerebrales primarios. Información de salud. recurso. https://doi.org/10.4258/hir.2022.28.1.46 (2022).


Tiempo de publicación: enero-04-2024