• nosotros

Validación de un modelo de minería de datos frente a métodos tradicionales de estimación de la edad dental entre adolescentes y adultos jóvenes coreanos

Gracias por visitar Nature.com.La versión del navegador que está utilizando tiene soporte CSS limitado.Para obtener mejores resultados, recomendamos utilizar una versión más reciente de su navegador (o desactivar el modo de compatibilidad en Internet Explorer).Mientras tanto, para garantizar un soporte continuo, mostramos el sitio sin estilo ni JavaScript.
Los dientes se consideran el indicador más preciso de la edad del cuerpo humano y se utilizan a menudo en la evaluación forense de la edad.Nuestro objetivo era validar las estimaciones de edad dental basadas en la minería de datos comparando la precisión de la estimación y el rendimiento de la clasificación del umbral de 18 años con métodos tradicionales y estimaciones de edad basadas en la minería de datos.Se recogieron un total de 2.657 radiografías panorámicas de ciudadanos coreanos y japoneses de entre 15 y 23 años.Se dividieron en un conjunto de entrenamiento, cada uno con 900 radiografías coreanas, y un conjunto de prueba interno que contenía 857 radiografías japonesas.Comparamos la precisión y eficiencia de la clasificación de los métodos tradicionales con conjuntos de prueba de modelos de minería de datos.La precisión del método tradicional en el conjunto de pruebas internas es ligeramente mayor que la del modelo de minería de datos, y la diferencia es pequeña (error absoluto medio <0,21 años, error cuadrático medio <0,24 años).El rendimiento de la clasificación para el límite de 18 años también es similar entre los métodos tradicionales y los modelos de minería de datos.Por lo tanto, los métodos tradicionales pueden ser reemplazados por modelos de minería de datos al realizar una evaluación forense de la edad utilizando la madurez de los segundos y terceros molares en adolescentes y adultos jóvenes coreanos.
La estimación de la edad dental se utiliza ampliamente en medicina forense y odontopediatría.En particular, debido a la alta correlación entre la edad cronológica y el desarrollo dental, la evaluación de la edad por etapas del desarrollo dental es un criterio importante para evaluar la edad de niños y adolescentes1,2,3.Sin embargo, para los jóvenes, estimar la edad dental en función de la madurez dental tiene sus limitaciones porque el crecimiento dental es casi completo, con excepción de los terceros molares.La finalidad legal de determinar la edad de jóvenes y adolescentes es proporcionar estimaciones precisas y evidencia científica de si han alcanzado la mayoría de edad.En la práctica médico-legal de adolescentes y adultos jóvenes en Corea, la edad se estimó utilizando el método de Lee y se predijo un umbral legal de 18 años con base en los datos informados por Oh et al 5 .
El aprendizaje automático es un tipo de inteligencia artificial (IA) que aprende y clasifica repetidamente grandes cantidades de datos, resuelve problemas por sí sola e impulsa la programación de datos.El aprendizaje automático puede descubrir patrones ocultos útiles en grandes volúmenes de datos6.Por el contrario, los métodos clásicos, que requieren mucho trabajo y tiempo, pueden tener limitaciones cuando se trata de grandes volúmenes de datos complejos que son difíciles de procesar manualmente7.Por lo tanto, recientemente se han realizado muchos estudios utilizando las últimas tecnologías informáticas para minimizar los errores humanos y procesar de manera eficiente datos multidimensionales8,9,10,11,12.En particular, el aprendizaje profundo se ha utilizado ampliamente en el análisis de imágenes médicas, y se ha informado que varios métodos para la estimación de la edad mediante el análisis automático de radiografías mejoran la precisión y eficiencia de la estimación de la edad13,14,15,16,17,18,19,20 .Por ejemplo, Halabi et al 13 desarrollaron un algoritmo de aprendizaje automático basado en redes neuronales convolucionales (CNN) para estimar la edad esquelética utilizando radiografías de manos de niños.Este estudio propone un modelo que aplica el aprendizaje automático a imágenes médicas y muestra que estos métodos pueden mejorar la precisión del diagnóstico.Li et al14 estimaron la edad a partir de imágenes de rayos X pélvicos utilizando una CNN de aprendizaje profundo y las compararon con los resultados de regresión utilizando la estimación del estadio de osificación.Descubrieron que el modelo CNN de aprendizaje profundo mostraba el mismo rendimiento de estimación de edad que el modelo de regresión tradicional.El estudio de Guo et al. [15] evaluó el rendimiento de clasificación de tolerancia a la edad de la tecnología CNN basándose en ortofotos dentales, y los resultados del modelo CNN demostraron que los humanos superaron su rendimiento de clasificación por edad.
La mayoría de los estudios sobre estimación de la edad mediante aprendizaje automático utilizan métodos de aprendizaje profundo13,14,15,16,17,18,19,20.Se informa que la estimación de la edad basada en el aprendizaje profundo es más precisa que los métodos tradicionales.Sin embargo, este enfoque ofrece pocas oportunidades para presentar la base científica de las estimaciones de edad, como los indicadores de edad utilizados en las estimaciones.También existe una disputa legal sobre quién realiza las inspecciones.Por lo tanto, la estimación de la edad basada en el aprendizaje profundo es difícil de aceptar por parte de las autoridades administrativas y judiciales.La minería de datos (DM) es una técnica que puede descubrir no solo información esperada sino también información inesperada como método para descubrir correlaciones útiles entre grandes cantidades de datos6,21,22.El aprendizaje automático se utiliza a menudo en la minería de datos, y tanto la minería de datos como el aprendizaje automático utilizan los mismos algoritmos clave para descubrir patrones en los datos.La estimación de la edad utilizando el desarrollo dental se basa en la evaluación que hace el examinador de la madurez de los dientes objetivo, y esta evaluación se expresa como una etapa para cada diente objetivo.DM se puede utilizar para analizar la correlación entre la etapa de evaluación dental y la edad real y tiene el potencial de reemplazar el análisis estadístico tradicional.Por tanto, si aplicamos técnicas de DM a la estimación de la edad, podemos implementar el aprendizaje automático en la estimación de la edad forense sin preocuparnos por la responsabilidad legal.Se han publicado varios estudios comparativos sobre posibles alternativas a los métodos manuales tradicionales utilizados en la práctica forense y los métodos basados ​​en la EBM para determinar la edad dental.Shen et al23 demostraron que el modelo DM es más preciso que la fórmula tradicional de Camerer.Galibourg et al24 aplicaron diferentes métodos DM para predecir la edad según el criterio de Demirdjian25 y los resultados mostraron que el método DM superó a los métodos de Demirdjian y Willems en la estimación de la edad de la población francesa.
Para estimar la edad dental de los adolescentes y adultos jóvenes coreanos, el método 4 de Lee se utiliza ampliamente en la práctica forense coreana.Este método utiliza análisis estadístico tradicional (como la regresión múltiple) para examinar la relación entre los sujetos coreanos y la edad cronológica.En este estudio, los métodos de estimación de la edad obtenidos mediante métodos estadísticos tradicionales se definen como “métodos tradicionales”.El método de Lee es un método tradicional y su precisión ha sido confirmada por Oh et al.5;sin embargo, la aplicabilidad de la estimación de la edad basada en el modelo DM en la práctica forense coreana sigue siendo cuestionable.Nuestro objetivo fue validar científicamente la utilidad potencial de la estimación de la edad basada en el modelo DM.El propósito de este estudio fue (1) comparar la precisión de dos modelos de DM en la estimación de la edad dental y (2) comparar el rendimiento de clasificación de 7 modelos de DM a la edad de 18 años con los obtenidos utilizando métodos estadísticos tradicionales. y terceros molares en ambos maxilares.
Las medias y las desviaciones estándar de la edad cronológica por etapa y tipo de diente se muestran en línea en la Tabla complementaria S1 (conjunto de entrenamiento), la Tabla complementaria S2 (conjunto de pruebas internas) y la Tabla complementaria S3 (conjunto de pruebas externas).Los valores kappa de confiabilidad intra e interobservador obtenidos del conjunto de entrenamiento fueron 0,951 y 0,947, respectivamente.Los valores de p y los intervalos de confianza del 95% para los valores kappa se muestran en la tabla complementaria S4 en línea.El valor kappa fue interpretado como “casi perfecto”, consistente con el criterio de Landis y Koch26.
Al comparar el error absoluto medio (MAE), el método tradicional supera ligeramente al modelo DM para todos los géneros y en el conjunto de pruebas masculino externo, con la excepción del perceptrón multicapa (MLP).La diferencia entre el modelo tradicional y el modelo DM en el conjunto de pruebas internas MAE fue de 0,12 a 0,19 años para los hombres y de 0,17 a 0,21 años para las mujeres.Para la batería de pruebas externa, las diferencias son menores (0,001 a 0,05 años para los hombres y 0,05 a 0,09 años para las mujeres).Además, el error cuadrático medio (RMSE) es ligeramente inferior al del método tradicional, con diferencias más pequeñas (0,17–0,24, 0,2–0,24 para el conjunto de pruebas interno masculino y 0,03–0,07, 0,04–0,08 para el conjunto de pruebas externo).).MLP muestra un rendimiento ligeramente mejor que el perceptrón de capa única (SLP), excepto en el caso del equipo de prueba externo femenino.Para MAE y RMSE, el conjunto de pruebas externas obtiene puntuaciones más altas que el conjunto de pruebas internas para todos los géneros y modelos.Todos los MAE y RMSE se muestran en la Tabla 1 y la Figura 1.
MAE y RMSE de modelos de regresión tradicionales y de minería de datos.Error absoluto medio MAE, error cuadrático medio RMSE, perceptrón de capa única SLP, perceptrón multicapa MLP, método CM tradicional.
El rendimiento de clasificación (con un límite de 18 años) de los modelos tradicional y DM se demostró en términos de sensibilidad, especificidad, valor predictivo positivo (VPP), valor predictivo negativo (VPN) y área bajo la curva característica operativa del receptor (AUROC). 27 (Tabla 2, Figura 2 y Figura 1 complementaria en línea).En términos de sensibilidad de la batería de pruebas internas, los métodos tradicionales obtuvieron mejores resultados entre los hombres y peores entre las mujeres.Sin embargo, la diferencia en el rendimiento de clasificación entre los métodos tradicionales y SD es del 9,7% para los hombres (MLP) y sólo del 2,4% para las mujeres (XGBoost).Entre los modelos de DM, la regresión logística (LR) mostró mejor sensibilidad en ambos sexos.En cuanto a la especificidad del conjunto de pruebas internas, se observó que los cuatro modelos SD obtuvieron buenos resultados en los hombres, mientras que el modelo tradicional tuvo mejores resultados en las mujeres.Las diferencias en el desempeño de clasificación para hombres y mujeres son 13,3% (MLP) y 13,1% (MLP), respectivamente, lo que indica que la diferencia en el desempeño de clasificación entre modelos excede la sensibilidad.Entre los modelos DM, los modelos de máquina de vectores de soporte (SVM), árbol de decisión (DT) y bosque aleatorio (RF) tuvieron mejores resultados entre los hombres, mientras que el modelo LR tuvo mejores resultados entre las mujeres.El AUROC del modelo tradicional y de todos los modelos SD fue superior a 0,925 (k-vecino más cercano (KNN) en hombres), lo que demuestra un excelente rendimiento de clasificación al discriminar muestras de 18 años28.Para el conjunto de pruebas externas, hubo una disminución en el rendimiento de la clasificación en términos de sensibilidad, especificidad y AUROC en comparación con el conjunto de pruebas internas.Además, la diferencia en sensibilidad y especificidad entre el rendimiento de clasificación de los mejores y peores modelos osciló entre el 10% y el 25% y fue mayor que la diferencia en el conjunto de pruebas internas.
Sensibilidad y especificidad de los modelos de clasificación de minería de datos en comparación con los métodos tradicionales con un corte de 18 años.KNN k vecino más cercano, máquina de vectores de soporte SVM, regresión logística LR, árbol de decisión DT, bosque aleatorio RF, XGB XGBoost, perceptrón multicapa MLP, método CM tradicional.
El primer paso de este estudio fue comparar la precisión de las estimaciones de la edad dental obtenidas a partir de siete modelos de DM con las obtenidas mediante la regresión tradicional.MAE y RMSE se evaluaron en conjuntos de pruebas internas para ambos sexos, y la diferencia entre el método tradicional y el modelo DM osciló entre 44 y 77 días para MAE y de 62 a 88 días para RMSE.Aunque el método tradicional fue ligeramente más preciso en este estudio, es difícil concluir si una diferencia tan pequeña tiene importancia clínica o práctica.Estos resultados indican que la precisión de la estimación de la edad dental utilizando el modelo DM es casi la misma que la del método tradicional.La comparación directa con los resultados de estudios anteriores es difícil porque ningún estudio ha comparado la precisión de los modelos DM con los métodos estadísticos tradicionales utilizando la misma técnica de registro de dientes en el mismo rango de edad que en este estudio.Galibourg et al24 compararon MAE y RMSE entre dos métodos tradicionales (método Demirjian25 y método Willems29) y 10 modelos de DM en una población francesa de 2 a 24 años.Informaron que todos los modelos DM eran más precisos que los métodos tradicionales, con diferencias de 0,20 y 0,38 años en MAE y 0,25 y 0,47 años en RMSE en comparación con los métodos de Willems y Demirdjian, respectivamente.La discrepancia entre el modelo SD y los métodos tradicionales mostrada en el estudio de Halibourg tiene en cuenta numerosos informes30,31,32,33 de que el método Demirdjian no estima con precisión la edad dental en poblaciones distintas de los canadienses franceses en las que se basó el estudio.en este estudio.Tai et al 34 utilizaron el algoritmo MLP para predecir la edad de los dientes a partir de 1.636 fotografías de ortodoncia china y compararon su precisión con los resultados del método de Demirjian y Willems.Informaron que MLP tiene mayor precisión que los métodos tradicionales.La diferencia entre el método Demirdjian y el método tradicional es <0,32 años y el método Willems es de 0,28 años, lo que es similar a los resultados del presente estudio.Los resultados de estos estudios previos24,34 también son consistentes con los resultados del presente estudio, y la precisión de la estimación de la edad del modelo DM y el método tradicional son similares.Sin embargo, con base en los resultados presentados, solo podemos concluir cautelosamente que el uso de modelos de DM para estimar la edad puede reemplazar los métodos existentes debido a la falta de estudios previos comparativos y de referencia.Se necesitan estudios de seguimiento con muestras más grandes para confirmar los resultados obtenidos en este estudio.
Entre los estudios que probaron la precisión de la SD en la estimación de la edad dental, algunos mostraron una precisión mayor que nuestro estudio.Stepanovsky et al 35 aplicaron 22 modelos SD a radiografías panorámicas de 976 residentes checos de edades comprendidas entre 2,7 y 20,5 años y probaron la precisión de cada modelo.Evaluaron el desarrollo de un total de 16 dientes permanentes superiores e inferiores izquierdos utilizando los criterios de clasificación propuestos por Moorrees et al 36.El MAE oscila entre 0,64 y 0,94 años y el RMSE oscila entre 0,85 y 1,27 años, que son más precisos que los dos modelos DM utilizados en este estudio.Shen et al23 utilizaron el método Cameriere para estimar la edad dental de siete dientes permanentes en la mandíbula izquierda en residentes del este de China de 5 a 13 años y la compararon con edades estimadas mediante regresión lineal, SVM y RF.Demostraron que los tres modelos DM tienen mayor precisión en comparación con la fórmula tradicional de Cameriere.El MAE y el RMSE en el estudio de Shen fueron más bajos que los del modelo DM de este estudio.La mayor precisión de los estudios de Stepanovsky et al.35 y Shen et al.23 puede deberse a la inclusión de sujetos más jóvenes en sus muestras de estudio.Debido a que las estimaciones de edad de los participantes con dientes en desarrollo se vuelven más precisas a medida que aumenta el número de dientes durante el desarrollo dental, la precisión del método de estimación de edad resultante puede verse comprometida cuando los participantes del estudio son más jóvenes.Además, el error de MLP en la estimación de la edad es ligeramente menor que el de SLP, lo que significa que MLP es más preciso que SLP.MLP se considera ligeramente mejor para la estimación de la edad, posiblemente debido a las capas ocultas en MLP38.Sin embargo, existe una excepción para la muestra externa de mujeres (SLP 1,45, MLP 1,49).El hallazgo de que el MLP es más preciso que el SLP para evaluar la edad requiere estudios retrospectivos adicionales.
También se comparó el rendimiento de clasificación del modelo DM y el método tradicional en un umbral de 18 años.Todos los modelos SD probados y los métodos tradicionales en el conjunto de pruebas internas mostraron niveles de discriminación prácticamente aceptables para la muestra de 18 años.La sensibilidad para hombres y mujeres fue superior al 87,7% y 94,9%, respectivamente, y la especificidad fue superior al 89,3% y 84,7%.El AUROC de todos los modelos probados también supera 0,925.Hasta donde sabemos, ningún estudio ha probado el rendimiento del modelo DM para la clasificación de 18 años basada en la madurez dental.Podemos comparar los resultados de este estudio con el rendimiento de clasificación de modelos de aprendizaje profundo en radiografías panorámicas.Guo et al.15 calcularon el rendimiento de clasificación de un modelo de aprendizaje profundo basado en CNN y un método manual basado en el método de Demirjian para un cierto umbral de edad.La sensibilidad y especificidad del método manual fueron del 87,7% y 95,5%, respectivamente, y la sensibilidad y especificidad del modelo CNN superó el 89,2% y el 86,6%, respectivamente.Concluyeron que los modelos de aprendizaje profundo pueden reemplazar o superar la evaluación manual en la clasificación de los umbrales de edad.Los resultados de este estudio mostraron un rendimiento de clasificación similar;Se cree que la clasificación mediante modelos DM puede reemplazar los métodos estadísticos tradicionales para la estimación de la edad.Entre los modelos, DM LR fue el mejor modelo en términos de sensibilidad para la muestra masculina y sensibilidad y especificidad para la muestra femenina.LR ocupa el segundo lugar en especificidad para los hombres.Además, el LR se considera uno de los modelos DM35 más fáciles de usar y es menos complejo y difícil de procesar.Según estos resultados, LR se consideró el mejor modelo de clasificación de corte para jóvenes de 18 años en la población coreana.
En general, la precisión de la estimación de la edad o el desempeño de la clasificación en el conjunto de pruebas externas fue pobre o menor en comparación con los resultados en el conjunto de pruebas internas.Algunos informes indican que la precisión o eficiencia de la clasificación disminuye cuando las estimaciones de edad basadas en la población coreana se aplican a la población japonesa5,39, y en el presente estudio se encontró un patrón similar.Esta tendencia de deterioro también se observó en el modelo DM.Por lo tanto, para estimar con precisión la edad, incluso cuando se utiliza MS en el proceso de análisis, se deben preferir los métodos derivados de datos de la población nativa, como los métodos tradicionales5,39,40,41,42.Dado que no está claro si los modelos de aprendizaje profundo pueden mostrar tendencias similares, se necesitan estudios que comparen la precisión y la eficiencia de la clasificación utilizando métodos tradicionales, modelos DM y modelos de aprendizaje profundo en las mismas muestras para confirmar si la inteligencia artificial puede superar estas disparidades raciales en edades limitadas.evaluaciones.
Demostramos que los métodos tradicionales pueden ser reemplazados por la estimación de la edad basada en el modelo DM en la práctica de estimación de la edad forense en Corea.También descubrimos la posibilidad de implementar el aprendizaje automático para la evaluación forense de la edad.Sin embargo, existen limitaciones claras, como el número insuficiente de participantes en este estudio para determinar definitivamente los resultados y la falta de estudios previos para comparar y confirmar los resultados de este estudio.En el futuro, los estudios de DM deberían realizarse con un mayor número de muestras y poblaciones más diversas para mejorar su aplicabilidad práctica en comparación con los métodos tradicionales.Para validar la viabilidad del uso de inteligencia artificial para estimar la edad en múltiples poblaciones, se necesitan estudios futuros para comparar la precisión y eficiencia de la clasificación de DM y los modelos de aprendizaje profundo con los métodos tradicionales en las mismas muestras.
El estudio utilizó 2.657 fotografías ortográficas recopiladas de adultos coreanos y japoneses de entre 15 y 23 años.Las radiografías coreanas se dividieron en 900 conjuntos de entrenamiento (19,42 ± 2,65 años) y 900 conjuntos de prueba internos (19,52 ± 2,59 años).El conjunto de capacitación se recopiló en una institución (Hospital St. Mary's de Seúl) y el conjunto de pruebas propio se recopiló en dos instituciones (Hospital Dental de la Universidad Nacional de Seúl y Hospital Dental de la Universidad de Yonsei).También recopilamos 857 radiografías de otros datos basados ​​en la población (Universidad Médica de Iwate, Japón) para pruebas externas.Se seleccionaron radiografías de sujetos japoneses (19,31 ± 2,60 años) como conjunto de prueba externo.Los datos se recolectaron retrospectivamente para analizar las etapas del desarrollo dental en radiografías panorámicas tomadas durante el tratamiento dental.Todos los datos recopilados fueron anónimos excepto el sexo, la fecha de nacimiento y la fecha de la radiografía.Los criterios de inclusión y exclusión fueron los mismos que los de estudios publicados anteriormente 4, 5.La edad real de la muestra se calculó restando la fecha de nacimiento de la fecha en que se tomó la radiografía.El grupo de muestra se dividió en nueve grupos de edad.Las distribuciones por edad y sexo se muestran en la Tabla 3. Este estudio se realizó de acuerdo con la Declaración de Helsinki y fue aprobado por la Junta de Revisión Institucional (IRB) del Hospital St. Mary's de Seúl de la Universidad Católica de Corea (KC22WISI0328).Debido al diseño retrospectivo de este estudio, no se pudo obtener el consentimiento informado de todos los pacientes sometidos a un examen radiográfico con fines terapéuticos.El Hospital St. Mary's de la Universidad de Corea de Seúl (IRB) renunció al requisito de consentimiento informado.
Las etapas de desarrollo de los segundos y terceros molares bimaxilares se evaluaron según los criterios de Demircan25.Solo se seleccionó un diente si se encontraba el mismo tipo de diente en los lados izquierdo y derecho de cada mandíbula.Si los dientes homólogos de ambos lados estaban en diferentes etapas de desarrollo, se seleccionó el diente con la etapa de desarrollo más baja para tener en cuenta la incertidumbre en la edad estimada.Dos observadores experimentados calificaron cien radiografías seleccionadas al azar del conjunto de entrenamiento para probar la confiabilidad interobservador después de la precalibración para determinar el estado de madurez dental.El observador principal evaluó la confiabilidad intraobservador dos veces a intervalos de tres meses.
Un observador primario entrenado con diferentes modelos de DM estimó el sexo y la etapa de desarrollo de los segundos y terceros molares de cada mandíbula en el conjunto de entrenamiento, y la edad real se estableció como el valor objetivo.Los modelos SLP y MLP, que se utilizan ampliamente en el aprendizaje automático, se probaron con algoritmos de regresión.El modelo DM combina funciones lineales utilizando las etapas de desarrollo de los cuatro dientes y combina estos datos para estimar la edad.SLP es la red neuronal más simple y no contiene capas ocultas.SLP funciona según un umbral de transmisión entre nodos.El modelo SLP en regresión es matemáticamente similar a la regresión lineal múltiple.A diferencia del modelo SLP, el modelo MLP tiene múltiples capas ocultas con funciones de activación no lineales.Nuestros experimentos utilizaron una capa oculta con solo 20 nodos ocultos con funciones de activación no lineales.Utilice el descenso de gradiente como método de optimización y MAE y RMSE como función de pérdida para entrenar nuestro modelo de aprendizaje automático.Se aplicó el mejor modelo de regresión obtenido a los conjuntos de prueba internos y externos y se estimó la edad de los dientes.
Se desarrolló un algoritmo de clasificación que utiliza la madurez de cuatro dientes en el conjunto de entrenamiento para predecir si una muestra tiene 18 años o no.Para construir el modelo, derivamos siete algoritmos de aprendizaje automático de representación6,43: (1) LR, (2) KNN, (3) SVM, (4) DT, (5) RF, (6) XGBoost y (7) MLP. .LR es uno de los algoritmos de clasificación más utilizados44.Es un algoritmo de aprendizaje supervisado que utiliza regresión para predecir la probabilidad de que los datos pertenezcan a una determinada categoría de 0 a 1 y clasifica los datos como pertenecientes a una categoría más probable en función de esta probabilidad;Se utiliza principalmente para clasificación binaria.KNN es uno de los algoritmos de aprendizaje automático más simples45.Cuando se le dan nuevos datos de entrada, encuentra k datos cercanos al conjunto existente y luego los clasifica en la clase con la frecuencia más alta.Establecemos 3 para el número de vecinos considerados (k).SVM es un algoritmo que maximiza la distancia entre dos clases mediante el uso de una función central para expandir el espacio lineal a un espacio no lineal llamado campos46.Para este modelo, utilizamos sesgo = 1, potencia = 1 y gamma = 1 como hiperparámetros para el núcleo polinomial.DT se ha aplicado en varios campos como algoritmo para dividir un conjunto de datos completo en varios subgrupos representando reglas de decisión en una estructura de árbol47.El modelo está configurado con un número mínimo de registros por nodo de 2 y utiliza el índice de Gini como medida de calidad.RF es un método de conjunto que combina múltiples DT para mejorar el rendimiento utilizando un método de agregación de arranque que genera un clasificador débil para cada muestra al extraer aleatoriamente muestras del mismo tamaño varias veces del conjunto de datos original48.Utilizamos 100 árboles, 10 profundidades de árbol, 1 tamaño mínimo de nodo y el índice de mezcla de Gini como criterio de separación de nodos.La clasificación de los nuevos datos se determina por mayoría de votos.XGBoost es un algoritmo que combina técnicas de boosting usando un método que toma como datos de entrenamiento el error entre los valores reales y predichos del modelo anterior y aumenta el error usando gradientes49.Es un algoritmo ampliamente utilizado debido a su buen rendimiento y eficiencia de recursos, así como a su alta confiabilidad como función de corrección de sobreajuste.El modelo está equipado con 400 ruedas de apoyo.MLP es una red neuronal en la que uno o más perceptrones forman múltiples capas con una o más capas ocultas entre las capas de entrada y salida38.Con esto, puede realizar una clasificación no lineal en la que, cuando agrega una capa de entrada y obtiene un valor de resultado, el valor del resultado previsto se compara con el valor del resultado real y el error se propaga hacia atrás.Creamos una capa oculta con 20 neuronas ocultas en cada capa.Cada modelo que desarrollamos se aplicó a conjuntos internos y externos para probar el rendimiento de la clasificación calculando la sensibilidad, la especificidad, el VPP, el VPN y el AUROC.La sensibilidad se define como la relación entre una muestra estimada de 18 años o más y una muestra estimada de 18 años o más.La especificidad es la proporción de muestras menores de 18 años y aquellas estimadas menores de 18 años.
Las etapas dentales evaluadas en el conjunto de entrenamiento se convirtieron en etapas numéricas para el análisis estadístico.Se realizaron regresiones lineales y logísticas multivariadas para desarrollar modelos predictivos para cada sexo y derivar fórmulas de regresión que puedan usarse para estimar la edad.Usamos estas fórmulas para estimar la edad de los dientes para conjuntos de pruebas tanto internos como externos.La Tabla 4 muestra los modelos de regresión y clasificación utilizados en este estudio.
La confiabilidad intra e interobservador se calculó utilizando la estadística kappa de Cohen.Para probar la precisión de DM y los modelos de regresión tradicionales, calculamos MAE y RMSE utilizando las edades estimadas y reales de los conjuntos de prueba internos y externos.Estos errores se utilizan comúnmente para evaluar la precisión de las predicciones del modelo.Cuanto menor sea el error, mayor será la precisión del pronóstico24.Compare el MAE y el RMSE de conjuntos de pruebas internos y externos calculados mediante DM y regresión tradicional.El desempeño de la clasificación del límite de 18 años en las estadísticas tradicionales se evaluó mediante una tabla de contingencia de 2 × 2.La sensibilidad, especificidad, VPP, VPN y AUROC calculados del conjunto de pruebas se compararon con los valores medidos del modelo de clasificación de DM.Los datos se expresan como media ± desviación estándar o número (%) según las características de los datos.Los valores de P bilaterales <0,05 se consideraron estadísticamente significativos.Todos los análisis estadísticos de rutina se realizaron utilizando SAS versión 9.4 (SAS Institute, Cary, NC).El modelo de regresión DM se implementó en Python utilizando el backend Keras50 2.2.4 y Tensorflow51 1.8.0 específicamente para operaciones matemáticas.El modelo de clasificación DM se implementó en Waikato Knowledge Analysis Environment y la plataforma de análisis Konstanz Information Miner (KNIME) 4.6.152.
Los autores reconocen que los datos que respaldan las conclusiones del estudio se pueden encontrar en el artículo y en los materiales complementarios.Los conjuntos de datos generados y/o analizados durante el estudio están disponibles del autor correspondiente previa solicitud razonable.
Ritz-Timme, S. et al.Evaluación de edad: estado del arte para cumplir con los requisitos específicos de la práctica forense.internacionalidad.J. Medicina legal.113, 129-136 (2000).
Schmeling, A., Reisinger, W., Geserik, G. y Olze, A. Estado actual de la evaluación forense de la edad de sujetos vivos con fines de procesamiento penal.Forense.medicamento.Patología.1, 239–246 (2005).
Pan, J. y col.Un método modificado para evaluar la edad dental de niños de 5 a 16 años en el este de China.clínico.Encuesta oral.25, 3463–3474 (2021).
Lee, SS, etc. Cronología del desarrollo de los segundos y terceros molares en coreanos y su aplicación para la evaluación forense de la edad.internacionalidad.J. Medicina legal.124, 659–665 (2010).
Oh, S., Kumagai, A., Kim, SY y Lee, SS Precisión de la estimación de la edad y estimación del umbral de 18 años basado en la madurez de los segundos y terceros molares en coreanos y japoneses.MÁS UNO 17, e0271247 (2022).
Kim, JY, et al.El análisis de datos preoperatorio basado en aprendizaje automático puede predecir el resultado del tratamiento de la cirugía del sueño en pacientes con AOS.la ciencia.Informe 11, 14911 (2021).
Han, M. y col.¿Estimación precisa de la edad a partir del aprendizaje automático con o sin intervención humana?internacionalidad.J. Medicina legal.136, 821–831 (2022).
Khan, S. y Shaheen, M. De la minería de datos a la minería de datos.J. Información.la ciencia.https://doi.org/10.1177/01655515211030872 (2021).
Khan, S. y Shaheen, M. WisRule: el primer algoritmo cognitivo para la minería de reglas de asociación.J. Información.la ciencia.https://doi.org/10.1177/01655515221108695 (2022).
Shaheen M. y Abdullah U. Karm: Minería de datos tradicional basada en reglas de asociación basadas en el contexto.calcular.Mate.continuar.68, 3305–3322 (2021).
Muhammad M., Rehman Z., Shaheen M., Khan M. y Habib M. Detección de similitud semántica basada en aprendizaje profundo utilizando datos de texto.informar.tecnologías.control.https://doi.org/10.5755/j01.itc.49.4.27118 (2020).
Tabish, M., Tanoli, Z. y Shahin, M. Un sistema para reconocer la actividad en videos deportivos.multimedia.Aplicaciones de herramientas https://doi.org/10.1007/s11042-021-10519-6 (2021).
Halabi, SS y cols.Desafío de aprendizaje automático RSNA en la edad ósea pediátrica.Radiología 290, 498–503 (2019).
Li, Y. et al.Estimación forense de la edad a partir de radiografías pélvicas mediante aprendizaje profundo.EURO.radiación.29, 2322–2329 (2019).
Guo, YC, et al.Clasificación de edad precisa utilizando métodos manuales y redes neuronales convolucionales profundas a partir de imágenes de proyección ortográfica.internacionalidad.J. Medicina legal.135, 1589-1597 (2021).
Alabama Dalora et al.Estimación de la edad ósea utilizando diferentes métodos de aprendizaje automático: una revisión sistemática de la literatura y un metanálisis.MÁS UNO 14, e0220242 (2019).
Du, H., Li, G., Cheng, K. y Yang, J. Estimación de la edad específica de la población de afroamericanos y chinos basada en los volúmenes de la cámara pulpar de los primeros molares mediante tomografía computarizada de haz cónico.internacionalidad.J. Medicina legal.136, 811–819 (2022).
Kim S., Lee YH, Noh YK, Park FK y Oh KS Determinación de grupos de edad de personas vivas utilizando imágenes de primeros molares basadas en inteligencia artificial.la ciencia.Informe 11, 1073 (2021).
Stern, D., Payer, C., Giuliani, N. y Urschler, M. Estimación automática de la edad y clasificación de la mayoría de edad a partir de datos de resonancia magnética multivariados.IEEE J. Biomed.Alertas de salud.23, 1392-1403 (2019).
Cheng, Q., Ge, Z., Du, H. y Li, G. Estimación de la edad basada en la segmentación 3D de la cámara pulpar de los primeros molares a partir de tomografía computarizada de haz cónico mediante la integración de conjuntos de niveles y aprendizaje profundo.internacionalidad.J. Medicina legal.135, 365–373 (2021).
Wu, WT y col.Minería de datos en big data clínico: bases de datos, pasos y modelos de métodos comunes.Mundo.medicamento.recurso.8, 44 (2021).
Yang, J. y col.Introducción a las bases de datos médicas y las tecnologías de minería de datos en la era del Big Data.J. Ávido.Medicina básica.13, 57–69 (2020).
Shen, S. y col.Método de Camerer para estimar la edad de los dientes mediante aprendizaje automático.BMC Salud bucal 21, 641 (2021).
Galliburg A. et al.Comparación de diferentes métodos de aprendizaje automático para predecir la edad dental utilizando el método de estadificación de Demirdjian.internacionalidad.J. Medicina legal.135, 665–675 (2021).
Demirdjian, A., Goldstein, H. y Tanner, JM Un nuevo sistema para evaluar la edad dental.bufido.biología.45, 211–227 (1973).
Landis, JR y Koch, GG Medidas de acuerdo del observador sobre datos categóricos.Biometría 33, 159-174 (1977).
Bhattacharjee S, Prakash D, Kim C, Kim HK y Choi HK.Análisis textural, morfológico y estadístico de imágenes por resonancia magnética bidimensional mediante técnicas de inteligencia artificial para la diferenciación de tumores cerebrales primarios.Información de salud.recurso.https://doi.org/10.4258/hir.2022.28.1.46 (2022).


Hora de publicación: 04-ene-2024