Eine auf aktiver Lernmaschinentechnik basierende Vorhersage kardiovaskulärer Herzerkrankungen von UCI

Scientific Reports Band 13, Artikelnummer: 13588 (2023) Diesen Artikel zitieren

332 Zugriffe

5 Altmetrisch

Details zu den Metriken

Herzerkrankungen sind eine bedeutende globale Todesursache und ihre Vorhersage durch klinische Datenanalyse stellt eine Herausforderung dar. Maschinelles Lernen (ML) hat sich zu einem wertvollen Werkzeug zur Diagnose und Vorhersage von Herzerkrankungen durch die Analyse von Gesundheitsdaten entwickelt. Frühere Studien haben ML-Techniken in der medizinischen Forschung zur Vorhersage von Herzerkrankungen in großem Umfang eingesetzt. In dieser Studie wurden acht ML-Klassifikatoren verwendet, um entscheidende Merkmale zu identifizieren, die die Genauigkeit der Vorhersage von Herzerkrankungen verbessern. Zur Entwicklung des Vorhersagemodells wurden verschiedene Kombinationen von Merkmalen und bekannte Klassifizierungsalgorithmen eingesetzt. Es wurden neuronale Netzwerkmodelle wie Naive Bayes und Radial Basis Functions implementiert, die Genauigkeiten von 94,78 % bzw. 90,78 % bei der Vorhersage von Herzerkrankungen erreichten. Unter den modernsten Methoden zur Vorhersage kardiovaskulärer Probleme wies die Learning Vector Quantization mit 98,7 % die höchste Genauigkeitsrate auf. Die Motivation für die Vorhersage kardiovaskulärer Herzerkrankungen liegt in ihrem Potenzial, Leben zu retten, die Gesundheitsergebnisse zu verbessern und Gesundheitsressourcen effizient zu verteilen. Die wichtigsten Beiträge umfassen Frühintervention, personalisierte Medizin, technologische Fortschritte, die Auswirkungen auf die öffentliche Gesundheit und laufende Forschung, die alle gemeinsam darauf hinarbeiten, die Belastung durch KHK sowohl für einzelne Patienten als auch für die Gesellschaft als Ganzes zu verringern.

Die Gesundheitsbranche generiert viele Daten über Patienten, Krankheiten und Diagnosen, diese werden jedoch nicht richtig genutzt, um die gewünschten Ergebnisse zu erzielen. Herzerkrankungen und Schlaganfälle sind zwei der Haupttodesursachen. Laut einem WHO-Bericht sterben jedes Jahr mehr als 17,8 Millionen Menschen direkt an Herz-Kreislauf-Erkrankungen. Da es nicht genügend Analysen gibt, haben die riesigen Mengen an Patienten-, Krankheits- und Diagnosedaten der Gesundheitsbranche nicht den erhofften Effekt auf die Patientengesundheit1. Herz- und Blutgefäßerkrankungen (CKE) umfassen koronare Herzkrankheit, Myokarditis, Gefäßerkrankungen und andere Erkrankungen. Schlaganfall und Herzerkrankungen töten 80 % aller Menschen, die an Herz-Kreislauf-Erkrankungen sterben. Drei Viertel aller Menschen, die sterben, sind unter 70 Jahre alt. Die Hauptrisikofaktoren für Herz-Kreislauf-Erkrankungen sind Geschlecht, Rauchen, Alter, Familiengeschichte, schlechte Ernährung, Lipide, Bewegungsmangel und Bluthochdruck , Gewichtszunahme und Alkoholkonsum2. Hoher Blutdruck und Diabetes sind zwei Beispiele für Faktoren, die vererbt werden können und das Risiko für Herz-Kreislauf-Erkrankungen erhöhen. Weitere Faktoren, die das Risiko erhöhen, sind Bewegungsmangel, Übergewicht, schlechte Ernährung, Rücken-, Nacken- und Schulterschmerzen, starke Müdigkeit und ein schneller Herzschlag. Die meisten Menschen leiden unter Brustschmerzen, Schulterschmerzen, Armschmerzen, Kurzatmigkeit und einem allgemeinen Schwächegefühl. Nach wie vor sind Schmerzen in der Brust das häufigste Zeichen dafür, dass das Herz nicht genug Blut bekommt3. Diese Art von Brustschmerzen wird in der Medizin Angina pectoris genannt. Einige Tests wie Röntgenaufnahmen, Magnetresonanztomographie (MRT) und Angiographie können dabei helfen, herauszufinden, was nicht stimmt. Andererseits sind wichtige medizinische Geräte manchmal nicht leicht zugänglich, was die Möglichkeiten im Notfall einschränkt. Wenn es darum geht, herauszufinden, was mit Ihrem Herzen nicht stimmt, und es zu behandeln, zählt jede Sekunde4. Die Diagnostik von Herzerkrankungen ist nicht so gut, wie sie sein könnte, und es besteht ein großer Bedarf an einer besseren Big-Data-Analyse bei der Neugestaltung des Herz-Kreislauf-Systems und den Patientenergebnissen. Aber Rauschen, Unvollständigkeit und Unregelmäßigkeiten in den Daten machen es schwierig, daraus klare, genaue und fundierte Schlussfolgerungen zu ziehen. Aufgrund der jüngsten Fortschritte bei Technologien wie Big Data, Informationsspeicherung und -abruf spielt computergestützte Intelligenz eine wichtige Rolle in der Kardiologie. Um Schlussfolgerungen aus den mit verschiedenen ML-Modellen gewonnenen Daten zu ziehen, verwendeten die Forscher Vorverarbeitungstechniken5. Mithilfe eines gemeinsamen Satzes von Algorithmen und ihrer Variationen, die zur Verfolgung erblicher Herzerkrankungen und gesunder Kontrollpersonen verwendet werden, ist es möglich, vorherzusagen, wann das erste Stadium der Herzinsuffizienz beginnt. Klassifizierungstechnik, DT-, SVC-, LR- und RF-Maschinen sind alle Arten von Algorithmen, die zur Vorhersage eines Herzstillstands verwendet werden können. Wenn es um maschinelles Lernen geht, gibt es im Wesentlichen drei Denkweisen: Die drei Haupttypen des maschinellen Lernens sind aufgabengesteuertes überwachtes ML (Klassifizierung/Regression), datengesteuertes unüberwachtes ML (Clustering) und fehlergesteuertes verstärkendes Lernen ( RL). Die koronare Herzkrankheit ist eine sehr häufige Erkrankung der Hauptblutgefäße, die den Herzmuskel mit Blut versorgen. In den Arterien des Herzens können sich Plaques bilden, die aus Lipoproteinen bestehen und zu einer koronaren Herzkrankheit führen können. Atherosklerose ist die Bezeichnung für die Bildung dieser Plaques6. Arteriosklerose verlangsamt den Blutfluss durch die Venen zur Brust und anderen Organen. Sie steigt, wenn Sie an einer Herzerkrankung, Angina pectoris oder einem Schlaganfall leiden. Männer und Frauen können unterschiedliche Warnzeichen und Symptome einer koronaren Herzkrankheit haben. Beispielsweise haben Männer häufiger Brustschmerzen als Frauen. Zusätzlich zu Brustschmerzen leiden Frauen häufiger unter Atemnot, Übelkeit und plötzlicher Erschöpfung. Herzinsuffizienz, Engegefühl in der Brust, Druck in der Brust und Schmerzen in der Brust können allesamt Anzeichen einer koronaren Herzkrankheit sein7. Das System zur Vorhersage von Herzerkrankungen nutzt die Technik der Naive Bayes'schen Klassifikation, um bei der Entscheidungsfindung zu helfen. Durch die Analyse einer umfangreichen Datenbank vergangener Herzerkrankungen liefert das System wertvolle Erkenntnisse. Dieses Modell ist äußerst effizient bei der Identifizierung von Patienten mit einem Risiko für Herzerkrankungen. Es verfügt über die Fähigkeit, auf komplexe Anfragen zu reagieren und zeigt seine Stärken in Bezug auf Interpretierbarkeit, Zugang zu umfassenden Informationen und Genauigkeit8. Im medizinischen Bereich, insbesondere bei der Behandlung von Patienten, ist es von entscheidender Bedeutung, genaue und zeitnahe Entscheidungen zu treffen. Techniken des maschinellen Lernens (ML) spielen eine wichtige Rolle bei der Vorhersage von Krankheiten, indem sie die umfangreichen Daten nutzen, die von der Gesundheitsbranche generiert werden. In Indien sind Herzerkrankungen eine der häufigsten Todesursachen, und die Weltgesundheitsorganisation (WHO) betont die Bedeutung einer rechtzeitigen Intervention zur Vorhersage und Prävention von Schlaganfällen. Dieser Artikel konzentriert sich auf die Vorhersage von Herz-Kreislauf-Erkrankungen mit erhöhter Genauigkeit durch den Einsatz von ML-Techniken wie Decision Tree und Naive Bayes in Verbindung mit Risikofaktoren. Der in dieser Studie verwendete Datensatz ist der Herzinsuffizienz-Datensatz, der 13 Attribute9 umfasst. Der Autor untersuchte, wie gut zwei Algorithmen, Support Vector Machine (SVM) und Naive Bayes, das Auftreten von Herzerkrankungen und den Überlebensstatus von Patienten vorhersagen konnten. Die Algorithmen wurden auf einen Datensatz angewendet, der sechzehn Attribute vom Center for Machine Learning and Intelligent Systems der University of California, Irvine, enthielt. Um die Leistung der Modelle zu bewerten, wurde eine Verwirrungsmatrix verwendet, um Metriken wie Genauigkeit, Rückruf, Präzision und Fehler zu visualisieren. Darüber hinaus wurde eine statistische Analyse durchgeführt, indem die ROC-Kurve (Receiver Operating Characteristic) verwendet und die Fläche unter der Kurve berechnet wurde, um die Genauigkeit der Modelle zu demonstrieren10. In dieser Forschungsarbeit wird ein System vorgestellt, das ein neuronales Netzwerk mit radialer Basisfunktion verwendet, um acht verschiedene Arten von Herzrhythmusstörungen genau vorherzusagen. Der Hauptschwerpunkt der Studie liegt auf der Analyse von Herzfrequenz-Zeitreihendaten, und der vorgeschlagene Algorithmus ist speziell darauf ausgelegt, bestimmte Arrhythmien vorherzusagen, nämlich Linksschenkelblock, Vorhofflimmern, normaler Sinusrhythmus, Rechtsschenkelblock, Sinusbradykardie, Vorhof Flattern, vorzeitige ventrikuläre Kontraktion und Block zweiten Grades. Die in der Studie verwendeten Herzfrequenz-Zeitreihendaten stammen aus der Arrhythmie-Datenbank des MIT-BIH. Aus der Herzfrequenz-Zeitreihe jeder einzelnen Arrhythmie werden sowohl lineare als auch nichtlineare Merkmale extrahiert. Das Training des radialen Basisfunktions-Neuronalen Netzwerks (RBFN) wird mit 70 % der Merkmalsdatensätze durchgeführt, während die restlichen 30 % der Vorhersage des Auftretens der acht Herzerkrankungen gewidmet sind. Der vorgeschlagene Ansatz weist eine beeindruckende Gesamtvorhersagegenauigkeit von 96,33 % auf und übertrifft damit die Leistung bestehender, in der Literatur dokumentierter Methoden11. Für die Klassifizierung von Herzerkrankungen mithilfe klinischer Datenbanken wird eine neuartige Methode namens Radial Basis Classification eingeführt. Herkömmliche Klassifikatoren, die mehrere Attribute umfassen, verfügen in der Regel über eine große Anzahl von Parametern, was es schwierig macht, die idealen Attribute zu bestimmen. Um dieses Problem anzugehen, wird das Konzept der Multivariate Function Classifier Ideas vorgeschlagen, das darauf abzielt, einen kohärenteren stochastischen Trend zu fördern und die Wahrscheinlichkeit von Fehlern oder unvorhergesehenen Ergebnissen zu minimieren. Diese Formel erweist sich als nützlich für die Anordnung mehrdimensionaler Daten und die Verbesserung der Gruppierungsgenauigkeit in der Analysephase. Die Ergebnisse der Studie deuten darauf hin, dass die vorgeschlagene Berechnungsmethode im Vergleich zu früheren Ansätzen eine höhere Präzision bietet12. Das Backpropagation-Neuronale Netzwerk hat eine zufriedenstellende Leistung bei der Vorhersagegenauigkeit gezeigt. Um jedoch die Genauigkeit weiter zu verbessern und die spezifische Art der Herzerkrankung zu bestimmen, integriert das Papier die CBR-Technik mit dem ANN. Durch die Nutzung historischer Patientenakten wird eine Genauigkeit von 97 % erreicht. Diese Forschung nutzt CBR nicht nur zur Verbesserung der Genauigkeit, sondern auch zur Vorhersage der Art der Herzerkrankung. Die CBR-Ausgabe umfasst sowohl die identifizierte Art der Herzerkrankung als auch die empfohlene Medikation. Dies ermöglicht einen Vergleich zwischen der Originalmedikation und der von der RBF (Radial Basis Function) vorgeschlagenen Medikation. Die mit diesem Ansatz verschriebenen Medikamente weisen eine vergleichbare Genauigkeit von 98 % auf13. Zu den Symptomen gehören Atembeschwerden, Schmerzen im oberen Rücken, Nacken, Kiefer oder Rachen sowie Schmerzen, Taubheitsgefühl, Schwäche oder ein Frösteln in den Gliedmaßen. Aufgrund der Verengung der Blutgefäße in bestimmten Teilen des Körpers kann es sein, dass Sie an einer koronaren Herzkrankheit leiden und dies erst bemerken, wenn Sie einen Herzinfarkt, eine Angina pectoris, einen Schlaganfall oder eine Herzinsuffizienz erleiden. Achten Sie auf Anzeichen von Herzproblemen und sprechen Sie mit Ihrem Arzt, wenn Sie sich Sorgen machen. Wenn Sie sich häufig untersuchen lassen, können Herzerkrankungen (Herz-Kreislauf-Erkrankungen) früher erkannt werden14. Diese vorgeschlagene Methode verwendet überwachte ML-Klassifikatoren, um zu zeigen, wie verschiedene Modelle das Vorhandensein von Herz-Kreislauf-Erkrankungen vorhersagen und die Leistung dieser Klassifikatoren bewerten können, wie z. B. Random Forest, Entscheidungsbaum, Support Vector Machine, XGBoost, radiale Basisfunktion, k-Nearest Neighbor , naive Bayes und lernende Vektorquantisierung.

Das Ziel der Vorhersage kardiovaskulärer Herzerkrankungen besteht darin, genaue und zuverlässige Modelle zu entwickeln, die das Risiko einer Person für die Entwicklung verschiedener Herz-Kreislauf-Erkrankungen einschätzen können, um eine frühzeitige Intervention, eine personalisierte Behandlung und letztendlich eine Verringerung der Belastung der öffentlichen Gesundheit durch Herzerkrankungen zu ermöglichen.

Die weiteren Abschnitte der Arbeit sind wie folgt aufgebaut: Der Abschnitt „Literaturübersicht“ bietet einen umfassenden Überblick über die relevante Literatur. Im Abschnitt „Vorgeschlagene Methodik“ wird die vorgeschlagene Methodik im Detail vorgestellt. Die experimentellen Ergebnisse werden im Abschnitt „Experimentelle Ergebnisse und Diskussion“ analysiert und diskutiert. Abschnitt „Schlussfolgerung“ präsentiert die Schlussfolgerung der Studie, während Abschnitt „Zukünftige Arbeit“ zukünftige Arbeiten und mögliche Forschungsrichtungen skizziert.

Die Herzfrequenzvariabilität (HRV) hat sich als zuverlässiger Prädiktor für Herzinsuffizienz (CHF) herausgestellt. Es bestehen jedoch weiterhin Herausforderungen bei der effektiven Extraktion zeitlicher Merkmale und der effizienten Klassifizierung hochdimensionaler HRV-Darstellungen. Um diese Herausforderungen anzugehen, schlägt diese Studie eine Ensemble-Methode vor, die kurzfristige HRV-Daten und tiefe neuronale Netze zur CHF-Erkennung nutzt. Die Forschung umfasst fünf öffentlich zugängliche Datenbanken: BIDMC-CHF-Datenbank (BIDMC-CHF), CHF-RR-Intervalldatenbank (CHF-RR), MIT-BIH-Datenbank für normale Sinusrhythmen (NSR), Fantasia-Datenbank (FD) und NSR-RR-Intervalldatenbank ( NSR-RR). Zur Bewertung der vorgeschlagenen Methode werden drei verschiedene Längen von RR-Segmenten (N = 500, 1000 und 2000) verwendet. Zunächst werden Expertenmerkmale aus den RR-Intervallen (RRIs) extrahiert. Anschließend wird ein Netzwerk basierend auf Faltungs-Neuronalen Netzwerken mit Langzeitgedächtnis aufgebaut, um automatisch Deep-Learning-Funktionen (DL) zu extrahieren. Schließlich wird ein Ensemble-Klassifikator verwendet, um CHF anhand der oben genannten Merkmale zu erkennen. Die Blindvalidierung wird an drei CHF-Probanden und drei normalen Probanden durchgeführt, was zu Genauigkeiten von 99,85 %, 99,41 % und 99,17 % für RRIs mit den Längen N = 500, 1000 bzw. 2000 unter Verwendung von BIDMC-CHF, NSR und FD führt Datenbanken15. In dieser Veröffentlichung gibt es eine Zusammenfassung früherer Studien und eine Analyse, wie gut der Algorithmus funktioniert. Bevor verschiedene Algorithmen trainiert und getestet werden, verarbeitet die vorgeschlagene Architektur die zuerst eingehenden Daten. Der Autor empfiehlt die Verwendung von Adaboost, da dadurch jede ML-Methode besser aussieht. Der Autor stimmte außerdem zu, dass die Einstellungen feinabgestimmt werden könnten, um die Genauigkeit zu verbessern. Forscher entwickelten eine Deep-Learning-Strategie zur Analyse und Erkennung von Herzerkrankungen mithilfe des UCI-Datensatzes. Sie fuhren fort, dass tiefe neuronale Netze dazu beitragen könnten, die Analyse und Diagnose von Herz-Kreislauf-Erkrankungen insgesamt zu verbessern. Im Vergleich zu anderen Möglichkeiten zur Verbesserung der Modellleistung stellten sie fest, dass der Talos Hyper-Prozess am besten funktionierte16. Die KNN-, RF-, SVM- und DT-Algorithmen wurden als ML-Modelle zur Vorhersage von Herzerkrankungen mit hoher Genauigkeit, hohem Recall und hoher Präzision untersucht. Wie aus ihrer Schätzmethode für Herzerkrankungen hervorgeht, die in der UCI ML-Bibliothek gehostet wird, war die SVM-basierte Kategorisierung die genaueste. Wir haben uns die Ergebnisse von vier maschinellen Lerntechniken und einem neuronalen Netzwerk (NN) zur Erkennung von Herzerkrankungen angesehen. In dieser Studie wurden Algorithmen zur Vorhersage der Herzdosis auf der Grundlage von Faktoren wie Zuverlässigkeit, Erinnerung, Genauigkeit und F1 verglichen. Der Deep NN-Algorithmus konnte Herzprobleme in 98 % der Fälle erkennen. Um zu zeigen, dass der Algorithmus für die Vorhersage von Krankheiten nützlich ist, konzentrierten sie sich darauf, wie er mit einem medizinischen Datensatz verwendet werden könnte. Die Forscher kamen zu dem Schluss, dass Boosting und Bagging gute Möglichkeiten sind, die Leistung von Klassifikatoren zu verbessern, die das Risiko von Herzerkrankungen nicht sehr gut vorhersagen können. Die Ergebnisse zeigten, dass die Genauigkeit der Vorhersagen nach der Verwendung der Merkmalsauswahl erheblich zunahm, was das Verfahren verbesserte17. Ensemble-Ansätze wurden verwendet, um die Genauigkeit schlechter Klassifikatoren um nicht mehr als 7 % zu verbessern. In den letzten Jahren haben ML-Algorithmen viel Lob dafür erhalten, wie genau und nützlich sie bei der Erstellung von Vorhersagen geworden sind. Es ist von entscheidender Bedeutung, Modelle mit größtmöglicher Genauigkeit und Effizienz erstellen und empfehlen zu können18. Da Hybridmodelle viele ML-Techniken und Datensysteme verwenden, können sie möglicherweise Gesundheitsprobleme genau vorhersagen. Weedy-Klassifizierer funktionierten besser, wenn sie Absacken und Boosten verwendeten, und ihre Fähigkeit, das Risiko von Herz-Kreislauf-Erkrankungen vorherzusagen, wurde gut bewertet, wenn sie zusammenarbeiteten. Sie erstellten das Hybridmodell unter Verwendung der Mehrheitsabstimmung mit den Klassifikatoren Bayes Net, NB, C4.5, MLP und RF19. Mit 85,48 Prozent der Fälle stimmt das erstellte Modell. Zusätzlich zu Lernmodellen wurde der UCI-Datensatz zu Herz-Kreislauf-Erkrankungen kürzlich mit ML-Methoden wie RF und SVM verwendet. Die Genauigkeit stieg, als viele Klassifikatoren zum abstimmungsbasierten Modell hinzugefügt wurden20. Basierend auf den Daten führte die Verwendung der schwachen Klassifikatoren zu einer Steigerung der Genauigkeit um 2,1 %. Wir haben ML-Klassifizierungsmethoden verwendet, um herauszufinden, wie es Menschen mit Langzeiterkrankungen ergehen würde. Sie fanden heraus, dass der Hoeffding-Klassifikator eine Koronarerkrankung mit einer Genauigkeit von 88,56 Prozent vorhersagen kann. Insgesamt stellten sie fest, dass das Hybridmodell bei Verwendung mit den gewünschten Funktionen eine Genauigkeit von 87,41 % aufwies. Wir haben ein SVM-Modell und die Fisher-Score-Methode verwendet, um Merkmale basierend auf dem Mittelwert auszuwählen21.

Wir haben viele verschiedene Klassifizierungsmethoden und Funktionssätze verwendet, um dieses einzigartige Vorhersagemodell zu erstellen. Das vorgeschlagene HRFLM nutzte ein ANN mit einem tiefen Netzwerk und 13 klinischen Merkmalen als Eingaben. Auch Data-Mining-Techniken wie DT, SVM, NN und KNN wurden untersucht. Forscher haben herausgefunden, dass es hilfreich ist, SVM zu verwenden, um vorherzusagen, wer krank werden wird. Es gab eine neue Methode namens „Vote“ und es wurde über eine Hybridmethode gesprochen, die LR und NB kombiniert. Die HRFLM-Strategie erwies sich als 88,7 % effektiv22. Wir konnten ein Modell zur Vorhersage des Todes durch Herzversagen erstellen, das ein breiteres Spektrum an Risikofaktoren berücksichtigt, indem wir den zufälligen Überlebenswald verbesserten23. Das IRSF verwendete ein Split-Kriterium und ein Stopp-Kriterium, die auf diesem Gebiet neu waren, um den Unterschied zwischen Überlebenden und Menschen, die es nicht geschafft haben, zu erkennen. Data Mining wurde auch eingesetzt, um herauszufinden, ob jemand an einer Herz-Kreislauf-Erkrankung leidet24. Herzerkrankungen werden immer noch mithilfe von Bayesian-, DT-Klassifikatoren, NN-, Assoziationsgesetz-, KNN-, SVM- und ML-Algorithmen diagnostiziert. SVM hatte in 99,3 % der Fälle Recht. Es wurden mehrere auf maschinellem Lernen basierende Klassifikatoren entwickelt, um vorherzusagen, wie lange ein Patient leben wird25. Merkmale, die mit den wichtigsten Risikofaktoren in Zusammenhang standen, wurden bewertet und die Ergebnisse mit herkömmlichen biostatistischen Tests verglichen. Die Forscher kamen zu dem Schluss, dass der Serumkreatininspiegel und die Ejektionsfraktion die beiden wichtigsten Faktoren sind, die es zu beachten gilt, wenn man versucht, genaue Vorhersagen zu treffen26. Der ML-Algorithmus wurde verwendet, um ein Modell zur Erkennung von CVD zu erstellen. In dieser Studie haben wir die Daten auf vier verschiedene Arten bereinigt und untersucht. Die DT- und RF-Methoden erreichten eine Genauigkeit von 99,83 %, während die SVM- und KNN-Methoden nur Genauigkeitsraten von 85,32 % bzw. 84,49 % erreichten. Eine weitere Studie nutzte die Ensemble-Methode, um CHF vorherzusagen, indem sie die HRV betrachtete und tiefe neuronale Netze nutzte, um Wissenslücken in nicht zusammenhängenden Bereichen zu schließen. Insgesamt war die vorgeschlagene Methode zu 99,85 % richtig. In einer aktuellen Veröffentlichung27 wurden verschiedene Arten von Daten verwendet, um einen nachrichtendienstlichen Rahmen zu erstellen. Dabei handelte es sich um Hauptkomponentenanalysen und RF-basierte MLA. Die FAMD wurde auf RF angewendet, um die relevanten Eigenschaften zu bewerten und Krankheiten vorherzusagen. Die vorgeschlagene Methode ist in 93,44 % der Fälle korrekt, in 89,28 % der Fälle empfindlich und in 96,74 % der Fälle spezifisch. Um ihre Theorie zu testen, verwendeten die Autoren eine Reihe von 303 Fällen, die durch Ergänzung des Cleveland-Datensatzes erstellt wurden. In Tests schnitt der vorgeschlagene DT-Algorithmus um 75,5 % besser ab als der Basisalgorithmus. Herzerkrankungen werden oft als „Herz-Kreislauf-Erkrankungen“28 bezeichnet. Mehrere Forscher versuchen, es einfacher zu machen, festzustellen, ob jemand an einer Herzerkrankung leidet. Ihre Forschung zu Herzerkrankungen deckt ein weites Feld ab. Der Autor verwendete Daten aus den ungarischen und Statlog-Sätzen, um CVD mithilfe des Reduced Error Pruning Tree (REP-Baums), R-Baums, M5P-Baums, logistischer Regression (LR), J48, Naive Bayes (NB) und JRIP zu klassifizieren. Menschen verwenden Random Forest (RF), Entscheidungsbaum (DT) und lineare Regression (LR). Es werden Support Vector Machine (SVM), CART, lineare Diskriminanzanalyse (LDA), Gradient Boosting (XGB) und Random Forest (RF) verwendet29. Ziel dieser Studie ist es, herauszufinden, wie wahrscheinlich es ist, dass jemand an einer Herzerkrankung erkrankt. Die Ergebnisse zeigen, dass SVM besser abschneidet als LR, da es eine Genauigkeit von 96 % erreicht, während LR nur eine Genauigkeit von 92 % erreicht. Der Autor sagt, dass das DT-Modell immer besser abschneidet als das NB-Modell und das SVM-Modell. Im Vergleich zu DT, SVM, NB und k-Nearest Neighbor (KNN) hat sich gezeigt, dass SVM eine Genauigkeit von 87 % hat, DT eine Genauigkeit von 90 % und LR die genaueste Vorhersage, wann eine Herzerkrankung auftreten wird. Tabelle 1 zeigt den Gesamtvergleich der Leistungsmetriken modernster Methoden.

Die RF-basierte Methode ist bei der Vorhersage angeborener Herzerkrankungen zu 97 % genau, mit einer Spezifität von 88 % und einer Sensitivität von 85 %. Mithilfe von LR, MARS, EVF und CART-ML konnten sie CVD mit einer Genauigkeit von 94 %, einer Spezifität von 95 % und einer Sensitivität von 93 % feststellen. RF wurde verwendet, um Wirkstoffziele bei Wirt-Wirt- und Wirt-Pathogen-Wechselwirkungen im Zusammenhang mit durch Mikroorganismen verursachten Herz-Kreislauf-Erkrankungen vorherzusagen. Zur Lösung des Problems der Vorhersage von Herzerkrankungen wurden mehrere Ensembles und Hybriddarstellungen vorgeschlagen. Basierend auf der vorgeschlagenen Methode30 werden CVD vom Mendeley Institute, die Cleveland-Datensätze und der IEEE-Port alle mit einem hohen Maß an Genauigkeit verarbeitet (96 %, 88,24 % bzw. 93 %). Der Autor hat die LR- und RF-Algorithmen zur Vorhersage von Herzerkrankungen zusammengestellt und eine Genauigkeit von 88,7 % erreicht. In dieser Studie wollen Forscher mehr darüber herausfinden, wie Kalzium in den Herzkranzgefäßen und Plaque in den Halsschlagadern zusammenhängen. Beide sind mit einem höheren Risiko für Herzerkrankungen verbunden, verursachen jedoch möglicherweise noch keine Symptome. Maschinelles Lernen und das Internet der Dinge werden derzeit häufig zur Vorhersage und Diagnose von Krankheiten eingesetzt. Mit Hilfe mobiler Geräte und der Deep-Learning-Methode konnte der Autor Herzprobleme in 94 % der Fälle vorhersagen. Der Autor nutzt Klassifikatoren für maschinelles Lernen und das Internet der Dinge, um Herzinfektionen vorherzusagen, bevor sie auftreten31. Letztendlich wollen wir zeigen, dass ML ein guter Weg sein könnte, das vorliegende Problem zu lösen. Wir können ML verwenden, um Fälle im Zusammenhang mit Krankheiten und Gesundheitsproblemen zu untersuchen, indem wir Hunderte von Gesundheitsdatensätzen betrachten. Forscher haben an anspruchsvoller Computerwahrnehmung für eine zuverlässige Gesundheitsversorgung gearbeitet, um herauszufinden, wie maschinelle Bildverarbeitungspraktiken menschliche Bedürfnisse wie psychosoziale Gesundheit, bestimmte Bewegungen, durch Exposition verursachte Müdigkeit, häufiges Ansehen von Live-Aktionen, Bildanalyse, Deep Learning, Musterklassifizierung usw. unterstützen. und wie Sprachverständnis und Computeranimation mit Robotik funktionieren32. Die Autoren bemerkten und schrieben darüber, wie Benutzer scharfe Schnittstellen und Virtual-Reality-Tools kennenlernen, was zur Entwicklung komplexer Wiederherstellungssysteme führt, die menschliche Aktivitäten ausführen und diese erkennen können. Die Arbeit unterstützt die direkte Methode des maschinellen Sehens im Gesundheitswesen. Dazu gehören die Technologie hinter intelligenten Rollstühlen, mögliche Hilfe für Sehbehinderte und andere Objektverfolgungslösungen, die in letzter Zeit zur Überwachung von Gesundheit und Sicherheit eingesetzt werden33. Wissenschaftler nutzten Support-Vektor-Maschinen, generalisierte Boosting-Maschinen, logistische Regression, Light-Boosting-Maschinen und Random Forests, um zu ermitteln, wie wahrscheinlich es ist, dass jemand an einer Herz-Kreislauf-Erkrankung erkrankt. RF war der beste Weg, um vorherzusagen, wer eine Herzerkrankung bekommen würde. In 88 % der Fälle war es richtig. Unsere Methode wird der aktuellen Studie gegenübergestellt. Dies ist die erste und einzige Studie, die die Genauigkeit von sieben verschiedenen ML-Klassifikatoren zur Vorhersage von Herz-Kreislauf-Erkrankungen vergleicht. Zu diesen Methoden gehören die modernsten Methoden wie die lernende Vektorquantisierung, neuronale RBF-Netze und die logistische Regression. Somit ist es nun möglich, ein System zu verwenden, das sowohl genau als auch nützlich für die Vorhersage von Herzproblemen ist. Außerdem empfehlen wir die Verwendung des besten Klassifikators für maschinelles Lernen, wenn intelligente Systeme zur Vorhersage von CHD34 erstellt werden. Zu den Hauptmerkmalen von Herz-Kreislauf-Erkrankungen gehören eine hohe Morbidität, Behinderung und Tod, und die Ätiologie von Herzerkrankungen bleibt weltweit ein ungelöstes Problem. Daher ist eine genaue frühzeitige Vorhersage der erwarteten Ergebnisse bei Personen mit Herzerkrankungen erforderlich. In dieser Arbeit verwendeten wir ML-Modellierung, um Herzerkrankungen vorherzusagen. Diese Studie konzentriert sich auf die Vorhersage von Herzerkrankungen mithilfe von ML-Klassifikatoren. Die Autoren befassen sich zunächst mit dem Problem des Datensatzes und verbessern und standardisieren ihn anschließend für die Tokenisierung und die Konvertierung in Kleinbuchstaben. Die Datensätze wurden dann verwendet, um die Klassifikatoren zu trainieren und zu testen und ihre Leistung zu bewerten, um ein Höchstmaß an Genauigkeit zu erreichen. Diese Algorithmen müssen strenge Zulassungskriterien erfüllen, darunter Modernität, Repräsentativität und hohe Reife. Zuvor verwendeten wir Naive Bayes und Radialbasisfunktionen, indem wir die Arbeiten früherer Forscher untersuchten. Wir untersuchten, ob diese Ansätze von früheren Forschern auf den UCI-Herzdatensatz angewendet wurden.

Die vorgeschlagenen Arbeitsbeiträge:

Die Autoren diskutieren zunächst Datensätze, die anschließend standardisiert und erweitert werden. Diese Datensätze werden dann verwendet, um mehrere Klassifikatoren zu trainieren und zu testen, um den Klassifikator mit der höchsten Genauigkeit zu ermitteln.

Anschließend nutzen die Autoren die Korrelationsmatrix, um die optimalen Werte oder Merkmale zu klassifizieren.

Im dritten Schritt werden die ML-Klassifikatoren auf den vorverarbeiteten Datensatz angewendet, wobei durch Parameteränderungen die höchstmögliche Genauigkeit angestrebt wird.

Im vierten und letzten Schritt werden die vorgeschlagenen Klassifikatoren auf Genauigkeit, Präzision (Spezifität), Erinnerung (Sensitivität) und F-Maß bewertet.

Letztendlich übertreffen die vorgeschlagenen Klassifikatoren die in Tabelle 1 dargestellten hochmodernen Klassifikatoren hinsichtlich der Genauigkeit.

Mithilfe des Herzdatensatzes verwendeten wir ML-Klassifikatoren, um das Vorliegen einer koronaren Herzkrankheit vorherzusagen. Der Datensatz wurde aus dem UCI-Repository abgerufen und vor der Auswahl der Features wurde Feature Engineering zur Datenvorverarbeitung angewendet. Anschließend haben wir es in Trainings- und Testdatensätze aufgeteilt und dabei etwa 70 % der Gesamtdaten für das Training und den restlichen Teil für Tests verwendet. Der Trainingsdatensatz wird verwendet, um ein Modell zu erstellen, das Herzerkrankungen vorhersagt, während der Testdatensatz zur Bewertung der Klassifikatoren verwendet wird. Vor der Umwandlung kategorialer Variablen in numerische Werte zur Klassifizierung wurde eine gründliche Datensatzanalyse durchgeführt. Der Datensatz wurde in Schritt 1 als „normal“ und „erkrankt“ gekennzeichnet. Die Bezeichnung „erkrankt“ weist auf das Vorliegen einer Herzerkrankung hin, während die Bezeichnung „normal“ auf das Fehlen einer Herzerkrankung hinweist. In Schritt 2 wurde während der Trainingsphase eine Datenbereinigung durchgeführt. Die Datenvorverarbeitung umfasste die Behandlung fehlender Werte durch die Berechnung des Mittelwerts aufgrund des Vorhandenseins von Teil- und fehlenden Werten. Schritt 3 umfasste die Datenvisualisierung mithilfe der explorativen Datenanalyse (EDA), um Beziehungen zwischen verschiedenen Attributen zu untersuchen. Insbesondere haben wir festgestellt, dass die Korrelation für FBS relativ gering ist. In Schritt 4 wurden ML-Klassifikatoren auf den vorverarbeiteten Datensatz angewendet und die Leistung der Klassifikatoren anhand verschiedener Parameter bewertet. Wie bereits erwähnt, wurde der Datensatz in Test- und Trainingssätze aufgeteilt, um die Klassifikatoren zu bewerten und das Modell zu entwickeln. Die verwendeten Klassifikatoren zeigten unterschiedliche Genauigkeitsgrade bei der Erkennung des Vorliegens einer Herzerkrankung. Abbildung 1 veranschaulicht die Phasen unseres vorgeschlagenen Arbeitsansatzes.

Vorgeschlagener Überblick über den Systembetrieb.

Wir haben die öffentlich verfügbaren Datensätze zu Herz-Kreislauf-Erkrankungen aus der UCI-Datenbank verwendet. Insgesamt gibt es 503 Fälle mit multivariaten Merkmalen, die durch 10 Attribute und einen Bereich von Ganzzahl-, Kategorie- und Realwerten dargestellt werden. Der Datensatz ist in Tabelle 2 beschrieben. Datenbank: https://archive.ics.uci.edu/ml/datasets/heart+disease.

Mithilfe des Herzdatensatzes und ML-Klassifikatoren konnten wir genaue Vorhersagen über das Vorliegen einer koronaren Herzkrankheit treffen. Der Datensatz wurde aus dem UCI-Repository abgerufen, und zuvor durchgeführtes Material wurde durchgeführt, bevor das Feature-Engineering zur Auswahl der Features verwendet wurde. Anschließend teilen wir es in zwei Teile auf, einen für das Training und einen für Tests, wobei ersterer typischerweise 75 % der Gesamtdaten und letzterer den Rest enthält. Der Trainingsdatensatz wird verwendet, um Vorhersagen über Herz-Kreislauf-Erkrankungen zu treffen, während die Testinformationen zur Bewertung von Klassifikatoren verwendet werden. Bevor wir kategoriale Variablen zur Klassifizierung in quantitative Daten umwandeln, analysieren wir zunächst den Datensatz.

Phase 1: Der Datensatz wurde mit den Bezeichnungen „normal“ und „abnormal“ versehen. Sowohl die Kennzeichnung „gesund“ als auch „krank“ weisen darauf hin, dass die jeweilige Person keine Herzprobleme hat. Phase 2: Wir haben die Daten etwas aufgeräumt. Aufgrund der unvollständigen und fehlenden Daten im Datensatz haben wir die verbleibenden Werte gemittelt, um die Phase abzuschließen. Phase 3: Wir verwendeten eine explorative Datenanalyse, um die Daten zu visualisieren und nach Mustern in den Beziehungen zwischen Variablen zu suchen. Unsere Forschung zeigte, dass der Zusammenhang zwischen FBS und allem anderen recht bescheiden war. Phase 4: Als nächstes untersuchten wir die Leistung der ML-Klassifikatoren am vorverarbeiteten Datensatz anhand verschiedener Metriken. Wie bereits erwähnt, wird der Datensatz häufig in Test- und Trainingssätze unterteilt, wobei ersterer zur Bewertung der Wirksamkeit der Klassifikatoren und letzterer zur Schulung des Modells verwendet wird. Klassifikatoren zur Vorhersage der Herzgesundheit sind unterschiedlich erfolgreich. Abbildung 1 zeigt die Phasen unserer vorgeschlagenen Arbeitsmethode.

Die lernende Vektorquantisierung ist ein Netzwerk, das auf Wettbewerb basiert und überwachtes Lernen verwendet. Wir könnten sagen, dass es sich um eine Methode zur Organisation von Mustern in Gruppen handelt, bei der jede Übertragungsfunktion eine Gruppe ist. Durch die Verwendung eines Lernalgorithmus erhält das System eine Sammlung von Lernmustern mit erkannten Klassifizierungen und einer vorläufigen Zuordnung der Ausgabevariablen. Nachdem das Training abgeschlossen ist, kategorisiert LVQ einen Eingabevektor, indem es ihn in dieselbe Klasse wie den Ausgabekanal einordnet. Die Architektur von LVQ ist in der folgenden Abbildung 2 dargestellt. Wie wir sehen können, dienen „n“ Einheiten als Eingabe und „m“ Einheiten als Ausgabe. Die Schichten sind vollständig miteinander verbunden und mit Gewichten versehen. Die folgenden jeweiligen Parameter wurden für LVQ-Trainingsoperationen zur kardiovaskulären Klassifizierung verwendet:

Lernen der Vektorquantisierungsarchitektur für die kardiovaskuläre Klassifizierung.

Schritt 1: Starten.

Schritt 2: Initialisierung des Referenzvektors basierend auf den Trainingsvektoren und bezeichnet „m“ als Clusterzahlen und kann als Gewichtsvektor verwendet werden. Die restlichen Vektoren werden für den Trainingsmodus zugewiesen.

Schritt 3: Zufällige Zuweisung der anfänglichen Klassifizierung und der entsprechenden Gewichte.

Schritt 4: Initialisieren der K-Means-Clustering-Technik.

Schritt 5: Der Referenzvektor β wird zugewiesen.

Schritt 6: Berechnen des Quadrats des euklidischen Abstands für i und j (1-zu-m bzw. 1-zu-n).

Schritt 7: Berechnen und Erreichen der Erhöhungseinheit J, wobei ED lokal minimal ist.

Schritt 8: Berechnen Sie das Anfangsgewicht der Aufzuchteinheit anhand der relativen Bedingungen.

Schritt 9: Verringern Sie die β-Lernrate.

Schritt 10: Leiten Sie die Stoppbedingung für den Test ein.

Schritt 11: Stoppen.

Freie Koronararterien, Koronararterien mit atheromatösen Läsionen und Koronararterien mit verringertem Blutfluss aufgrund einer Blockade werden alle durch die Koronararterienkontur dargestellt. Der Grad und die Richtung eines linearen Zusammenhangs zwischen zwei quantitativen Variablen können durch die Untersuchung ihrer Korrelation beschrieben werden. Tabelle 3 zeigt die Beziehungen zwischen den verschiedenen Spalten. Die meisten Spalten weisen eine gewisse Korrelation mit der Variablen „Anzahl“ auf, bei „BS-F“ jedoch nur sehr wenig.

Aus der Gl. (1) Korrelationskoeffizienten α zwischen einer erklärenden Variablen (y) und einer anderen (x) werden in dieser Formel (x) durch eine Zeichenfolge dargestellt. Der Wert von α1 gibt die Stärke der Beziehung zwischen Variablen (y) und unabhängigen Variablen (x) usw. an. Abbildung 3 zeigt eine Heatmap, eingebettet in eine Korrelationsmatrix. Eine Heatmap ist eine visuelle Darstellung der Beziehung zwischen unabhängigen Merkmalen und abhängigen Werten. Darüber hinaus wird deutlich, welche Merkmale den stärksten Bezug zur Variablen des Zusatzmerkmals haben. Das Endprodukt ist in Abb. 2 dargestellt. Um die Daten besser zu verstehen, werden wir nun die Charakteristik des Herz-Kreislauf-Erkrankungsdatensatzes gegen die Zahl auftragen. Statistische Grafiken und andere Formen der Datenvisualisierung sind gängige Werkzeuge in der explorativen Datenanalyse, mit der Datensätze untersucht werden, um ihre wichtigsten Merkmale zu identifizieren und zu beschreiben.

Heatmap-Korrelationsmatrix.

Gleichung (5): Die Gesamtkorrelation zwischen zwei Variablen in einer Stichprobenpopulation wird durch diese Gleichung angegeben. Dies wäre die Verbindung zwischen der unabhängigen Variablen und der abhängigen Variablen in der einfachen linearen Regression. Tabelle 4 veranschaulicht die kardiovaskuläre Analyse verschiedener Altersgruppen.

Von maximal 503 Krankheitsfällen haben wir festgestellt, dass 305 Personen an einer Herzerkrankung leiden. Bösartig wird durch 1 dargestellt, gutartig durch 0 und 198 der Gesamtzahl der Patienten gelten als gesund. Aus diesen Ergebnissen können wir schließen, dass 53,36 Prozent der Patienten Herzprobleme haben und 46,64 Prozent nicht. Wir haben uns auch andere Merkmale im Datensatz angesehen, darunter Geschlecht, Altersgruppe, Herzstatus, Blutdrucküberwachung, Fett und Rauchen. Diabetiker-Durchschnitt, das Elektrokardiogramm ergab den Pulsfrequenz-Spitzenwert für Angina pectoris und den veralteten Spitzenwert. Wie in Abb. 4 zu sehen ist, akzeptiert die Geschlechtseigenschaft zwei Werte: 0 für Frauen und 1 für Männer. Den Ergebnissen zufolge haben Frauen ein höheres Risiko, an Herz-Kreislauf-Erkrankungen zu erkranken als Männer. Abbildung 5 zeigt die Altersverteilung des Datensatzes und zeigt, dass das Risiko einer Herzerkrankung unabhängig von der Altersgruppe ist. Sowohl das Alter als auch der gewünschte Prozentsatz werden auf der x- bzw. y-Achse angezeigt. Beschwerden in der Brust kommen bei Menschen mit Herzerkrankungen häufig vor. Herz-Kreislauf-Patienten können Brustschmerzen verspüren. Allerdings kann der Brustschmerz in verschiedene Kategorien eingeteilt werden, wie z. B. nicht-anginöse, asymptomatische, untypische Angina pectoris und typische Angina pectoris. Abbildung 6 zeigt die verschiedenen Kategorien von Brustschmerzen, die auftreten können. Laut Abb. 6 besteht bei Patienten mit atypischer Angina pectoris möglicherweise das höchste Risiko für einen Herzstillstand. Der Blutzuckerspiegel während des Fastens (BS-F) kann keinen wesentlichen Einfluss auf die Entstehung von Herzerkrankungen haben.

Gesamtzahl der Patienten mit Herzerkrankungen.

Geschlechtskategorisierung basierend auf kardiovaskulären Möglichkeiten.

Altersgruppenstatistik Herz-Kreislauf.

Wir haben eine Analyse der Informationen durchgeführt, bei der der Wert 1 (wahr) dem Fall zugewiesen wird, in dem der Nüchternblutzuckerspiegel des Patienten mehr als 120 mg/dl beträgt, was darauf hinweist, dass bei ihm ein Risiko für die Erkrankung besteht; andernfalls wird dem Fall die Zahl 0 (falsch) zugewiesen, wie in Abb. 7 dargestellt. Den Ergebnissen zufolge ist an dieser Methode zur Vorhersage des Vorliegens einer Herzerkrankung nichts besonders Bemerkenswertes. Die Werte im Elektrokardiogramm liegen bei 0, 1 und 2. Die Ergebnisse zeigen, dass Menschen, deren EKG-Werte „1“ oder „0“ sind, ein erhöhtes Risiko für die Entwicklung einer Herzerkrankung haben im Vergleich zu Menschen, deren EKG-Werte „20“ sind, wie in Abb 8. Abbildung 9 zeigt die EKG-Analyse der kardiovaskulären Möglichkeit. Tabelle 5 stellt die verschiedenen Kategorien des kardiovaskulären Auftretens dar. Tabelle 6 zeigt die Wahrscheinlichkeit von Herz-Kreislauf-Erkrankungen, die sich aus der EKG-Untersuchung ergaben.

Verschiedene Herz-Kreislauf-Typen.

Möglichkeit einer Erkrankung während des Fastens.

Analyse des EKG der kardiovaskulären Möglichkeit.

Wie in Abb. 10 dargestellt, besteht bei Angina pectoris-Patienten ein deutlich geringeres Risiko, Herzprobleme zu entwickeln. Wenn der Wert für Trainingsangina pectoris 1 beträgt, deutet dies darauf hin, dass der Patient tatsächlich ein Herzproblem hat; Wenn der Wert hingegen 0 ist, bedeutet dies, dass der Patient kein Herzproblem hat und daher weniger wahrscheinlich Herzprobleme entwickelt.

Keine Auswirkung und Auswirkung des Ereignisses aufgrund von Übung.

In diesem Kapitel werden die Ergebnisse von ML-Klassifikatoren zu verschiedenen Bewertungsanforderungen wie Genauigkeit, Rückruf und F-Maß behandelt. Beispiele für diese Bewertungseinschränkungen sind: Darüber hinaus wird die Leistung von Klassifizierungsmodellen für maschinelles Lernen anhand des Datensatzes bewertet, der Informationen zu Herzerkrankungen enthält. k-NN schnitt nicht sehr gut ab, obwohl RBF, NB und LVQ im Vergleich zu ihrer Gesamtleistung besser abgeschnitten haben als die anderen Klassifikatoren. Wie in Tabelle 7 zu sehen ist, sind die wichtigsten Bewertungskriterien, die in dieser Studie zur Bewertung der Leistung des ML-Klassifikators berücksichtigt wurden, die Bewertungen von Sensitivität, Genauigkeit, Spezifität, Rückruf, Präzision und F-Maß. Infolgedessen werden die Spezifität und Sensitivität der Zielklasse berechnet, um die Genauigkeit zu bewerten, mit der die gegebene Methode voraussichtlich funktionieren wird. Die Raten „TP“ (echt positiv), „TN“ (wahr negativ), „FN“ (falsch negativ) und „FP“ (falsch positiv) werden verwendet, um die Genauigkeit, Präzision, den Rückruf und das F-Maß in ML zu berechnen . Diese Maßnahmen werden durch die Qualität der Daten bestimmt. Jede korrekte positive und korrekte negative Vorhersage wird weiter in korrekte positive und korrekte negative Vorhersagen unterteilt. Jedes Modell hat die TP-, TN-, FP- und FN-Ergebnisse korrekt vorhergesagt. Die Buchstaben TP stehen für sicked, also infiziert. FN ist eine Krankheit, von der nicht angenommen wird, dass sie mit einer Herz-Kreislauf-Erkrankung zusammenhängt. Die FP-Erkrankung wurde vorhergesagt, wurde aber noch nie beim Menschen beobachtet. In der Realität existiert TN nicht als Krankheit und es wird nicht erwartet, dass sich dies in absehbarer Zukunft ändern wird. Die Leistung von ML-Ansätzen im Hinblick auf die Genauigkeit ist in Tabelle 7 aufgeführt. Durch die Zuordnung der Leistungen dieser Klassifikatoren haben wir beobachtet, dass radiale Basisfunktionen, Naive Bayes und lernende Vektorquantisierung sowie ihre Verwandtschaft mit anderen ML-Klassifikatoren diese ausschlaggebend waren Modelle erreichen eine Genauigkeit von fast 90,06 %, 94,16 % bzw. 98,07 %, wie in Abb. 11 dargestellt.

Grafische Darstellung des Parametermetrikvergleichs von RF und LVQ.

Tabelle 7 und Abb. 11 veranschaulichen das Vergleichsergebnis der Parametermetrik (Präzision, Genauigkeit, Sensitivität, Spezifität, Rückruf und f-Maß) von Random Forest (RF) und Learning Vector Quantization (LVQ). Das Ergebnis zeigt, dass der LVQ eine bessere Ergebnisgenauigkeit von 98,78 % erzielte. Tabelle 8: Vergleichsergebnis der Parametermetrik (Präzision, Genauigkeit, Sensitivität, Spezifität, Rückruf und f-Maß) des Entscheidungsbaums (DT) und der Lernvektorquantisierung (LVQ).

Das Ergebnis zeigt, dass der LVQ eine bessere Ergebnisgenauigkeit von 98,78 % erzielte, und die grafische Darstellung ist in Abb. 10 dargestellt. Die Tabellen 9 und 10 veranschaulichen, dass das vorgeschlagene Systemergebnis besser ist als die XGBoost- und KNN-Methoden, und die grafische Darstellung ist dargestellt in Abb. 11 bzw. 12. Tabelle 11 zeigt das Vergleichsergebnis der Parametermetrik (Präzision, Genauigkeit, Sensitivität, Spezifität, Rückruf und f-Maß) der Support Vector Machine (DT) und der Learning Vector Quantization (LVQ). Anschließend zeigt Tabelle 12 den Vergleich der Leistungsmetrikparameter verschiedener Klassifikatoren wie DT, KNN, RF, SVM und XGBoost. Aus Tabelle 12 geht hervor, dass das vorgeschlagene System in allen Parametern bessere Ergebnisse erzielte (Pre 98,07 %, Acc 98,78 %, Se 97,91 %, Sp 97,1 %, Recall 95,31 % und Fm 97,89 %) als die anderen herkömmlichen Techniken. Abbildung 13 zeigt die grafische Darstellung des Parametermetrikvergleichs von XGBoost und LVQ. Abbildung 14 zeigt die grafische Darstellung des Parametermetrikvergleichs von KNN und LVQ.

Grafische Darstellung des Parametermetrikvergleichs von DT und LVQ.

Grafische Darstellung des Parametermetrikvergleichs von XGBoost und LVQ.

Grafische Darstellung des Parametermetrikvergleichs von KNN und LVQ.

Im Vergleich zu den anderen Klassifizierungstechniken lieferten die beiden entsprechenden Techniken, die radiale Basisfunktion und die Nave-Bayes-Technik, die besten Ergebnisse. Daher werden die entsprechenden Parameter ermittelt und mit dem in Tabelle 13 gezeigten vorgeschlagenen System verglichen. Das Ergebnis zeigt, dass die vorgeschlagenen Systemparameterergebnisse besser sind als diese beiden Ergebnisse, wie in Abb. 15 dargestellt. Abbildung 16 zeigt den Vergleich der vorgeschlagenen Methodenleistungsmetrikparameter der Klassifizierungsgenauigkeit. Abbildung 17 zeigt den Leistungsmetrikvergleich der RBF-, NB- und LVQ-Klassifikatoren. Die Betriebseigenschaften des Empfängers der lernenden Vektorquantisierung sind in Abb. 18 dargestellt.

Grafische Darstellung des Parametermetrikvergleichs von SVM und LVQ.

Klassifizierungsgenauigkeit – Vergleich der Leistungsmetrikparameter.

Vergleich der Leistungsmetriken von RBF-, NB- und LVQ-Klassifikatoren.

Lernen der Vektorquantisierung ROC.

In dieser Studie werden Klassifikatoren für maschinelles Lernen verwendet, um festzustellen, ob ein Patient Herzprobleme hat oder nicht. Der Datensatz wurde aus dem Repository der UCI entnommen. Nach der Datenerfassung durchlaufen sie Reinigungs- und Vorverarbeitungsschritte. Im Anschluss an diesen Schritt werden Modelle des maschinellen Lernens für die prädiktive Analyse verwendet. Wir haben das Potenzial dieser acht angewandten Methoden des maschinellen Lernens untersucht, um genaue Vorhersagen über Herzerkrankungen zu treffen. Die Einschlusskriterien für diese Algorithmen bestehen darin, dass sie ausgereift, repräsentativ und auf dem neuesten Stand der Technik in ihrem jeweiligen Bereich sind. Wir haben zuvor die neuronalen Netze Naive Bayes und RBF verwendet, andere Wissenschaftler haben sie jedoch nicht für den UCI-Datensatz zu Herz-Kreislauf-Erkrankungen verwendet. Dadurch haben wir ein höheres Maß an Genauigkeit erreicht als sie, wie aus der Tabelle mit dem Titel „Stand der Technik“ hervorgeht, in der unsere Ergebnisse mit denen anderer Forscher verglichen werden. Die endgültigen Ergebnisse zeigen, dass die neuronalen Netzwerke Naive Bayes und RBF beim Einsatz der lernenden Maschinenklassifikatoren eine Genauigkeit von 94,78 % erreichten, wenn sie versuchten, das Vorliegen einer koronaren Herz-Kreislauf-Erkrankung vorherzusagen. Allerdings erreichte die Learning Vector Quantization-Methode die höchste Kategorisierungsgenauigkeit von 98,78 %, mit einer Spezifität von 97,1 % und einer Sensitivität von 97,91 %, einer Präzision von 98,07 % und 95,31 % und 97,89 % F1score- bzw. F-Measure-Werten.

Ziel unserer Forschung ist es, die Zuverlässigkeit unserer Schlussfolgerungen in Zukunft durch die Einbeziehung zusätzlicher Datensätze weiter zu erhöhen. Wir werden den Einsatz metaheuristischer Techniken und von der Natur inspirierter Algorithmen untersuchen, um die Parameter von Klassifikatoren für maschinelles Lernen und Deep-Learning-Methoden zu optimieren. Dieser Optimierungsprozess wird es uns ermöglichen, das Vorhandensein von Herzerkrankungen in verschiedenen Datensätzen zu Herzerkrankungen effektiver zu bewerten. Darüber hinaus werden wir uns darauf konzentrieren, die Genauigkeit bestehender Algorithmen zu verbessern, um ihre Leistung bei der Erkennung von Herzerkrankungen zu verbessern. Durch die Nutzung dieser Fortschritte wollen wir robustere und genauere Methoden für die Diagnose und Bewertung von Herzerkrankungen bereitstellen.

Verwendete öffentlich verfügbare Datenbank und keine menschlichen Daten/Proben in der Studie“ https://archive.ics.uci.edu/ml/datasets/heart+disease.

Gour, S., Panwar, P., Dwivedi, D. & Mali, C. Ein maschineller Lernansatz zur Herzinfarktvorhersage. Intel. Aufrechterhalten. Syst. 2555(1), 741–747 (2022).

Google Scholar

Juhola, M. et al. Datenanalyse für Herzerkrankungen. Berechnen. Biol. Med. 142(1), 1–9 (2022).

Google Scholar

Alom, Z. et al. Früherkennung von Herzinsuffizienz mithilfe maschineller Lerntechniken. Proz. Int. Konf. Big Data IoT Mach. Lernen. 95, 75–88 (2021).

Google Scholar

Sharma, S. & Parmar, M. Vorhersage von Herzerkrankungen mithilfe eines Deep-Learning-Modells für neuronale Netzwerke. Int. J. Innov. Technol. Entdecken. Ing. 9(3), 2244–2248 (2020).

Artikel Google Scholar

Ravindhar, N. & Hariharan Ragavendran, S. Intelligente Diagnose zur Vorhersage von Herzerkrankungen mithilfe von maschinellem Lernen. Int. J. Innov. Technol. Entdecken. Ing. 9(11), 1417–1421 (2019).

Artikel Google Scholar

Arunpradeep, N. & Niranjana, G. Verschiedene Modelle des maschinellen Lernens basieren auf der Vorhersage von Herzerkrankungen. Int. J. Aktuelle Technol. Ing. 8(6), 544–548 (2020).

Google Scholar

Ravindhar, N., Anand, H. & Ragavendran, G. Intelligente Diagnose zur Vorhersage von Herzerkrankungen mithilfe von maschinellem Lernen. Int. J. Innov. Technol. Entdecken. Ing. 8(11), 1417–1421 (2019).

Artikel Google Scholar

Subulakshmi, G. Entscheidungsunterstützung im System zur Vorhersage von Herzerkrankungen mithilfe von Naive Bayes. Indian J. Comput. Wissenschaft. Ing. 2(2), 170–176 (2011).

Google Scholar

Sai Krishna Reddy, V., Meghana, P., Subba Reddy, NV & Ashwath Rao, B. Vorhersage von Herz-Kreislauf-Erkrankungen mithilfe von Entscheidungsbäumen und naiven Bayes-Klassifikatoren. J. Phys. 2161, 1–8 (2022).

Google Scholar

Patel, TS, Patel, DP, Sanyal, M. & Shrivastav, PS Vorhersage von Herzerkrankungen und Überlebensfähigkeit mithilfe einer Support-Vektor-Maschine und eines Naive-Bayes-Algorithmus. bioRxiv https://doi.org/10.1101/2023.06.09.543776 (2023).

Artikel PubMed PubMed Central Google Scholar

Kelwade, P. & Salankar. 2016. Radiales Basisfunktions-Neuronales Netzwerk zur Vorhersage von Herzrhythmusstörungen basierend auf Herzfrequenz-Zeitreihen. Erste internationale IEEE-Konferenz zu Steuerung, Messung und Instrumentierung 454–458. https://doi.org/10.1109/CMI.2016.7413789 (2016).

Kumar, S. Erkennung von Herzerkrankungen mithilfe des Radialbasisfunktionsklassifikators. ICTACT J. Data Sci. Mach. Lernen. 1(4), 105–108 (2020).

Google Scholar

Jothikumar, R., Sivakumar, N. & Ramesh, PS Herzkrankheitsvorhersagesystem unter Verwendung von ANN, RBF und CBR. Int. J. Pure Appl. Mathematik. 117(21), 199–217 (2017).

Google Scholar

Saravanan, S. & Thirumurugan, P. Leistungsanalyse der Segmentierung von Gliom-Hirntumoren mithilfe der Ridgelet-Transformation und der CANFES-Methodik. J. Med. Bildgebende Gesundheitsinformationen. 10(11), 2642–2648 (2020).

Artikel Google Scholar

Latha, C. & Jeeva, S. Verbesserung der Genauigkeit der Vorhersage des Herzkrankheitsrisikos basierend auf Ensemble-Klassifizierungstechniken. Informieren. Med. Schalte 16(1), 1–9 (2019) frei.

Google Scholar

Abdeldjouad, F., Brahami, M. & Matta, N. Ein hybrider Ansatz zur Diagnose und Vorhersage von Herzerkrankungen mithilfe maschineller Lerntechniken. In International Conference on Smart Homes and Health Telematics 299–306 (Springer, 2020).

Google Scholar

Tarawneh, M. & Embarak, O. Hybrider Ansatz zur Vorhersage von Herzerkrankungen mithilfe von Data-Mining-Techniken. Acta Sci. Nutr. Gesundheit 3(7), 147–151 (2019).

Google Scholar

Javid, I., Alsaedi, A. & Ghazali, R. Verbesserte Genauigkeit der Vorhersage von Herzerkrankungen durch maschinelles Lernen und die Mehrheitsentscheidungsmethode des Ensembles rekurrenter neuronaler Netze. Int. J. Adv. Berechnen. Wissenschaft. Appl. 11(3), 540–551 (2020).

Google Scholar

Kumar, N. & Sikamani, K. Vorhersage chronischer und infektiöser Krankheiten mithilfe von Klassifikatoren für maschinelles Lernen: Ein systematischer Ansatz. Int. J. Intell. Ing. Syst. 13(4), 11–20 (2020).

Google Scholar

Saqlain, S. et al. Auf dem Fisher-Score und dem Matthew-Korrelationskoeffizienten basierende Auswahl von Merkmalsteilmengen für die Diagnose von Herzerkrankungen mithilfe von Support-Vektor-Maschinen. Wissen. Inf. Syst. 58, 139–167 (2019).

Artikel Google Scholar

Mohan, S., Thirumalai, C. & Srivastava, G. Effektive Vorhersage von Herzerkrankungen mithilfe hybrider Techniken des maschinellen Lernens. IEEE Access 7, 81542–81554 (2019).

Artikel Google Scholar

Miao, F., Cai, Y., Zhang, Y. & Li, Y. Prädiktive Modellierung der Krankenhausmortalität für Patienten mit Herzinsuffizienz unter Verwendung eines verbesserten Zufallsüberlebenswaldes. IEEE Access 6, 7244–7253 (2018).

Artikel Google Scholar

Chicco, D. & Jurman, G. Maschinelles Lernen kann das Überleben von Patienten mit Herzinsuffizienz allein anhand von Serumkreatinin und Ejektionsfraktion vorhersagen. BMC Med. Informieren. Entscheidung. Mak. 20(16), 1–16 (2020).

Google Scholar

Ahmad, E., Tiwari, A. & Kumar, A. Erkennung von Herz-Kreislauf-Erkrankungen (CVDs) mithilfe von Algorithmen für maschinelles Lernen. Int. J. Res. Appl. Wissenschaft. Ing. Technol. 8(6), 2341–2346 (2020).

Artikel Google Scholar

Wang, L., Zhou, W., Chang, Q., Chen, J. & Zhou, X. Tiefensemble-Erkennung von Herzinsuffizienz unter Verwendung kurzfristiger RR-Intervalle. IEEE-Zugriff. 7, 69559–69574 (2019).

Artikel Google Scholar

Gupta, A., Kumar, R., Arora, H. & Raman, B. MIFH: Ein maschinelles Intelligenz-Framework für die Diagnose von Herzerkrankungen. IEEE Access 8, 14659–14674 (2019).

Artikel Google Scholar

Rashmi, G. & Kumar, U. Methoden des maschinellen Lernens zur Vorhersage von Herzerkrankungen. SN-Computing. Wissenschaft. 8, 220–223 (2019).

Google Scholar

Nadakinamani, R. et al. Klinische Datenanalyse zur Vorhersage von Herz-Kreislauf-Erkrankungen mithilfe maschineller Lerntechniken. Berechnen. Intel. Neurosci. 2022, 1–13 (2022).

Artikel Google Scholar

Hossen, M. et al. Überwachte, auf maschinellem Lernen basierende Analyse und Vorhersage von Herz-Kreislauf-Erkrankungen. Mathematik. Probl. Ing. 2021, 1–10 (2021).

Artikel Google Scholar

Saboor, A. et al. Eine Methode zur Verbesserung der Vorhersage menschlicher Herzerkrankungen mithilfe von Algorithmen für maschinelles Lernen. Mobile Inf. Syst. 2022, 1–11 (2022).

Artikel Google Scholar

Arumugam, K. et al. Vorhersage mehrerer Krankheiten mithilfe von Algorithmen für maschinelles Lernen. Mater. Heute 2021, 1–10 (2021).

Google Scholar

Gupta, C., Saha, A., Reddy, N. & Acharya, U. Vorhersage von Herzerkrankungen mithilfe überwachter maschineller Lerntechniken. J. Phys: Conf. Ser. 2161, 1–12 (2022).

Google Scholar

Truong, V. et al. Anwendung von maschinellem Lernen beim Screening auf angeborene Herzfehler mittels fetaler Echokardiographie. Int. J. Cardiovasc. Bildgebung 38, 1007–1015 (2022).

Artikel Google Scholar

Abdalrada, A., Abawajy, J., Al-Quraishi, T. & Islam, S. Modelle für maschinelles Lernen zur Vorhersage des gleichzeitigen Auftretens von Diabetes und Herz-Kreislauf-Erkrankungen: Eine retrospektive Kohortenstudie. J. Diabetes Metab. Unordnung. 21, 251–261 (2022).

Artikel CAS PubMed PubMed Central Google Scholar

Referenzen herunterladen

Abteilung für Informatik und Ingenieurwesen, Vel Tech Rangarajan Dr. Sagunthala R&D Institute of Science and Technology, Avadi, Chennai, Indien

Saravanan Srinivasan

Abteilung für Informatik und Ingenieurwesen, Sathyabama Institute of Science and Technology, Chennai, Indien

Subathra Gunasekaran

School of Computing Science and Engineering, Galgotias University, Greater Noida, 203201, Indien

Sandeep Kumar Mathivanan

Fakultät für Informatik, Ingenieurwesen und Informationssysteme, Vellore Institute of Technology, Vellore, 632014, Tamil Nadu, Indien

Benjula Anbu Malar M. B & Prabhu Jayagopal

Abteilung für Softwaretechnik, College of Computing and Informatics, Haramaya University, POB 138, Dire Dawa, Äthiopien

Gemmachis Teshite Dalu

Sie können diesen Autor auch in PubMed Google Scholar suchen

Konzeptualisierung, SS und SG; Methodik, SKM; Validierung, BAMMB; Ressourcen, PJ; Datenkuration, GTD; Schreiben – ursprüngliche Entwurfsvorbereitung, SS und SG; Schreiben – Rezension und Bearbeitung, SKM, BAMMB, PJ und GTD; Visualisierung, SKM, BAMMB, P..J und GTD; Aufsicht SKM, BAMMB, PJ und GTD; Projektverwaltung.

Korrespondenz mit Gemmachis Teshite Dalu.

Die Autoren geben an, dass keine Interessenkonflikte bestehen.

Springer Nature bleibt neutral hinsichtlich der Zuständigkeitsansprüche in veröffentlichten Karten und institutionellen Zugehörigkeiten.

Open Access Dieser Artikel ist unter einer Creative Commons Attribution 4.0 International License lizenziert, die die Nutzung, Weitergabe, Anpassung, Verbreitung und Reproduktion in jedem Medium oder Format erlaubt, sofern Sie den/die ursprünglichen Autor(en) und die Quelle angemessen angeben. Geben Sie einen Link zur Creative Commons-Lizenz an und geben Sie an, ob Änderungen vorgenommen wurden. Die Bilder oder anderes Material Dritter in diesem Artikel sind in der Creative-Commons-Lizenz des Artikels enthalten, sofern in der Quellenangabe für das Material nichts anderes angegeben ist. Wenn Material nicht in der Creative-Commons-Lizenz des Artikels enthalten ist und Ihre beabsichtigte Nutzung nicht durch gesetzliche Vorschriften zulässig ist oder über die zulässige Nutzung hinausgeht, müssen Sie die Genehmigung direkt vom Urheberrechtsinhaber einholen. Um eine Kopie dieser Lizenz anzuzeigen, besuchen Sie http://creativecommons.org/licenses/by/4.0/.

Nachdrucke und Genehmigungen

Srinivasan, S., Gunasekaran, S., Mathivanan, SK et al. Eine auf einer aktiven Lernmaschine basierende Vorhersage kardiovaskulärer Herzerkrankungen aus der UCI-Repository-Datenbank. Sci Rep 13, 13588 (2023). https://doi.org/10.1038/s41598-023-40717-1

Zitat herunterladen

Eingegangen: 25. Dezember 2022

Angenommen: 16. August 2023

Veröffentlicht: 21. August 2023

DOI: https://doi.org/10.1038/s41598-023-40717-1

Jeder, mit dem Sie den folgenden Link teilen, kann diesen Inhalt lesen:

Leider ist für diesen Artikel derzeit kein Link zum Teilen verfügbar.

Bereitgestellt von der Content-Sharing-Initiative Springer Nature SharedIt

Durch das Absenden eines Kommentars erklären Sie sich damit einverstanden, unsere Nutzungsbedingungen und Community-Richtlinien einzuhalten. Wenn Sie etwas als missbräuchlich empfinden oder etwas nicht unseren Bedingungen oder Richtlinien entspricht, kennzeichnen Sie es bitte als unangemessen.