Please use this identifier to cite or link to this item:
http://dx.doi.org/10.25673/37216
Title: | Visual analytics of epidemiological and multi-omics data |
Author(s): | Alemzadeh, Shiva |
Referee(s): | Preim, Bernhard |
Granting Institution: | Otto-von-Guericke-Universität Magdeburg, Fakultät für Informatik |
Issue Date: | 2021 |
Extent: | x, 132 Seiten |
Type: | Hochschulschrift |
Type: | PhDThesis |
Exam Date: | 2021 |
Language: | English |
URN: | urn:nbn:de:gbv:ma9:1-1981185920-374501 |
Subjects: | Maschinelles Sehen Computergraphik |
Abstract: | Kohortenstudien zielen darauf ab, Risikofaktoren zu identifizieren, die den
Gesundheitszustand einer Bevölkerung in Bezug auf bestimmte Krankheiten
beeinflussen können. In der Epidemiologie werden die Teilnehmer von Gesundheitsstudien
zur Ermittlung der Risikofaktoren einer Krankheit hinsichtlich
verschiedener gesundheitsbezogener Aspekte beobachtet, die bei der Entwicklung
der Zielkrankheit eine Rolle spielen können. Diese Aspekte umfassten viele
Faktoren wie Lebensstil (z. B. Rauchen oder Alkoholkonsum) oderMedikamente
(z. B. Drogenkonsum), aktuelle Gesundheit (z. B. Diabetes oder erhöhter Blutdruck)
und soziodemografische Faktoren (z. B. Geschlecht, Familienstand).
UmdieDaten zu sammeln,werden Personen eingeladen, an der Studie teilzunehmen.
Die Informationen von den Individuen werden durch Interviews erhalten, z.B.
Fragen zu ihren Gewohnheiten und demaktuellen Gesundheitszustand. Darüber
hinaus werden medizinische Bilder akquiriert, umAnomalien zu entdecken, z.B.
erhöhte Brustdichte. In Kohortenstudien werden dieselben Personen erneut zur
Studie eingeladen, umdie Untersuchungen zu wiederholen und die zeitlichen
Veränderungen zu beobachten. Der Zweck dieser Nachuntersuchungen besteht
darin, den möglichen Zusammenhang zwischen den Krankheiten und den
Risikofaktoren zu identifizieren. Fehlende Daten sind jedoch ein unvermeidlicher
Bestandteil solcher Studien, bei denen einige Personen aus der Studie
ausscheiden oder die Aufzeichnungen unvollständig sind. Diese Arbeit bietet
halbüberwachte visuelle Analyse-Frameworks, um diskriminierende Subpopulationen
in Kohortenstudiendaten zu untersuchen und zu entdecken. Um
dies zu erreichen, bieten interaktiv koordinierte Mehrfachansichtsysteme die
Möglichkeit, um die verschiedenen Assoziationen zwischen Daten und Funktionen
zu untersuchen. Mit S-ADVIsED kann der Analyst die Ergebnisse des
Subspace-Clusters untersuchen und visuell validieren. Mit DiscoVA kann der
Analyst Subpopulationen anhand verschiedener Datentypen (z. B.Multi-Omics
und klinische Daten) identifizieren.
Umfehlende Daten in Längsschnittstudiendaten zu behandeln, bietet das VIVID
Framework außerdem Methoden zur Imputation (z. B. Mehrfachimputation)
und zur Überprüfung der Plausibilität der Ergebnisse Cohort studies aim to identify risk factors that may influence the health conditions of a population regarding specific diseases. In epidemiology science, to discover the risk factors of a disease, the cohort individuals are observed regarding different health-related aspects that may have a role in developing the target disease. These aspects involved many factors like lifestyle (e.g. smoking or alcohol consumption), or medicament (e.g. taking drugs), current health situations (e.g. diabetes or having elevated blood pressure), and socio-demographic factors (e.g. gender,marital status). To collect the data, people are invited to join the study via advertisements. The information from the individuals is acquired by having interviews, e.g. asking questions about their habits examinations and doing to find out the current health condition of individuals. Moreover, medical images are prepared to discover probable abnormalities, e.g. breast density. In cohort study data, the same individuals are re-invited to the study to repeat the examinations and observe the changes over time in different time points. The purpose of these follow-ups is to identify the possible link between the diseases and risk factors. However,missing data are an inevitable part of such studies where some individuals drop from the study of the records is incomplete. This thesis provides semi-supervised visual analytics frameworks to explore and discover discriminative subpopulations in cohort study data. To reach this, interactive coordinated multiple views systems provide a platform to investigate the different associations between the data and features. S-ADVIsED enables the analyst to explore the results of subspace clustering and also validate the results visually. DiscoVA enables the analyst to identify subpopulations using different data types (e.g. multi-omics and clinical data). Additionally, to handle missing data in longitudinal study data, VIVID framework provides the methods to explore and impute (e.g. multiple imputation) the missing values. Moreover, it allows the expert to check the plausibility of the results. |
URI: | https://opendata.uni-halle.de//handle/1981185920/37450 http://dx.doi.org/10.25673/37216 |
Open Access: | Open access publication |
License: | (CC BY-SA 4.0) Creative Commons Attribution ShareAlike 4.0 |
Appears in Collections: | Fakultät für Informatik |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
Alemzadeh_Shiva_Dissertation_2021.pdf | Dissertation | 35.36 MB | Adobe PDF | View/Open |