Bitte benutzen Sie diese Kennung, um auf die Ressource zu verweisen: http://dx.doi.org/10.25673/679
Titel: Text mining and applications in life sciences
Autor(en): Hinneburg, Alexander
Gutachter: Brass, Stefan, Prof. Dr.
Seidl, Thomas, Prof. Dr.
Spiliopoulou, Myra, Prof. Dr.
Körperschaft: Martin-Luther-Universität Halle-Wittenberg
Erscheinungsdatum: 2011
Umfang: Online-Ressource (152 S. = 2,57 mb)
Typ: Hochschulschrift
Art: Habilitationsschrift
Tag der Verteidigung: 2011-01-13
Sprache: Englisch
Herausgeber: Universitäts- und Landesbibliothek Sachsen-Anhalt
URN: urn:nbn:de:gbv:3:4-7603
Schlagwörter: Text Mining
Hochschulschrift
Online-Publikation
Zusammenfassung: Text ist eine der häufigsten Form von elektronischen Daten, die für Menschen direkt lesbar ist. In dieser Arbeit wird untersucht, ob und wie statistische Methoden zur Textanalyse auf Anwendungen aus den Lebenswissenschaften übertragen werden können. Die betrachteten Anwendungen sind zwei-dimensionale-NMR-Spektren, Proteomics-Experimente und Protein-Precursor-Sequenzen, die eine Funktion als Transit-Peptid für Mitochondrien haben. All diese verschiedenen Datensorten können sinnvoll in eine Repräsentation überführt werden, die analog der Bag-of-Words-Repräsentation von Textdokumenten ist. Die verwendeten Text-Mining-Methoden sind Topic-Modeling und dessen Anwendungen auf Ähnlichkeitssuche, Near-Duplicate-Detektion von Dokumenten mittels Locality-Sensitive-Hashing und Cluster-Analyse basierend auf fraktaler Dimension. Die Ergebnisse zeigen, dass die Bag-of-Words-Repräsentation ebenso wie die genannten Text-Mining-Methoden sich erfolgreich in den ausgewählten Anwendungen übertragen und nutzbar machen lassen.
URI: https://opendata.uni-halle.de//handle/1981185920/7579
http://dx.doi.org/10.25673/679
Open-Access: Open-Access-Publikation
Nutzungslizenz: In CopyrightIn Copyright
Enthalten in den Sammlungen:Datenverarbeitung; Informatik

Dateien zu dieser Ressource:
Datei Beschreibung GrößeFormat 
habil_hinneburg.pdf2.64 MBAdobe PDFMiniaturbild
Öffnen/Anzeigen