Bitte benutzen Sie diese Kennung, um auf die Ressource zu verweisen: http://dx.doi.org/10.25673/853
Titel: Learning and visualizing topics and their change with time for the exploratory analysis of social tags and multilingual topic modeling of chemical compounds
Autor(en): Gohr, André
Gutachter: Hinneburg, Alexander, Dr.
Wrobel, Stefan, Prof. Dr.
Körperschaft: Martin-Luther-Universität Halle-Wittenberg
Erscheinungsdatum: 2012
Umfang: Online-Ressource (159 Bl. = 2,28 mb)
Typ: Hochschulschrift
Art: Dissertation
Tag der Verteidigung: 2012-12-19
Sprache: Englisch
Herausgeber: Universitäts- und Landesbibliothek Sachsen-Anhalt
URN: urn:nbn:de:gbv:3:4-9444
Schlagwörter: Computerlinguistik
Online-Publikation
Hochschulschrift
Zusammenfassung: Ich schlage AdaptivePLSA für das Lernen von dynamischen Topics aus Dokumentströmen vor. Für die SIGIR Konferenzbände liefern die gelernten Topics Hinweise auf die wissenschaftlichen Hauptthemen. Ich schlage TopicTable als eine Visualisierung für die aus Dokumentströmen gelernten Topics vor. TopicTable visualisiert nützliche Zusatzinformationen wie Topicähnlichkeiten und neu auftretende Wörter. In einem Beispiel liefert TopicTable eindeutige Hinweise auf fremdartige Dokumente in einem Dokumentstrom. Desweiteren beschäftige ich mich mit dem Aufdecken der semantischen Mehrdeutigkeit von sozialen Tags. Der vorgestellte Ansatz deckt unerwartete Bedeutungen dieser Tags auf und visualisiert Themen der Dokumente mit diesen Tags. Zuletzt wende ich ein bilinguales Topic-Modell an, um NMR-Spektren und chemische Konstitutionen chemischen Verbindungen zu modellieren. Die gelernten bilingualen Topics könnten Anwendung finden in neuartigen Ansätzen zum Datamining in chemischen Strukturdatenbanken.
I propose AdaptivePLSA for dynamic topic modeling with streams of documents. For the SIGIR proceedings, the learned topics give clear hints to the main research subjects. Next, I propose TopicTable, a visualization for presenting topics learned from document streams. TopicTable visualizes useful pieces of information, e.g., topics similarities and newly emerging words. It is effective as it provides clear hints to alien documents which were added to a test stream of documents. Next, I propose an approach for the disambiguation of social tags which have been added to documents by many users of a collaborative tagging system. This approach uncovers unobvious semantics of tags and visualizes topics which are learned from the tagged documents. Last, I apply bilingual topic modeling to NMR spectra and chemical constitutions of chemical compounds. The learned bilingual topics might be exploited by new approaches for data mining in chemical- and structure-databases of chemical compounds.
URI: https://opendata.uni-halle.de//handle/1981185920/7752
http://dx.doi.org/10.25673/853
Open-Access: Open-Access-Publikation
Nutzungslizenz: In CopyrightIn Copyright
Enthalten in den Sammlungen:Datenverarbeitung; Informatik

Dateien zu dieser Ressource:
Datei Beschreibung GrößeFormat 
Gohr.pdf2.34 MBAdobe PDFMiniaturbild
Öffnen/Anzeigen