Please use this identifier to cite or link to this item:
http://dx.doi.org/10.25673/853
Title: | Learning and visualizing topics and their change with time for the exploratory analysis of social tags and multilingual topic modeling of chemical compounds |
Author(s): | Gohr, André |
Referee(s): | Hinneburg, Alexander, Dr. Wrobel, Stefan, Prof. Dr. |
Granting Institution: | Martin-Luther-Universität Halle-Wittenberg |
Issue Date: | 2012 |
Extent: | Online-Ressource (159 Bl. = 2,28 mb) |
Type: | Hochschulschrift |
Type: | PhDThesis |
Exam Date: | 2012-12-19 |
Language: | English |
Publisher: | Universitäts- und Landesbibliothek Sachsen-Anhalt |
URN: | urn:nbn:de:gbv:3:4-9444 |
Subjects: | Computerlinguistik Online-Publikation Hochschulschrift |
Abstract: | Ich schlage AdaptivePLSA für das Lernen von dynamischen Topics aus Dokumentströmen vor. Für die SIGIR Konferenzbände liefern die gelernten Topics Hinweise auf die wissenschaftlichen Hauptthemen. Ich schlage TopicTable als eine Visualisierung für die aus Dokumentströmen gelernten Topics vor. TopicTable visualisiert nützliche Zusatzinformationen wie Topicähnlichkeiten und neu auftretende Wörter. In einem Beispiel liefert TopicTable eindeutige Hinweise auf fremdartige Dokumente in einem Dokumentstrom. Desweiteren beschäftige ich mich mit dem Aufdecken der semantischen Mehrdeutigkeit von sozialen Tags. Der vorgestellte Ansatz deckt unerwartete Bedeutungen dieser Tags auf und visualisiert Themen der Dokumente mit diesen Tags. Zuletzt wende ich ein bilinguales Topic-Modell an, um NMR-Spektren und chemische Konstitutionen chemischen Verbindungen zu modellieren. Die gelernten bilingualen Topics könnten Anwendung finden in neuartigen Ansätzen zum Datamining in chemischen Strukturdatenbanken. I propose AdaptivePLSA for dynamic topic modeling with streams of documents. For the SIGIR proceedings, the learned topics give clear hints to the main research subjects. Next, I propose TopicTable, a visualization for presenting topics learned from document streams. TopicTable visualizes useful pieces of information, e.g., topics similarities and newly emerging words. It is effective as it provides clear hints to alien documents which were added to a test stream of documents. Next, I propose an approach for the disambiguation of social tags which have been added to documents by many users of a collaborative tagging system. This approach uncovers unobvious semantics of tags and visualizes topics which are learned from the tagged documents. Last, I apply bilingual topic modeling to NMR spectra and chemical constitutions of chemical compounds. The learned bilingual topics might be exploited by new approaches for data mining in chemical- and structure-databases of chemical compounds. |
URI: | https://opendata.uni-halle.de//handle/1981185920/7752 http://dx.doi.org/10.25673/853 |
Open Access: | Open access publication |
License: | In Copyright |
Appears in Collections: | Datenverarbeitung; Informatik |