Personenprofil
Kurzprofil
Gerhard Heyer ist Professor emeritus für Automatische Sprachverarbeitung. Vor seiner Universit?tst?tigkeit war er als Systemspezialist und Leiter von Forschungs- und Entwicklungsaufgaben in der Gro?industrie und einer eigenen Firma t?tig. Forschungsschwerpunkte sind die automatische semantische Verarbeitung von Text, Forschungsdateninfrastrukturen und Anwendungen des Text Mining u.a. in den Digital Humanities. Sein Buch zum Text Mining (Neuauflage 2022, https://link.springer.com/book/9783658359683) ist das deutsche Standardlehrbuch zu diesem aktuellen Thema. Das von ihm mitdefinierte NFDI-Projekt Text+ leitet er als PI an der S?chsischen Akademie der Wissenschaften. Prof. Heyer ist Beisitzer im Vorstand des Instituts für Angewandte Informatik (InfAI), einem An-Institut der Universit?t Leipzig zum Wissens- und Technologietransfer in der Informatik, das er 2006 mitgegründet hat, sowie Mitglied im Beirat Digitale Wertsch?pfung des s?chsischen Ministeriums für Wirtschaft und Arbeit (SMWA).
Berufliche Laufbahn
- seit 01/1985
Lange Jahre war er als Systemspezialist und Leiter von Forschungs- und Entwicklungsaufgaben zu Sprach- und Multimediaprodukten in der Gro?industrie und einer eigenen Firma t?tig, die eines der ersten Translation Memory Systeme entwickelt hat. An die Universit?t Leipzig ist er 1994 als einer der ersten Professoren für Automatische Sprachverarbeitung im Fachbereich Informatik berufen worden. Grundlegender Forschungsansatz der Abteilung war dabei stets eine enge Verbindung von Daten und Verfahren.
Ausbildung
- 08/1973 - 12/1984
Gerhard Heyer hat Philosophie, Mathematische Logik und Linguistik an den Universit?ten Cambridge (M.A.1980) und Bochum (Dr.phil. 1983) studiert. Daran anschlie?end hat er einen einj?hrigen Forschungsaufenthalt zur automatischen Verarbeitung natürlicher Sprache an der University of Michigan, Ann Arbor (USA), als Visiting Assistant Professor und Feodor-Lynen Forschungsstipendiat der Alexander-von-Humboldt Stiftung verbracht.
Gremien Mitgliedschaften
- seit 01/2018
Prof. Heyer ist Mitglied in zahlreichen wissenschaftlichen Beir?ten und Beisitzer im Vorstand des Instituts für Angewandte Informatik (InfAI), einem An-Institut der Universit?t Leipzig. Von 1997 bis 2006 war er Mitglied des wissenschaftlichen Beirats des Informationswissenschaftlichen Zentrums (IZ) im GESIS-Verbund, von 2006 bis 2007 auch Mitglied des GESIS-Kuratoriums.
Sein Forschungsschwerpunkt liegt in der automatischen semantischen Verarbeitung von Text. Neben zahlreichen Ver?ffentlichungen zu diesem Thema – u.a. dem deutschsprachigen Text Mining Lehrbuch ?Text Mining: Wissensrohstoff Text“ (W3L-Verlag, 32011, ?berarbeitung bei Springer Campus 2022) – hat er in diesem Bereich auch eine Vielzahl von 亚洲通_亚洲通官网¥娱乐网址n durchgeführt. Unter den neueren Projekten sind besonders seine Arbeiten zu Forschungsinfrastrukturen (CLARIN-D,CLARIAH und Text+), zur Informations- und Relationenextraktion aus dem zusammen mit der GESIS von der DFG gef?rderten Projekt iLCM (interactive Leipzig Corpus Miner, http://ilcm.informatik.uni-leipzig.de/) und der Anwendung von Verfahren des maschinellen Lernens bei OCR und HTR hervorzuheben, so u.a. im DFG-Verbundprojekt OCR-D, Koordinierte F?rderinitiative zur Weiterentwicklung von Verfahren für die Optical-Character-Recognition.
- iLCM - Eine virtuelle Forschungsumgebung für large-scale qualitative DatenHeyer, GerhardLaufzeit: 02.2017 – 12.2022Mittelgeber: DFG Deutsche ForschungsgemeinschaftBeteiligte Organisationseinheiten der UL: Automatische Sprachverarbeitung
- Recognition and Enrichment of Archival Documents - READHeyer, GerhardLaufzeit: 01.2016 – 06.2021Mittelgeber: EU Europ?ische UnionBeteiligte Organisationseinheiten der UL: Automatische Sprachverarbeitung
- Sprachdatenressourcen – Deutscher Wortschatz, multilinguale Corpora und W?rter-des-TagesHeyer, GerhardLaufzeit: 05.2011 – laufendBeteiligte Organisationseinheiten der UL: Automatische Sprachverarbeitung
- Informationsverteilung und Sprachstruktur – Korrelation von grammatischen Auspr?gungen der Nomen/Verb-Unterscheidung und lexikalischem Informationsgehalt im Tagalog, Indonesischen und DeutschenHeyer, GerhardLaufzeit: 07.2020 – 06.2022Mittelgeber: DFG Deutsche ForschungsgemeinschaftBeteiligte Organisationseinheiten der UL: Automatische Sprachverarbeitung
- CLARIN-DHeyer, GerhardLaufzeit: 05.2011 – 09.2020Mittelgeber: BMBF Bundesministerium für Bildung und ForschungBeteiligte Organisationseinheiten der UL: Automatische Sprachverarbeitung
- Niekler, A.; Bleier, A.; Kahmann, C.; Posch, L.; Wiedemann, G.; Erdogan, K.; Heyer, G.; Strohmaier, M.ILCM - A Virtual Research Infrastructure for Large-Scale Qualitative DataProceedings of the Eleventh International Conference on Language Resources and Evaluation (LREC 2018). 2018.
- Heyer, G.; Eckart, T.; Goldhahn, D.Was sind IT-basierte Forschungsinfrastrukturen für die Geistes- und Sozialwissenschaften und wie k?nnen sie genutzt werden?Information - Wissenschaft & Praxis. 2015. 66 (5/6). S. 295–303.
- Remus, R.; Quasthoff, U.; Heyer, G.SentiWS - a publicly available German-language resource for sentiment analysisIn: Calzolari, N.; Choukri, K.; Maegaard, B. (Hrsg.)Proceedings of the Seventh International Conference on Language Resources and Evaluation (LREC'10). Valetta: ELRA. 2010. S. 1168–1171.
- Yousef, T.; Schlaf, A.; Borst-Graetz, J.; Niekler, A.; Heyer, G.Press Freedom Monitor: Detection of Reported Press and Media Freedom Violations in Twitter and News Articles2021. S. 153–159.
- Schroeder, C.; Bürgl, K.; Annanias, Y.; Niekler, A.; Müller, L.; Wiegreffe, D.; Bender, C.; Mengs, C.; Scheuermann, G.; Heyer, G.Supporting Land Reuse of Former Open Pit Mining Sites using Text Classification and Active Learning2021. S. 4141–4152.