Zusammenfassung
Für die automatische Indexierung mit einem vorgegebenen Deskriptorensystem wird ein Wörterbuch benötigt, das möglichst viele Fachausdrücke des Anwendungsgebietes durch Relationen mit Deskriptoren verbindet. Werden die in einem solchen Indexierungswörterbuch erfaßten Relationen aus der Verarbeitung von Texten gewonnen, so ergibt sich eine Beziehung zwischen der Anzahl der Texte und der Größe und Leistungsfähigkeit des Wörterbuches. Die Beschreibung derartiger Beziehungen ist besonders vor Beginn der Entwicklung eines automatischen Indexierungssystems von großem Interesse. H. Hüther hat sich in mehreren Arbeiten mit diesem Problem beschäftigt und verschiedene Schätzverfahren theoretisch hergeleitet. Für eines der von ihm vorgeschlagenen Schätzverfahren zur Abschätzung der Größe eines Indexie-rungswörterbuches in Abhängigkeit von der Anzahl der zugrundeliegenden Texte werden im vorliegenden Beitrag die Leistungsfähigkeit und die Anwendbarkeit untersucht.
Access this chapter
Tax calculation will be finalised at checkout
Purchases are for personal use only
Preview
Unable to display preview. Download preview PDF.
Similar content being viewed by others
Literatur
Beinke-Geiser, U.; Lustig, G.; Futze-Meier, G. (1986). Indexieren mit dem System DAISY. In: Lustig, G. (ed.): Automatische Indexierung zwischen Forschung und Anwendung, pages 73–97. Olms, Hildesheim.
Faißt, S. (1990). Entwicklung von Indexierungsfunktionen auf der Basis probabilistischer Entscheidungsbäume. Diplomarbeit, TH Darmstadt, FB Informatik, Datenverwaltungssysteme I I.
Fuhr, N.; Hüther, H. (1989). Optimum Probability Estimation from Empirical Distributions. Information Processing and Management 25 (5), pages 493 - 507.
Fuhr, N.; Jäger-Beck, R.; Schwantner, M. (1986). Die Gewinnung von statistischen Relationen zwischen Terms und Deskriptoren. In: Lustig, G. (ed.): Automatische Indexierung zwischen Forschung und Anwendung, pages 43–51. Olms, Hildesheim.
Fuhr, N.; Hartmann, S.; Knorz, G.; Lustig, G.; Schwantner, M.; Tzeras, K. (1991). AIR/X — a Rule-Based Multistage Indexing System for Large Subject Fields. In: Proceedings of the RIAO’91, Barcelona, Spain, April 2–5, 1991.
Hüther, H. (1989). Wachstumsfunktionen in der automatischen Indexierung. Dissertation, TH Darmstadt, FB Informatik, Datenverwaltungssysteme I I.
Hüther, H. (1990). On the Interrelationship of Dictionary Size and Completeness. In: Vidick, J.-L. (ed.): Proceedings of the 18th International Conference on Research and Development in Information Retrieval, pages 313–326. ACM, New York.
Knorz, G. (1983). Automatisches Indexieren als Erkennen abstrakter Objekte. Niemeyer, Tübingen.
Lustig, G. (ed.) (1986). Automatische Indexierung zwischen Forschung und Anwendung. Olms, Hildesheim.
Pfeifer, U. (1990). Entwicklung log-linearer und linear-iterativer Indexierungsfunktionen. Diplomarbeit, TH Darmstadt, FB Informatik, Datenverwaltungssysteme I I.
Tzeras, K. (1988). Schätzfunktionen för die Relation Z. Diplomarbeit, TH Darmstadt, FB Infor-matik, Datenverwaltungssysteme II.
Author information
Authors and Affiliations
Editor information
Editors and Affiliations
Rights and permissions
Copyright information
© 1991 Springer-Verlag Berlin Heidelberg
About this paper
Cite this paper
Tzeras, K. (1991). Zur Aufwandsabschätzung bei der Entwicklung eines Indexierungswörterbuches. In: Fuhr, N. (eds) Information Retrieval. Informatik-Fachberichte, vol 289. Springer, Berlin, Heidelberg. https://doi.org/10.1007/978-3-642-76981-8_3
Download citation
DOI: https://doi.org/10.1007/978-3-642-76981-8_3
Publisher Name: Springer, Berlin, Heidelberg
Print ISBN: 978-3-540-54618-4
Online ISBN: 978-3-642-76981-8
eBook Packages: Springer Book Archive