1
views
0
recommends
+1 Recommend
1 collections
    0
    shares
      • Record: found
      • Abstract: found
      • Article: found
      Is Open Access

      Aplicación de transductores de estado-finito a los procesos de unificación de términos Translated title: Application of transducers of state-finite to unification processes of term variants

      research-article

      Read this article at

      Bookmark
          There is no author summary for this article yet. Authors can add summaries to their articles on ScienceOpen to make them more accessible to a non-specialist audience.

          Abstract

          Se presenta una aplicación basada en técnicas de estado-finito a los procesos de unificación de términos en español. Los algoritmos de unificación, o conflación, de términos son procedimientos computacionales utilizados en algunos sistemas de Recuperación de Información (RI) para la reducción de variantes de términos, semánticamente equivalentes, a una forma normalizada. Los programas que realizan habitualmente este proceso se denominan: stemmers y lematizadores. El objetivo de este trabajo es evaluar el grado de deficiencias y errores de los lematizadores en el proceso de agrupación de los términos a su correspondiente radical. El método utilizado para la construcción del lematizador se ha basado en la implementación de una herramienta lingüística que permite construir diccionarios electrónicos representados internamente en Transductores de Estado-Finito. Los recursos léxicos desarrollados se han aplicado a un corpus de verificación para evaluar el funcionamiento de este tipo de analizadores léxicos. La métrica de evaluación utilizada ha sido una adaptación de las medidas de cobertura y precisión. Los resultados muestran que la principal limitación del proceso de unificación de variantes de término por medio de tecnología de estado-finito es el infra-análisis.

          Translated abstract

          An approach based on techniques of state-finite has applied to the processes of unification of terms in Spanish. The algorithms of conflation are computational procedures utilized in some Information Retrieval (RI) systems for the unification of term variants, semantically equivalent, to a normalized form. The programs that carry out habitually this process are called: stemmers and lematizadores. The objective of this work is to evaluate the deficiencies and errors of the lematizadores in the conflation of terms. The method utilized for the construction of the lematizador has been based on the implementation of a linguistic tool that permits to build electronic dictionaries represented internally in Finite-State Transducers (FST). The lexical resources developed have applied to a corpus of verification to evaluate the performance of these lexical parsers. The metric of evaluation utilized has been an adaptation of coverage and precision measures. The results show that the main limitation of unification processes of tem variants through technology of state-finite is the under-analysis.

          Related collections

          Most cited references28

          • Record: found
          • Abstract: not found
          • Article: not found

          An algorithm for suffix stripping

            Bookmark
            • Record: found
            • Abstract: not found
            • Article: not found

            How effective is suffixing?

              Bookmark
              • Record: found
              • Abstract: not found
              • Article: not found

              Stemming algorithms: A case study for detailed evaluation

              David Hull (1996)
                Bookmark

                Author and article information

                Journal
                ci
                Ciência da Informação
                Ci. Inf.
                IBICT (Brasília, DF, Brazil )
                0100-1965
                1518-8353
                December 2006
                : 35
                : 3
                : 67-74
                Affiliations
                [01] orgnameUniversidad de Granada cgalvez@ 123456ugr.es
                Article
                S0100-19652006000300007 S0100-1965(06)03500307
                5ea2ab3a-af0d-4ccf-8c46-ad9c422b7425

                This work is licensed under a Creative Commons Attribution-NonCommercial 4.0 International License.

                History
                : 24 January 2006
                : 07 March 2007
                Page count
                Figures: 0, Tables: 0, Equations: 0, References: 35, Pages: 8
                Product

                SciELO Brazil


                Lematización,Unificación de términos,Finite-state transducers,Lemmatization,Term conflation,Transductores de estado-finito

                Comments

                Comment on this article