
Investigation of the speaker identification method based on clustered pseudostationary segments of voiced sounds

    Povilas Treigys Affiliation
    ; Antanas Lipeika Affiliation


The problem of speaker identification is investigated. Basic segments ‐ pseudo stationary intervals of voiced sounds are used for identification. The identification is carried out, comparing average distances between an investigative and comparatives. The coefficients of the linear prediction model (LPC) of a vocal tract are used as features of identification. Such a problem arises in stenographic practice where it is important for speech identification to know who is speaking. Identification should be used in stenography and it has to be fast enough in order not to disturb the stenographer's job. The clustered parameter data will be investigated by providing the performance of the speaker identification method with respect to the computational time and the number of errors.

Kalbėtojo identifikavimo metodo, grįsto vokalizuotų garsų klasterizuotais pseudostacionariais segmentais, tyrimas

Santrauka. Nagrinėjama kalbėtojo identifikavimo problema. Identifikuoti naudojami vokalizuotų garsų pseudostacionarūs intervalai. Identifikuojama lyginant vidutinius atstumus tarp tiriamojo ir lyginamųjų kalbėtojų. Požymius sudaro balso trakto tiesinės prognozės modelio koeficientai, gauti iš fonogramos pseudostacionarių intervalų. Nagrinėjama problema aktuali stenografuotojams, kada kalbėtojų yra daug ir kiekvieną jų atpažinti pagal balsą yra gana sunku. Straipsnyje nagrinėjama sugrupuotų duomenų įtaka identifikavimo metodo klaidoms ir skaičiavimo laikui.

Reikšminiai žodžiai: nepriklausomas nuo teksto identifikavimas, duomenų grupavimas, vektorinis kvantavimas, laiko sąnaudos, vokalizuotų garsų pseudostacionarūs segmentai, identifikavimo klaidos.

First Published Online: 21 Oct 2010

Keyword : text independent speaker identification, data clustering, vector quantization, time consumption, number of errors, pseudostationary segments of voiced sounds

Treigys, P., & Lipeika, A. (2006). Investigation of the speaker identification method based on clustered pseudostationary segments of voiced sounds. Technological and Economic Development of Economy, 12(1), 50-55.
Mar 31, 2006
