Badania 

           

 

·        Demenko, Grażyna, Stefan Grocholewski, Katarzyna Klessa, Jerzy Ogórkiewicz, Agnieszka Wagner, Marek Lange, Daniel Śledziński & Natalia Cylwik., LVCSR SPEECH DATABASE – JURISDIC. In: Proceeding of NTAV / SPA 2008, Signal Processing: Algorithms, Architectures, Arrangements, and Applications, New Trends in Audio and Video (AES), Poznań University of Technology, September 25-27, 2008

·        Szymański, Marcin & Stefan Grocholewski.. Error prediction-based semi-automatic segmentation of speech databases. In: Proceeding of TSD 2008 Conference. September 8-12, 2008, Brno, Czech Republic.

·        Szymański, Marcin, Jerzy Ogórkiewicz, Marek Lange, Katarzyna Klessa, Stefan Grocholewski & Grażyna Demenko. First evaluation of Polish LVCSR acoustic models obtained from the JURISDIC database. In: Speech and Language Technology, vol. 11. Publisher: Polish Phonetic Association, pp.39-46

·        Demenko, Grażyna, Jolanta Bachan, Bernd Möbius, Katarzyna Klessa, Marcin Szymański & Stefan Grocholewski, Development and Evaluation of Polish Speech Corpus for Unit Selection Speech Synthesis Systems. Proc.  Interspeech 2008, September 22-26, 2008, Brisbane, Australia

·        Demenko, Grażyna, Stefan Grocholewski, Katarzyna Klessa, Jerzy Ogórkiewicz, Marek Lange, Daniel Śledziński & Natalia Cylwik. 2008. Jurisdic–Polish Speech Database for taking dictation of legal texts. In: Proceedings of the Sixth International Language Resources and Evaluation (LREC'08), 28-30 May 2008 Marrakech, Morocco.

·        Szymański M., Grocholewski S.,  Semi-automatic segmentation of speech: manual segmentation strategy based on error prediction,  Speech and Language Technology, vol.9/10, pp. 145-154, Poznań 2007.

·        Szymański M., Grocholewski S.,  Dynamic programming method for fine-tuning the boundary points in automatic segmentation of speech,  Archives of Acoustics, No.1, vol. 32, 2007, pp. 127-134.

·        Demenko G., Wagner A., Grocholewski S., Szymański M.,   Prosody Annotation for Corpus Based Speech Synthesis,   Proc. Eleventh International Conference on Speech Science and Technology, Auckland 2006, pp. 301-306.  

·        Szymański M., Grocholewski S., Post-processing of Automatic Segmentation of Speech Using Dynamic Programming, LNAI  4188, Springer-Verlag 2006, pp. 523-530.

·        Grocholewski S., Feature selection in ASR systems, Speech Analysis, Synthesis and Recognition in Technology, Linguistics and Medicine,  AGH, pp.140-146, Kraków 2005.

·        Szymański M., Grocholewski S., Transcription-based automatic segmentation of speech, Archives of Control Sciences, vol. 15, 2005, No. 3, pp 251-259.

·        Szymański M., Grocholewski S., Post-processing approaches in HMM-based Speech Recognizer, Speech Snalysis, Synthesis and Recognition in Technology, Linguistics and Medicine, Wyd. AGH, pp.134-139, Kraków 2005.

·        Szymański M., Grocholewski S., Semi Automatic Segmentation of Speech: Manual Segmentation Strategy. Problem Space Analysis, Advances in Soft Computing, Computer Recognition Systems, Springer, 2005, pp.747-755.

·        Szymański M., Grocholewski S., Dynamic programming method for fine-tuning the boundary points in automatic segmentation of speech, Proc. Speech Analysis, Synthesis and Recognition, Kraków 2005

·        Szymański M., Grocholewski S., Transcription-based automatic segmentation of speech, Proc. Language and Technology, pp. 11-14, Poznań 2005.

·        Szymański M., Grocholewski S., Strategies of the selected manual annotations in semi-automatic speech signal segmentation, Speech and Language Technology, vol.8, 2005, pp.187-197.

·        Szymański M., Grocholewski S., Analysis of selected confidence measures in ASR systems, Speech and Language Technology, vol.7, 2003, pp.109-120

·        Grocholewski S., Some Investigations of the Decision Trees from the ASR, TTS and Applied Phonetics Point of View, Proc. 15th ICPhS, Barcelona 2003, pp. 1341-1344.

·        Szymański M., Grocholewski S., Dominance Based Post-Processing in ASR System, Proc. Signal Processing’2003, s.41-46.

·        Szymański M., Grocholewski S., Post-processing approaches in HMM based speech recognizer, Archives of Acoustics, vol.28, No 3, 2003, s.259 (abstract).

·        Grocholewski S., Two Stage Speaker Verification System, Speech and Language Technology, vol.6, 2005, pp.45-56.

·        Grocholewski S., An Analysis of Variability of Polish Vowels in the Cepstral Domain, Proc. Signal Processing’2001, pp.77-80

·        Grocholewski S., Demenko G., Within-vowels correlation for speaker recognition, Proc. Conf. on Systemics, Cybernetics and Informatics, pp. 384-387, Orlando 2001.

·        Demenko G., Grocholewski S., Text independent speaker verification based on segmental and suprasegmental features, Proc. Conf. on Systemics, Cybernetics and Informatics, pp. 378-383, Orlando 2001.

·        Grocholewski S., The use of HMMs for modeling Polish triphones,, Speech and Language Technology, vol.5, 2001, pp.59-76.

·        Grocholewski S., Hidden Markov Models for Polish, Prosody 2000, eds. S.Puppel, G.Demenko, UAM, Poznań 2001, pp.69-74.

·        Grocholewski S., Acoustic modeling for Polish, Proc. International Workshop Speech and Computer SPECOM’2000, Petersburg, pp.67-70.

·        Grocholewski S., The use of CORPORA for Comparing ASR Systems, Speech and Language Technology, vol.3, 1999, pp.277-286.

·        S.Grocholewski, Method of Polish alphabet classification, Proc. Int. Congress of Phonetic Sciences - ICPhS’99, San Francisco, pp.1689-1692

·        S.Grocholewski, Analysis of HMM Models in Alphabet Letters Recognition, Proc. Eurospeech’99, Budapest, pp.875-878.

·        Łukasik E., Grocholewski S., Comparison of Some Time-Frequency Analysis Methods for classification of Plosives, Proc. of the IX European Signal Processing Conference, Rhodes 1998, pp.709-712. Editors: S.Theodoridis, I.Pitas, A.Stouraitis, N.Kalouptsidis.

·        S.Grocholewski, First Database for Spoken Polish, ICLRE, Grenada, 1998, pp. 1059-1062.

·        S.Grocholewski, Design of Polish Diphones Corpus, 4-th Int. Workshop on Systems, Signals and Image Processing, pp.101-104,  Poznań 1997.

·        E.Łukasik, J.R.Nawrocki, S.Grocholewski, M.Zakrzewicz, Incorporating Digital Signal Processing into Computer Science Curriculum, Proc.  5th Annual Conference of the Teaching of Computing, s.132-135, Dublin 1997.

·        S.Grocholewski, CORPORA - Speech Database for Polish Diphones, Proc. EUROSPEECH'97, Editors: G.Kokkinakis, N.Fakotakis, E.Dermatas, pp.1735-1738, Rodos, Grecja, 1997.

·        Grocholewski S., Consistent subsets in speech recognition systems, VIII European Signal Processing Conference - EUSIPCO'96, Triest 1996, pp.1611-1614

·        Łukasik E., S.Grocholewski, Wavelet transform in speech processing,  Summer School on Wavelets, Zakopane 1996, pp.37-43.

·        Grocholewski S., TMS320C30 based neural network accelerator, Proc. of the Conf. Programmable Devices and Systems, Gliwice 1995.

·        Łukasik E., Grocholewski S., Two pass robust pitch extraction algorithm using the Dyadic wavelet transform, Proc.of the VII European Signal Processing Conference - EUSIPCO-94, Edinburgh, 1994, pp.1681-1684.

·        Grocholewski S., PC based speech training environment for deaf children, Proc. of the Conf. Speech and Language Technology for Disabled Persons, Stockholm 1993, pp.181-184.

·        Grocholewski S., A   method    for    connected    word    recognition,    Archives of Acoustics, vol.17, nr 2,   1992, pp.235-248.

·        Grocholewski S., Krenz R., Lateral inhibition in vowel processing, Signal Processing VI: Theories and Applications, J.Vandewalle i in. (eds), Elsevier Science Publishers, 1992, pp.299-302. 

·        Grocholewski S., Łukasik E., Ogórkiewicz J., Low Cost Real Time Digital Spectrograph, Int. Conf. on DSP Applications and Technology, Berlin 1991, pp.590-597

·        Grocholewski S., Dynamic programming processor architecture for real time speech recognition, Signal Processing IV, Theories and Applications, J.L.Lacoume i in. (eds), Elsevier Science Publisher, 1988, pp.1553-1556.

 

 

 

 

 

Kierownik projektów:

 

1986-1990:     CPBP 02.13: System automatycznego rozpoznawania ograniczonego    zespołu poleceń słownych.

1986-1990:     CPBR 7.1: cel 204. System rozpoznawania mowy w zastosowaniu do sterowania robotem.

1992-1993:     KBN 8 8618 91 02: Algorytmy i urządzenia do cyfrowego przetwarzania sygnałów mowy w diagnostyce medycznej i rehabilitacji.

1995-1997:     KBN 8 T11C 023 08:  Realizacja akustycznych baz danych na nośnikach typu CD-ROM.

1999-2001      KBN 8 T11E 022 17: System automatycznego rozpoznawania głosów ARG dla osób niewidomych.

 

Główny wykonawca projektów:

 

Międzynarodowe:

1993-1994:     Projekt Komisji Wspólnot Europejskich COST-232: Speech recognition over the telephone line.

1996-1999      Projekt finansowany przez Cooperative Research in Information Technology CRIT2: Computer analysis and synthesis of suprasegmental structures in communication systems, nr 20288.

 

Krajowe:

1992-1993:     KBN 3 3513 92 03: Modele generowania słów w zastosowaniu do automatycznego rozpoznawania mowy.

1995-1997      KBN 8 T11C 023 09: Komputerowa analiza i synteza struktur suprasegmentalnych w systemach dialogowych.

1995- 1996     KBN 8T11D 014 08: Wykorzystanie nowych metod łącznej analizy czasowo-częstotliwościowej (JTFA) do badania sygnałów.

1998-1999      KBN 8 T11D 014 13  -  Zastosowanie nowych metod cyfrowego przetwarzania sygnałów do analizy, klasyfikacji i kompresji sygnałów dźwiękowych.   

1998-2000      KBN 8 T11E 042 15: System rozpoznawania mowy dla komunikacji głosowej osób niewidomych z komputerem.

1999-2001     KBN 8T11D 029 16   Zmienność  i inwariancja w sygnale mowy oraz jego segmentacja.

2001-2003     KBN 7 T11C 009 21   System syntezy mowy ciągłej oparty na konkatenacji segmentów fonetyczno-akustycznych języka polskiego.

2004-2006            KBN  11 C 03827  Korpusowa metoda  generowania mowy polskiej oparta  na automatycznej selekcji suprasegmentalnych struktur sygnału

2006-2009            Technologie przetwarzania oraz rozpoznawania informacji słownych w systemach bezpieczeństwa wewnętrznego

 

Recenzje prac doktorskich:

 

1.            M.Sobczak, Informacja zależna od pozycji i predykcja położenia użytkownika w mobilnych systemach komputerowych, PP, 2004

2.            M.Kępiński, Kontekstowe związki cech w sygnale mowy polskiej, AGH, 2005

3.            K. Francuzik, Modelowanie iloczasu głoskowego na potrzeby syntezy mowy polskiej, UAM, 2006

4.            R.Rudnicki, Wybrane narzędzia automatycznego projektowania obwodów z przełączanymi prądami, PP, 2006

5.            T.Pałys, Zastosowanie metody grupowania sekwencji czasowych w riozpoznawaniu mowy na podstawie modeli Markowa, WAT, 2007

6.            J.Kociński, Poprawa zrozumialości mowy przy wykorzystaniu Ślepej Separacji Sygnałów, UAM, 2007

7.            P.Walendowski, Zastosowanie sieci neuronowych typu SVM do rozpoznawania mowy, PWr, 2008

8.            J.Gałka, Optymalizacja parametryzacji sygnału w aspekcie rozpoznawania mowy polskiej, AGH, 2008

9.            J.Strychowski, Analiza morfologiczna języka naturalnego z wykorzystaniem sztucznych sieci neuronowych, PP, 2008

 

 Recenzje prac habilitacyjnych:

 

1.            A. Przepiórkowski, Powierzchniowe przetwarzanie języka polskiego, IPI PAN, 2008

 

 Recenzje artykułów dla czasopism z listy filadelfijskiej:

 

1.            W.Wszolek, M.Kłaczyński, M.Modrzejewski, Study of effects of Surgical Treatment in the Larynx Area on the Speech Signal, Archives of Acoustics, 2008

2.            M. Mięsikowska, L.Radziszewski, S.Okła, A Visual Analysis of Speech Signal after Laryngectomy due to Cancer of the Larynx, Archives of Acoustics, 2008