Data wydarzenia:

Czy sztuczna inteligencja zastąpi lektorów? Metody rozpoznawania mowy wygenerowanej przez algorytmy Text-to-Speech – analiza parametrów akustycznych na przykładzie mowy polskiej

Data i godzina: wtorek, 7 maja 11:00 – 12:00

Prelegent: prof. UAM dr hab. Roman Gołębiewski, mgr Jakub Bondek, mgr Eryk Kozłowski (Wydział Fizyki UAM)

Streszczenie: Odbierane przez nas treści, a w szczególności multimedia udostępniane w serwisach społecznościowych, są ostatnimi czasy pełne materiału audio wygenerowanego przez sztuczną inteligencję. Badanie w ramach tego projektu będzie poświęcone określeniu, czy na podstawie pewnego zbioru cech akustycznych mowy polskiej (takiej jak częstotliwość tonu krtaniowego, częstotliwości formantów, rozkład energii oraz ich pochodnych) jest możliwe stwierdzenie, czy dany materiał pochodzi od rzeczywistego mówcy, czy został wygenerowany sztucznie. Badanie będzie wymagało stworzenia korpusu mowy zawierającego oba typy wypowiedzi, wyznaczenie parametrów akustycznych oraz określenie progu różnicującego metodami statystycznymi lub z wykorzystaniem uczenia maszynowego.

Miejsce: B1-7/8 oraz online