Data i godzina: wtorek, 25 listopada 2025, 11:00
Prelegent: dr Marek Kubis, dr Michał Junczyk, Paweł Cyrta, dr Paweł Skórzewski, Uniwersytet Adama Mickiewicza
Streszczenie: Począwszy od roku 2023, można zaobserwować wyraźny trend polegający na wprowadzaniu w dużych modelach językowych możliwości pracy z innymi modalnościami takimi jak obraz i dźwięk, umożliwiając w ten sposób prowadzenie rozumowań opartych o zróżnicowane sygnały wejściowe. Głosowe modele językowe (Speech Language Models) oraz dźwiękowe modele językowe (LALM – Large Audio Language Models) to modele przystosowane do pracy z wejściem w postaci sygnału audio. Celem wystąpienia jest przedstawienie wyników badań wstępnych dotyczących rodziny dużych modeli językowych operujących na sygnale audio, którą opracowano dla języka polskiego.
Miejsce: B1-7/8 oraz online