Data wydarzenia:

Wykorzystanie zasobów ustrukturyzowanych w neuronowych modelach języka

Data i godzina: wtorek, 26 listopada godz. 11:00 – 12:00

Miejsce: B1-7/8 oraz online

Prelegent: mgr Michał Turski (UAM/Snowflake)

Streszczenie:

W ramach seminarium wygłoszę próbnie prezentację na obronę rozprawy doktorskiej. Jej tematem będą metody modelowania języka wykorzystujące informacje o strukturze dokumentu.

Większość badań w dziedzinie przetwarzania języka naturalnego koncentruje się na przetwarzaniu tekstu. Choć ten paradygmat jest bardzo skuteczny w wielu zastosowaniach, takich jak tłumaczenie maszynowe, automatyczne podsumowywanie i systemy dialogowe, nie potrafi w pełni wykorzystać bogactwa wielu dokumentów tworzonych przez i dla ludzi. Dokumenty przekazują znaczenie nie tylko przez warstwę tekstową, ale także poprzez swoją strukturę i cechy wizualne. W ramach prezentacji omówione zostaną rozwiązania rozszerzające modele języka o wykorzystanie informacji strukturalnych celem poprawy jakości przetwarzania dokumentów.