Data i godzina: wtorek, 19 listopada godz. 11:00 – 12:00
Miejsce: B1-7/8 oraz online
Prelegent: dr Cezary Rosiński, mgr Dariusz Perliński (Instytut Badań Literackich PAN)
Streszczenie:
Bibliografie dziedzinowe poddawane są ciągłym przemianom, które mają na celu dostosowanie ich do zmieniający się potrzeb środowiska naukowego. Bibliografie dziedzinowe ciągle odgrywają istotną rolę w procesach badawczych, choć nie stanowią już jedynego źródła informacji. Drukowane tomy bibliografii dziedzinowych zostały zastąpione bibliograficznymi bazami danych, które zmuszone są konkurować z wielodziedzinowymi, prywatnymi bazami danych.
Sztuczna inteligencja wkracza w ten obszar jako potężne narzędzie, które może zrewolucjonizować sposób tworzenia, zarządzania i wykorzystywania bibliografii dziedzinowych. Na seminarium omówione zostanie wykorzystanie nowoczesnych technologii przetwarzania języka naturalnego (NLP) do zadań klasyfikacji tekstu oraz rozpoznawania nazwanych encji (NER). Przybliżone zostaną możliwości, jakie oferują narzędzia, takie jak Transformers, PyTorch, Datasets oraz Sklearn i Pandas, w automatyzacji analizy tekstów w języku polskim.
Dane bibliograficzne zostaną jednocześnie potraktowane jako dane treningowe i będą stanowić przykład tego, jak bibliografie dziedzinowe mogą wspomagać rozwój narzędzi AI. Bazy danych oparte na wysokiej jakości bibliografiach dostarczają AI ogromnej ilości starannie opracowanych informacji. Wystąpienie ma na celu ukazanie synergii między AI a bibliografiami dziedzinowymi.