Oferty pracy z Internetu to dziś jedno z najcenniejszych źródeł wiedzy o rynku pracy
Problem w tym, że są nieustrukturyzowane, różnorodne i bardzo liczne. Zespół Data Science IBE PIB pokazał, jak można je automatycznie porządkować i sensownie analizować.
W styczniu 2025 r. w „Journal of Official Statistics” ukazał się artykuł autorstwa Hermana Cherniaieva i Roberta Patera z IBE PIB, przygotowany we współpracy z Maciejem Beręsewiczem (Uniwersytet Ekonomiczny w Poznaniu) oraz Markiem Wydmuchem (Politechnika Poznańska). Publikacja dotyczy hierarchicznego klasyfikatora ofert pracy, który wykorzystuje model językowy typu transformer oraz oficjalne klasyfikacje zawodów i specjalności.
Czym jest hierarchiczny klasyfikator ofert pracy?
W praktyce chodzi o narzędzie, które potrafi automatycznie przypisywać internetowe oferty pracy do zawodów – zgodnie z pięciopoziomową strukturą krajowej klasyfikacji. Model został przetestowany na unikatowym połączeniu danych: ofertach z Internetu, danych administracyjnych oraz ręcznie kodowanych ogłoszeniach. Przygotowano też wersje dla 24 języków, co umożliwia analizy porównawcze między krajami.
Opracowany klasyfikator umożliwia automatyczne przypisywanie ofert pracy do zawodów i specjalności. Jest to szczególnie praktyczne, gdy korzysta się z dużych zbiorów danych oraz nowoczesnych modeli językowych typu transformer. Oszczędza ręcznego kodowania tysięcy ogłoszeń i żmudnej pracy „po jednym”.
Dlaczego to ważne?
Zawody są dobrym przybliżeniem realnych umiejętności, a to właśnie one zmieniają się najszybciej pod wpływem technologii, demografii i przemian społecznych. Automatyczne kodowanie ofert pracy usprawnia analizę dużych zbiorów danych, szczególnie w statystyce publicznej i administracji rynku pracy, gdzie ręczna praca nie skaluje się w czasie.
Dobrze uporządkowane oferty pracy to konkretna wiedza, która pomaga lepiej planować edukację i rozwój kompetencji.
Wyniki badań mają realne znaczenie dla polityki edukacyjnej i systemów kwalifikacji. Umożliwiają:
- dokładniejsze monitorowanie zapotrzebowania na umiejętności;
- szybszą aktualizację kwalifikacji i programów kształcenia;
- identyfikację nowych i zanikających zawodów;
- wzmacnianie systemów prognozowania umiejętności;
- lepsze dopasowanie oferty edukacyjnej do potrzeb rynku pracy.
Autorzy zwracają też uwagę na jakość danych treningowych i testowych – kluczową w kontekście rosnącego wykorzystania metod sztucznej inteligencji w statystyce publicznej. Oprogramowanie i modele zostały udostępnione w formule open source, dzięki czemu mogą być dalej rozwijane przez instytucje statystyczne i badaczy rynku pracy.
Link do artykułu: https://journals.sagepub.com/doi/10.1177/0282423X251395400
Link do klasyfikatora: https://github.com/Robert594/paper-job-ads-classifier
Prace sfinansowano głównie w IBE PIB w ramach projektu Wspieranie funkcjonowania i doskonalenia Zintegrowanego Systemu Kwalifikacji (ZSK5), przy częściowym wsparciu Narodowego Centrum Nauki w projekcie OJALAB.
#FunduszeUE