Jak czytać rynek pracy z tysięcy ofert? Pomaga AI i dobre dane

graficzna wizualizacja sieci powiązań - szpilki ze świecącymi łebkami połączonymi promieniami światła
Żeby zrozumieć zmiany na rynku pracy, trzeba umieć szybko i precyzyjnie klasyfikować oferty pracy.

Oferty pracy z Internetu to dziś jedno z najcenniejszych źródeł wiedzy o rynku pracy

Problem w tym, że są nieustrukturyzowane, różnorodne i bardzo liczne. Zespół Data Science IBE PIB pokazał, jak można je automatycznie porządkować i sensownie analizować.

W styczniu 2025 r. w „Journal of Official Statistics” ukazał się artykuł autorstwa Hermana Cherniaieva i Roberta Patera z IBE PIB, przygotowany we współpracy z Maciejem Beręsewiczem (Uniwersytet Ekonomiczny w Poznaniu) oraz Markiem Wydmuchem (Politechnika Poznańska). Publikacja dotyczy hierarchicznego klasyfikatora ofert pracy, który wykorzystuje model językowy typu transformer oraz oficjalne klasyfikacje zawodów i specjalności.

Czym jest hierarchiczny klasyfikator ofert pracy?

W praktyce chodzi o narzędzie, które potrafi automatycznie przypisywać internetowe oferty pracy do zawodów – zgodnie z pięciopoziomową strukturą krajowej klasyfikacji. Model został przetestowany na unikatowym połączeniu danych: ofertach z Internetu, danych administracyjnych oraz ręcznie kodowanych ogłoszeniach. Przygotowano też wersje dla 24 języków, co umożliwia analizy porównawcze między krajami.

Opracowany klasyfikator umożliwia automatyczne przypisywanie ofert pracy do zawodów i specjalności. Jest to szczególnie praktyczne, gdy korzysta się z dużych zbiorów danych oraz nowoczesnych modeli językowych typu transformer. Oszczędza ręcznego kodowania tysięcy ogłoszeń i żmudnej pracy „po jednym”.

Dlaczego to ważne?

Zawody są dobrym przybliżeniem realnych umiejętności, a to właśnie one zmieniają się najszybciej pod wpływem technologii, demografii i przemian społecznych. Automatyczne kodowanie ofert pracy usprawnia analizę dużych zbiorów danych, szczególnie w statystyce publicznej i administracji rynku pracy, gdzie ręczna praca nie skaluje się w czasie.

Dobrze uporządkowane oferty pracy to konkretna wiedza, która pomaga lepiej planować edukację i rozwój kompetencji.

Wyniki badań mają realne znaczenie dla polityki edukacyjnej i systemów kwalifikacji. Umożliwiają:

  • dokładniejsze monitorowanie zapotrzebowania na umiejętności;
  • szybszą aktualizację kwalifikacji i programów kształcenia;
  • identyfikację nowych i zanikających zawodów;
  • wzmacnianie systemów prognozowania umiejętności;
  • lepsze dopasowanie oferty edukacyjnej do potrzeb rynku pracy.

Autorzy zwracają też uwagę na jakość danych treningowych i testowych – kluczową w kontekście rosnącego wykorzystania metod sztucznej inteligencji w statystyce publicznej. Oprogramowanie i modele zostały udostępnione w formule open source, dzięki czemu mogą być dalej rozwijane przez instytucje statystyczne i badaczy rynku pracy.

Link do artykułu: https://journals.sagepub.com/doi/10.1177/0282423X251395400

Link do klasyfikatora: https://github.com/Robert594/paper-job-ads-classifier

Prace sfinansowano głównie w IBE PIB w ramach projektu Wspieranie funkcjonowania i doskonalenia Zintegrowanego Systemu Kwalifikacji (ZSK5), przy częściowym wsparciu Narodowego Centrum Nauki w projekcie OJALAB.

#FunduszeUE

Facebook
Twitter
LinkedIn