Новости
12.04.2024
Поздравляем с Днём космонавтики!
08.03.2024
Поздравляем с Международным Женским Днем!
23.02.2024
Поздравляем с Днем Защитника Отечества!
Оплата онлайн
При оплате онлайн будет
удержана комиссия 3,5-5,5%








Способ оплаты:

С банковской карты (3,5%)
Сбербанк онлайн (3,5%)
Со счета в Яндекс.Деньгах (5,5%)
Наличными через терминал (3,5%)

РЕЗУЛЬТАТЫ ПРИМЕНЕНИЕ ТЕХНОЛОГИИ BIG DATA ДЛЯ АНАЛИЗА РЫНКА ТРУДА ИТ-СПЕЦИАЛИСТОВ

Авторы:
Город:
Мурманск
ВУЗ:
Дата:
18 сентября 2016г.

В мире к сегодняшнему дню накоплены колоссальные объемы данных в самых разных областях человеческой деятельности, причем часто это данные разнородные и их объем лавинообразно продолжат расти. Часть из этих данных, безусловно, устарела и не представляет никакой ценности, но большинство данных содержит потенциально полезную информацию, которую необходимо выявить и извлечь. Эта задача явилась предпосылкой к появлению так называемых Больших данных (Big Data) – совокупности подходов, методов и инструментов по работе с полным объемом разнородных явно не связанных между собой данных [2]. Большие данные находят все большее применение в самых разных областях. В данной работе предпринята попытка проанализировать рынок труда в ИТ-отрасли с помощью Big Data [1].

Анализ рынка труда – функция управления, предназначенная для изучения, систематизации, обобщения и оценки достигнутых результатов на рынке труда [3]. На основе полученных результатов анализа определяются узкие места в функционировании рынка, охарактеризовать его текущее состояние оцениваются тенденции его изменения и обосновываются управленческие решения.

1. Сбор данных для анализа рынка труда

Сбор данных осуществлялся со специализированных интернет-сайтов по трудоустройству:  superjob.ru  и  headhunter.ru.  Рассматривались  вакансии  и  резюме претендентов по всей России в профессиональной области «Информационные технологии, Интернет, телеком» за период с конца марта до начала апреля 2015 года. Для каждого из выбранных сайтов, а также отдельно для вакансий и резюме был настроен парсинг (синтаксический анализ сайтов), с помощью программы Datacol 5. В результате данные были объединены в два файла: отдельно информация по вакансиям и отдельно по резюме.

Были собраны данные о 1000 вакансий, которые включали следующую информацию: вакансия, требуемый опыт работы, сфера деятельности, заработная плата, город, тип занятости, график работы, образование, место работы, рабочая неделя, описание вакансии, дата размещения, URL-адрес.

Для анализа резюме были собраны данные о 10000 резюме, которые включали следующую информацию: должность, сфера деятельности, сведения о соискателе, пол, возраст, ключевые навыки, стаж работы, работа в организациях, занимаемые должности, образование, учебные заведения, знание иностранных языков, водительские права, семейное положение, наличие детей, готовность к командировкам, желаемый график работы, желаемый тип занятости, желаемая заработная плата, город, готовность к переезду, гражданство, разрешение на работу, желательное время в пути до работы, наличие фотографии, URL-адрес.

2. Анализ вакансий

 

Для анализа использовался сервис работы с большими данными IBM Watson Analytics (выбор был связан с тем, что бесплатный уровень использования программы является достаточным для решения поставленной задачи). Для анализа вакансий, воспользовавшись режимом Predict, целевыми переменными были определены: город, дата размещения, зарплата, образование, требуемый опыт.

При выборе целевой переменной «образование», в первом приближении, было получено 4 зависимых переменных: вакансия, сфера деятельности, место, график и рабочая неделя. При выборе целевой переменной «требуемый опыт работы» было получено 5 зависимых переменных: вакансия, место работы, сфера деятельности, график работы, место работы. Целевые переменные «город», «дата размещения» и «зарплата» не дали никаких зависимостей.

После проведенного анализа получены следующие результаты: 1) для работы на выезде в большинстве случаев опыт работы не требуется; 2) для работы на территории работодателя чаще всего требуется опыт работы от 1 года до 3 лет; 3) для администраторов БД, системных администраторов, а также работников в сфере поддержки и тестирования чаще всего требуется опыт работы от 1 года до 3 лет; 4) для программистов, разработчиков и менеджеров проектов в большинстве случаев требуется опыт работы от 3 до 6 лет; 5) для работы в сфере компьютерной безопасности, SEO и мультимедиа чаще всего требуется опыт работы более 6 лет; 6) для работы с CRM, ERP системами, банковским ПО, в сфере телекоммуникаций и электронной коммерции почти в большинстве случаев опыт работы не требуется; 7) для удаленной работы чаще требуются соискатели с высшим техническим образованием; 8) для работы на территории работодателя приветствуются специалисты с высшим образованием; 9) для работы на выезде требуется образование не ниже среднего; 10) ученая степень чаще всего приветствуется при удаленном графике работы; 11) большинство вакансий предлагают полный рабочий день на территории работодателя; 12) на пятидневный график работы как правило ищут сотрудников с высшим или высшим техническим образованием; 13) с графиком работы 5/2 ищут работников на полный рабочий день, а с графиком работы 6/1 предлагают работу с гибким графиком; 14) на удаленную работу чаще всего требуются работники в сфере программирования и разработки.

3. Анализ резюме претендентов

 

Для анализа резюме, воспользовавшись режимом Predict, целевыми переменными были определены: пол, возраст, образование, заработная плата, наличие фото, должность, водительские права, семейное положение, наличие детей.

Целевые переменные «возраст», «заработная плата» и «должность» не дали никаких зависимостей.

При выборе целевой переменной «пол», в первом приближении, было получено 7 зависимых переменных: тип занятости, наличие водительских прав, график работы, желательное время, стаж работы, семейное положение, наличие детей.

При выборе целевой переменной «образование» было получено 9 зависимых переменных: график работы, наличие водительских прав, желательное время в пути до работы, тип занятости, семейное положение, наличие детей, готовность к командировкам, стаж работы, готовность к переезду.

При выборе целевой переменной «наличие фото», в первом приближении было получено 5 зависимых переменных: готовность к командировкам, график работы, водительские права, желательное врем в пути до работы, тип занятости.

При выборе целевой переменной «водительские права», в первом приближении было получено 10 зависимых переменных: возраст, график работы, желательное время в пути до работы, тип занятости, готовность к командировкам, образование, стаж работы, пол, зарплата, готовность к переезду наличие фото.

При выборе целевой переменной «семейное положение», было получено 10 зависимых переменных: возраст, тип занятости, график работы, желательное время в пути до работы, стаж работы, образование, зарплата, готовность к командировкам, готовность к переезду, пол.

При выборе целевой переменной «наличие детей», было получено 10 зависимых переменных: возраст, тип занятости, график работы, желательное время в пути до работы, стаж работы, образование, зарплата, готовность к командировкам, готовность к переезду, пол.

По    итогам    проведенного    анализа    можно    сделать    следующие    выводы: 

1) женщины, как правило, ищут работу с неполным рабочим днем или со сменным графиком работы, мужчины же чаще всего ищут работу с полной занятостью; 2) в большинстве случаев работу ищут женатые мужчины и незамужние женщины; 3) мужчины предпочитают не указывать своё семейное положение и наличие детей; 4) как правило, претенденты с высшим образованием имеют детей, а с неполным высшим детей не имеют; 5) претенденты, которые не готовы к командировкам, как правило, не помещают свое фото в резюме, и наоборот; 6) претенденты, не имеющие прав, в большинстве случаев не помещают свое фото в резюме; 7) претенденты на проектную работу в большинстве случае помещают свое фото в резюме; 8) претенденты на частичную занятость и на работу вахтовым методом фотографию, как правило, помещают в свое резюме; 9) люди, претендующие на неполный рабочий день и сменный график работы, как правило, не имеют прав; 10) претенденты, готовые к переезду, как правило, имеют водительские права категории В, а не готовые к переезду прав не имеют; 11) временную работу или работу со сменным графиком выбирают люди, не состоящие в браке; 12) претенденты, имеющие стаж работы от 1 года до 7 лет, как правило, детей не имеют; 13) претенденты, размещающие фото в резюме, более заинтересованы во времени пути до работы; 14) претенденты, не имеющие детей, как правило не имеют прав, а претенденты с детьми в большинстве своем имеют права категории В или категории ВС.

4. Выводы по результатам исследования

 

Следует сразу оговориться, что полученные результаты носят предварительный характер, поскольку ставилась задача только оценить возможность применения Big Data для анализа рынка труда, что и подтвердилось результатами исследований.

В дальнейшем рамках настроенного парсинга можно собирать данные в любой или во всех отраслевых сферах с необходимой периодичностью. Все это позволит проводить мониторинг рынка труда, благодаря чему возможно не только охарактеризовать его текущее состояние, но и оценить тенденции изменения рынка труда.

Результаты анализа рынка труда позволят работодателям: а) принимать своевременные управленческие решения по организации работы на этом рынке; б) эффективно использовать трудовые ресурсы; в) выявлять причины, по которым прежние результаты в системе управления персоналом организации оказались неэффективными. Претендентам это даст возможность: а) оценивать свои возможности и перспективы на рынке труда; б) определять необходимость и направления повышения квалификации; в) выбирать наиболее выгодные и подходящие предложения. Государству это даст возможность выстроить грамотную политику по регулированию рынка труда.

При этом применение технологии Big Data имеет определенные трудности, связанные со сбором, обработкой и анализом информации. Информация на сайтах по трудоустройству не всегда является структурированной, хотя большинство специализированных интернет-ресурсов по поиску работы все же пытаются максимально упорядочить представленную информацию: распределяют все вакансии и резюме по категориям, предлагают воспользоваться встроенными фильтрами для более удобного поиска. Как минимум, на всех сайтах можно найти перечень вакансий по интересующей должности и региону. Некоторые сайты предлагают воспользоваться расширенным поиском, где можно для вакансий задать такие параметры как ключевые слова, профессиональная область, уровень заработной платы, требуемый опыт работы, тип занятости, график работы. Для поиска по резюме можно установить отбор по опыту работы, образованию, гражданству, желаемой зарплате, возрасту, наличию фотографии, полу, типу занятости, знанию языков и пр. Сложность анализа подобной информации заключается в том, что не все пользователи полностью заполняют необходимые сведения, в связи с чем появляются определенные «дыры» в данных, которые необходимо минимизировать и сгладить.

5. Выводы по применению технологии Big Data

 

Данная технология позволяет получать новые, «скрытые» знания о предметной области. Пользователям не нужно думать какой анализ необходим в том или ином случае и в каком виде представить полученные результаты, т. к. использование встроенных методов графического представления результатов позволяет упростить восприятие полученных данных и облегчить их интерпретацию.

Также можно выделить другие особенности применения технологии Big Data:

 ·           с помощью анализа невозможно выявить причинно-следственные связи, а можно только установить факт корреляции двух переменных;

·           этап подготовки данных является обязательным перед вычислениями, что повышает затраты на анализ; 

·           данные, полученные в результате сбора, подвержены различным шумам, что влияет на качество анализа;

·           важно отметить, что заранее нельзя определить какие данные необходимы для сбора, а какие не дадут никаких результатов;

·           результат обработки больших данных заранее неизвестен.

 Существенной трудностью использования принципов Big Data является выбор адекватных методов анализа. На сегодняшний день существует множество разнообразных методик анализа данных, в основе которых лежит инструментарий, заимствованный из статистики и информатики. В качестве примера можно привести такие методы как data mining, краудсорсинг, сетевой анализ, прогностическое моделирование, визуализация, кластерный анализ и пр. При этом постоянно продолжается работа над совершенствованием существующих методов, а также созданием новых методов.

 

 

Список литературы

 

 

1.      Качала В.В., Зайнулина Т.И. Подход к анализу рынка труда на базе технологий BIG DATA / Сборник научных трудов по итогам международной научно-практической конференции «Перспективы развития современных математических и естественных наук» (декабрь 2014 г.) Воронеж : Изд-во инновационного центра развития образования и науки, 2014. С. 62–64.

2.      Майер-Шенбергер В., Кукьер К. Большие данные. Революция, которая изменит то, как мы живем, работаем и мыслим. М. : Манн, Иванов и Фербер, 2014. 240 с.

3. Щербина В.В. Управление человеческими ресурсами: менеджмент и консультирование. М. : Независимый институт гражданского общества, 2004.  520 с.