Новости
12.04.2024
Поздравляем с Днём космонавтики!
08.03.2024
Поздравляем с Международным Женским Днем!
23.02.2024
Поздравляем с Днем Защитника Отечества!
Оплата онлайн
При оплате онлайн будет
удержана комиссия 3,5-5,5%








Способ оплаты:

С банковской карты (3,5%)
Сбербанк онлайн (3,5%)
Со счета в Яндекс.Деньгах (5,5%)
Наличными через терминал (3,5%)

РАЗРАБОТКА ИНТЕЛЛЕКТУАЛЬНОЙ ИНФОРМАЦИОННОЙ СИСТЕМЫ АНАЛИЗА ПОЛЬЗОВАТЕЛЕЙ СОЦСЕТИ

Авторы:
Город:
Самара
ВУЗ:
Дата:
06 ноября 2017г.

Анализ  социальных  сетей  (англ.  Social   network  analysis)  представляет  собой  исследование социальных сетей, рассматривающее социальные отношения в терминах теории сетей. В настоящее время анализ соцсетей стремительно набирает популярность, благодаря появлению онлайн-севисов таких как LiveJournal, Facebook, Twitter и др. С этим связан феномен социализации персональных данных: стали публично доступными биографии, переписка, дневники, фото, видео, аудиоматериалы, заметки о путешествиях и т.д. Таким образом, социальные сети являются уникальным источником данных о личной жизни и интересах реальных людей. Это открывает беспрецедентные возможности для решения исследовательских и бизнес-задач (многие из которых до этого невозможно было решать эффективно из-за не достатка данных), а также создания вспомогательных сервисов и приложений для пользователей социальных сетей. Кроме того, этим обуславливается повышенный интерес к сбору и анализу социальных данных со стороны компаний и исследовательских центров.

Сейчас, благодаря социальным сетям, в онлайне появляется много личной информации. Это дает большие перспективы для анализа данных. Большинство данных имеют личностный характер, по  ним можно определить многие характеристики, начиная от географического местоположения пользователя до его предпочтений в еде или любимого магазина. Эти данные можно использовать как в корыстных, так и бескорыстных целях.

При сопоставлении многих элементов информации можно выяснить много явно неуказанной информации.

Например, если у пользователя не указан город, но при этом состоит в нескольких группах в названии которых стоит слово “Самара”, то можно предположить что городом, в котором живёт пользователь, является Самара.

Также можно сопоставить интересы по названиям групп, например, у пользователя есть несколько групп со словами “велопробег”, “велосипеды”, “велоспрот”, то можно предположить, что данному пользователю интересны велосипеды и все что с ними связанно.

Метаданные – информация о другой информации, или данные, относящиеся к дополнительной информации о контенте или объекте. Метаданные раскрывают сведения о признаках и свойствах, характеризующих какие-либо сущности, которые позволяют автоматически искать и управлять ими в больших информационных потоках, например, в социальных сетях.

В метаинформацию, хранящуюся на серверах социальных сетей, входит информация, которую указал пользователь, а это:

−  пол;

−  дата рождения;

−  телефон;

−  друзья;

−  место работы;

−  номер школы или школ, в которых обучался пользователь, включая букву класса и года поступления и выпуска;

−  университеты, в которых обучался пользователь, включая факультет, год выпуска и поступления;

−  семейное положение;

−  родственники;

−  текущий город, указанный в профиле.

С помощью этих данных можно построить логическую цепочку, например, если выбранный пользователь учился в одном университете с анализируемым человеком, имеют одно и то же указанное направление подготовки и год выпуска, то можно предполагать с большой вероятностью, что данный и анализируемый пользователи были друзьями по университету.

Следует указать еще один аспект, связанный со спецификой соцсетей: зачастую пользователь либо

не предоставляет о себе информацию, либо предоставляет ложные сведения. Согласно исследованию ВЦИОМ, сообщать о себе недостоверные данные хотя бы однажды приходилось больше половины пользователей этих ресурсов (51%), причем наиболее часто искажается информация об имени и возрасте (по 29%), об увлечениях (22%), о половой принадлежности пользователя, музыкальных художественных пристрастиях (по 18%). Этот факт значительно усложняет задачу анализа интересов пользователей соцсетей.

База знаний - это не просто пространство для хранения данных, а инструмент искусственного интеллекта для принятия разумных решений. Различные методы представления знаний, включая фреймы и скрипты, представляют собой знания. Предлагаемые услуги - это объяснение, обоснование и разумная поддержка принятия решений.

Управление знаниями содержит ряд стратегий, используемых в организации для создания, представления, анализа, распространения и включения опыта. Основное внимание уделяется конкурентным преимуществам и повышению эффективности работы организаций.

Дерево решений - это один из самых популярных и эффективных алгоритмов машинного обучения. Он может выполнять классификацию, регрессию, ранжирование, оценку вероятности, кластеризацию. Дерево решений не является черным ящиком, и его результаты легко интерпретировать. Данные не обязательно должны быть нормализованы или специально подготовлены. Это интуитивно, и даже ребенок может понять основы того, как работают деревья решений. Они также широко применяются на практике, особенно с ансамблями (несколько деревьев решений, например, случайные леса). Все это делает их идеальным алгоритмом, который начинается с машинного обучения.

Дерево решений для установления интересов пользователя. Переменные:

ГрупИмя – Название группы в которой состоит пользователь. Интер – Предпологаемый интерес пользователя

Условия:

1)    ЕСЛИ ГрупИмя = “*суши*”, ТО Интер += “Китайская кухня”

2) ЕСЛИ ГрупИмя = “*велосипеды*” или ГрупИмя = “*scott*” или ГрупИмя = “*велоспорт*”, ТО Интер

+= “Велосипеды”

3)    ЕСЛИ ГрупИмя = “*пицца*” или ГрупИмя = “*pizza*”, ТО Интер += “Пицца”

4)    ЕСЛИ ГрупИмя = “*wedding*” или ГрупИмя = “*свадьба*” или ГрупИмя = “*свадебные*”, ТО Интер

+= “Свадьба”

Данные условия ИИС использует для определения интересов пользователя, ниже на рисунке 1 представлено дерево решений для данного набора правил.


В результате проделанной работы, создано дерево решений для определения интересов пользователя. Так же используя данный подход можно спроектировать деревья решений для поиска: города пользователя, тех пользователей которые учились в той же школе или университете что и анализируемый пользователь.

 

Список литературы

 

1)     Базенков, Н. И. Обзор информационных систем анализа социальных сетей [Текст] / Н. И. Базенков, Д. А. Губанов // Управление большими системами: сборник трудов. - 2013. -№ 41. - С. 357 - 365.

2)   Ву, М. Азы социально-сетевого анализа (Social Network Analysis 101) [Электронный ресурс] / Майкл Ву, - Электрон. текстовые дан. – Москва: [б. и.], 2012, Режим доступа : https://habrahabr.ru/company/darudar/blog/139911/, свободный. – Загл. с экрана.

3)     Каракулов, М. Граф интересов (Interest graph): новый принцип взаимодействия в сети [Электронный ресурс] / Максим Каракулов, - Электрон. текстовые дан. – Москва: [б. и.], 2011, Режим доступа : https://geektimes.ru/post/129488/, свободный. – Загл. с экрана.