Разработка программной системы выявления мнений пользователей социальных сетей - Программирование, компьютеры и кибернетика дипломная работа

Главная

Программирование, компьютеры и кибернетика
Разработка программной системы выявления мнений пользователей социальных сетей

Анализ методов и средств выявления мнений пользователей социальных сетей. Обзор средств мониторинга и анализа, подбор необходимого программного обеспечения и технических средств. Разработка архитектуры базы данных, реализация программных модулей.

посмотреть текст работы

скачать работу можно здесь

полная информация о работе

весь список подобных работ

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

программный пользователь технический архитектура
С появлением и развитием глобальной сети Интернет стали появляться разнообразные сайты, количество которых с каждым днём постоянно растёт. Существуют различные сайты на определённые тематики. Любой человек может найти информацию, в которой он нуждается. Сейчас в интернете есть множество хорошо оформленных, красочных и привлекательных сайтов. В зависимости от размера и функциональности сайты можно разделить на: промо-сайт, сайт компании, интернет-магазин, корпоративное представительство и интернет порталы и другие. Среди большинства сайтов в последние годы развитие и популярность набирают социальные сети.
Социальная сеть - это сайт, онлайн-сервис, разработанный с целью собрать людей с общими интересами, возможность пользователей самостоятельно публиковать и обмениваться информацией о себе и общаться между собой, а также выкладывать фотографии, видеозаписи и прочие медиафайлы.
Понятие «социальная сеть» появилось еще до появления Интернета и соответственно до современных интернет-сетей. Данный термин ввёл британский социолог Джеймс Барнс в 1954 году. Во второй половине 20 века этот термин стал применяться в европейских странах при исследованиях человеческих отношений и социальных связей, а сам термин стал общеупотребительным. Спустя некоторое время в социальной сети стали рассматривать не только людей, как представителей общества, но и прочие объекты, которые могут иметь различные социальные связи, такие как фирмы, города, сайты и т.п. [1].
Первыми социальными сетями стали группы людей, которые использовали для создания социальных сетей средства компьютерного общения, которыми стала электронная почта. Первыми, кто отправил сообщение на удалённый компьютер, стали военные в сети ARPA Net. Чуть позже была изобретена технология интернет-чата, позволяющая общаться пользователям в реальном времени. Это послужило толчком к созданию сети Интернет и появлению первых социальных сетей [2].
Глобальная сеть Интернет была создана в 1991, что поспособствовало появлению первых интернет-страниц, следовательно, это открытие стало следующим шагом к развитию современных социальных сетей.
Первопроходцем среди социальных сетей следует считать Classmates.com. Данный сайт предоставил возможность пользователям общаться с одноклассниками и близкими людьми. Сегодня эта сеть до сих пор пользуются популярностью, а численность составляет более полумиллиона людей. Однако началом популярности социальных сетей стоит считать начало двадцатого века, когда на просторах Интернета появился Facebook, который за последующие года становится самой популярной в мире сетью [3].
В современном Интернете существует множество различных социальных сетей. Для упорядочивания их можно классифицировать на несколько типов. К примеру, сети различают по доступности: есть открытые, закрытые и смешанные. Большинство сетей являются открытыми, в них пользователь не имеет никаких ограничений и барьеров. Он может посмотреть любую интересующую для себя информацию об определенном человеке или какой-либо группе. Закрытыми же являются такие сети, которые не считают нужным распространять информацию для публики, а доступ имеют лишь ограниченная часть пользователей. Смешанной сетью можно назвать нечто средним между открытой и закрытой сетью, так как задача данного вида состоит в том, чтобы привлечь как можно больше людей, но при этом не ко всем функциям они будут иметь доступ.
Социальные сети оказывают огромное влияние на жизнь людей, хотя некоторые даже не подозревают масштабы этого явления, а ведь социальные сети стали самым популярным занятием в Интернете. По статистике самыми посещаемыми сайтами в мире являются именно классические социальные сети. Их используют компании в работе, а больше половины людей доверяют информации, расположенной там.
На данный момент социальные сети являются огромным источником информации о сотнях миллионов человек со всех уголков планеты. Они предлагают пользователю указать почти всё о себе, начиная от личных данных и заканчивая своими предпочтениями в искусстве, образовании, месте работы и мировоззрением.
В последнее время помимо источника информации о пользователях социальные сети становятся платформой для обсуждения глобальных и нашумевших тем общества. Создаются специальные группы, страницы, в которых выносится проблема для того чтобы выяснить личные мнения людей и узнать их оценку.
Целью выпускной квалификационной работы является разработка программной системы выявления мнений пользователей социальных сетей для анализа и проведения поиска комментариев по обсуждаемым темам с целью исследования мнений людей и их отношения к предлагаемой теме. Основными функциями разрабатываемой системы будут поиск комментариев на предложенную тему, и подсчет, каких отзывов будет больше отрицательных или положительных, либо нейтральных.
1 . Анализ методов и средств выявления мнений пользователей социальных сетей
В настоящий момент существует два, отличающихся друг от друга, подхода к мониторингу социальных сетей: мониторинг с использованием ручного труда и с использованием автоматизированных систем.
Первый подход почти ничем не отличается от классического мониторинга - группа сотрудников просматривает список тем и обсуждений той или иной социальной сети, по которым производится поиск, заказанный клиентом. Далее группа формирует отчет, в который входят фрагменты либо целые копии публикаций с найденными темами и запросами, и отправляется заказчику. Такая процедура производится ежедневно. Чем больше объем информации требуется исследовать, тем больше сотрудников надо будет привлекать для выполнения поставленной задачи. Отсюда основным недостатком метода будет являться высокая стоимость выполняемых работ, которая напрямую зависит от количества информации, а также большие затраты времени.
Автоматизированные системы мониторинга в свою очередь, берут на себя весь процесс мониторинга, ведения статистики и формирований отчетов. Преимуществом таких систем будут являться низкие временные и денежные затраты, а также отсутствие трудовых затрат. Мониторинг включает в себя анализ огромного объема информации, однако, для нахождения более точных и точечных данных требуется использовать дополнительно интеллектуальный анализ текста, такой как text mining [4].
На сегодняшний день в социальных сетях находится огромное колич ество информации, существует много различных страниц и сообществ, но для поиска мнений и комментариев необязателен анализ всей сети, а только конкретная часть.
Технология Text mining занимается извлечением информации из неструктурированного текста, то есть производится глубинный анализ. Эта технология позволяет «просеивать» большие объемы информации и выявлять только ключевую и наиболее значимую информацию, что является задачей text mining. Подобная технология незаменима для извлечения знаний и играет большую роль в системе управления знаниями.
Основными же задачами являются: классификация, автоматическое реферирование и кластеризация.
Классификация - это системное распределение изучаемых предметов к определенному классу (кластеру) с заранее известными признаками. В современных системах классификация применяется, например, в таких задачах: группировка документов, размещение документов в определенные папки.
Автоматическое реферирование - составление кратких изложений материалов, аннотаций, т.е. извлечение наиболее важных данных из нескольких документов, и генерация на их основе лаконичных и информационно емких отчетов. Есть много путей для решения задачи реферирования. Они подразделяются на два направления: квазиреферирование и краткое изложение содержания документа.
Квазиреферирование основано на выделении фрагментов документов, то есть нахождение наиболее информативных фраз и формирование из них квазирефератов. Краткое изложение содержания документа, в свою очередь, основывается на выделении из текста более полезной информации и порождении новых текстов, содержательно обобщающие первичные документы.
Кластеризация - это разбиение множества документов на кластеры. Если данные выборки представить как точки в признаковом пространстве, то задача кластеризации сводится к определению «сгущений точек». Цель кластеризации - поиск существующих структур.
Кластеризация является описательной процедурой, она не предоставляет никаких статистических выводов, но дает возможность провести анализ и изучить структуру данных. Кластеризация широко применяется при реферировании больших документальных файлов, выявления дубликатов или близких по содержанию документов.
Применение технологии text mining предполагает наличие инструмента, который способен выделить из огромного текста только нужные элементы. Работа технологии заключается в следующем: на вход подается интересующий текст, а на выходе пользователь получит информацию в структурированном виде. Структуры могут представлять собой как простые сущности, так и сложные. Text mining дает возможность автоматически собирать результаты своей работы в коллекции данных, пригодные для проведения анализа.
Анализировать такие коллекции данных, несомненно, намного проще и быстрее, чем результаты, найденные с помощью поисковика. Однако и здесь требуются усилия по интеграции средств text mining с источниками документов, поисковиком и инструментами. Сегодня поставщики инструментов text mining снабжают свои продукты возможностями интеграции с источниками документов, в основном с веб-ресурсами, и с базами данных через файлы в формате XML. Предоставляется также набор SDK, применение которого подразумевает довольно дорогую дальнейшую разработку. Однако главной проблемой использования таких технологий является сложность настройки и поддержки работоспособности таких инструментов. Это обусловлено спецификой компьютерной лингвистики и семантики. Как правило, простые пользователи в отличие от разработчиков далеки от знаний этих материй, а в итоге возможности таких инструментов используются лишь на 5-10%.
Тем не менее, пользователю уже нет необходимости вручную просматривать большое количество документов и подбирать ключевые слова. За него это делает система. Появляются дополнительные возможности автоматической классификации и сопоставления похожих документов. Кроме того, программа способна сама распознавать смысловые элементы текста, например факты, события, и передавать их на последующую обработку.
Применение технологии text mining. Этот подход подразумевает наличие поисковой системы, которая используется как основополагающее средство в работе с неструктурированной информацией.
Аналитик производит ввод ключевых слов, обрабатывает ссылки, получает документ, просматривает содержание, выбирает нужную информацию, загружает ее в программу анализа или базу данных и генерирует отчет. Производительность этой работы может составлять от пятиста до тысячи статей в сутки в зависимости от опыта аналитика. Это очень объемный и тяжкий труд, сравнимый с работой на рудниках. Человек, в основном, здесь занят рутинными операциями, вследствие чего не имеет возможности уделять внимания интеллектуальной работе.
Главными преимуществами такого подхода являются: распространенность и общедоступность поисковых технологий. Это так называемое решение одного клика, когда набирается ключевое слово, производится поиск и в итоге появляется необходимая информация.
Поскольку инструменты поиска уже давно довольно успешно развиваются и достигли высокой стадии, то они весьма успешно отвечают на вопрос, где находится информация. Пользователи Интернета давно уже привыкли к поисковикам, что нет необходимости проводить какое-либо специальное обучение.
Однако если же речь заходит об обработке больших массивов данных, то применение поисковых систем становится малоэффективным, так как требует значительных человеческих ресурсов на этапах «добычи» фактов и их анализа.
В силу инерции мышления многие простые пользователи с недоверием относятся к тому, что машина может оперировать понятиями фактов, событий, персон, организаций и т.п. Это является основной причиной, которая заставляет пользователей отказываться от технологий text mining и они начинают загружать себя ручной обработкой результатов поиска. Существуют, несомненно, и объективные трудности. Методы text mining должны быть адаптированы к предметной области, что нередко требует временных и прочих ресурсов. Некоторые типы текстов (например, художественная литература, профессиональный и иной сленг) плохо поддаются машинной обработке. Несмотря на это технология text mining является наиболее полезнее, чем ручная обработка текста [5].
Таким образом, технология text mining является очень эффективной для добычи полезной и нужной информации из огромного объема целого текста. Со временем применение данной технологии будет только расширяться, так как на просторах Интернета каждый день появляются объемы доступной и полезной информации, а потребность в её анализе по-прежнему не удовлетворена.
1.2 Обзор средств мониторинга и анализа
TweetDeck - это клиент для работы с популярными социальными сетями, разработанный компанией Twitter в 2008 году на языке C++. Программа представляет собой сервис, который обеспечивает доступ нужной информации большинства социальных сетей и позволяет исследовать и проводить мониторинг лент сообщений, твитов, откликов и комментариев пользователей.
Программа обладает понятным и гибким интерфейсом, а дизайн TweetDeck разработан удобно в том плане, что разделен на несколько колонок, в которых очень просто можно отслеживать интересующие пользователя новости, а также искать свежую информацию. Преимуществами этого сервиса можно назвать: поддержку популярных социальных сетей, большой набор функционала, обновление информации в режиме реального времени [6].
TweetDeck очень удобен в плане уведомлений о конкретных новых сообщениях. Он позволяет отследить появление новых откликов пользователей с помощью всплывающих оповещений. Также имеются различные методы мониторинга, позволяющие найти определенные новости, темы и обсуждения.
В целом, программа TweetDeck хорошо подходит для поиска и отбора нужной информации о мнениях и сообщениях пользователей, однако, не существует русскоязычной версии, что затрудняет использование. Также для применения всего функционала требуется приобретение полной версии данного приложения, которое не является бесплатным, а в бесплатной версии предоставлен доступ далеко не ко всем функциям.
Система PolyAnalyst предназначена для глубокого всестороннего анализа текстовых и структурированных данных. Данная программа представляет собой уникальный набор инструментов и алгоритмов, способствующих получить полезные и точные знания из большого количества текстовых и неструктурированных данных.
Программой PolyAnalyst производится полный анализ данных, который включает в себя полный цикл от загрузки данных и интеграции для моделирования и отчетности. Программа входит в число коммерческих продуктов, в котором реализованы алгоритмы text mining - анализа текстовой информации, а также является одной из мощных систем data mining в мире.
Data mining - метод обнаружения информации неизвестных и полезных знаний, которые необходимы для принятия правильного решения в различных сферах деятельности.
Анализ данных включает в себя полный цикл от загрузки данных и интеграции для моделирования и отчетности, PolyAnalyst предлагает широкий выбор алгоритмов для автоматического анализа текста и структурированных данных. Многочисленный анализ данных в задачах различных областей, легко решается посредством программы PolyAnalyst [7].
Система позволяет пользователям выполнять операции:
5) Нахождение ключевых слов и поиска смысла;
Программа постоянно развивается, и появляются новые, наиболее эффективные алгоритмы и способа извлечения полезной информации из текстов.
WEKA - это программное обеспечение для анализа данных, являющееся продуктом университета Уайкато (Новая Зеландия), впервые выпущенная в 1997 году. WEKA является распространяемым программным пакетом с открытым исходным кодом для анализа данных, который помогает эффективно использовать информацию из различных источников информации. Система предоставляет возможность напрямую применять алгоритмы для решения задач интеллектуального анализа.
Цели проекта - создание среды для разработки методов обучения и применения их к реальным данным, сделать методы обучения доступными для общего применения. Предполагается, что с помощью данной среды пользователь может использовать методы для извлечения нужных для него знаний непосредственно из текста достаточного большого объёма. Пользователями WEKA являются исследователи в области машинного обучения и прикладных наук. Она также широко используется в учебных целях. WEKA содержит средства для предварительной обработки данных, классификации, регрессии, кластеризации, отбора признаков, поиска ассоциативных правил и визуализации. WEKA хорошо подходит для разработки новых подходов в машинном обучении.
WEKA - это продукт, развиваемый мировым сообществом, и свободно распространяющийся под лицензией GNU GPL. Программное обеспечение написано целиком на Java. Исходные данные представлены в виде матрицы признаковых описаний объектов. WEKA дает возможность доступа к SQL-базам через базы данных Java и в качестве входных данных может принимать результат SQL-запроса [8].
Информационно-аналитическая система «Медиалогия»
«Медиалогия» - первая в России автоматическая система мониторинга и анализа, которая осуществляется в реальном времени. Создание этой системы датируется 2003 годом. Стоит отметить, что эта система работает в круглосуточном режиме работы, а непрерывную работоспособность обеспечивают более сотни сотрудников. К ним относятся: программисты, разработчики, аналитики, эксперты в области средств массовой информации и лингвисты.
Система состоит из базы данных и автоматизированного аналитического модуля, позволяющий проводить анализ по качественным и количественным характеристикам за любой выбранный период времени. Результаты анализа сразу же выводятся.
С системой «Медиалогия» взаимодействуют службы коммерческих организаций и государственных учреждений. Работа позволяет осуществить круглосуточный контроль информационного поля, а также предоставляет возможность выгружать нужную информацию в традиционный формат мониторинга и проводить ежемесячный анализ с результатами в табличной и графической формах. «Медиалогия» предоставляет возможность моментально строить отчеты. Результаты отчетов представляются в удобном для последующих принятий решений виде, таких как графики и диаграммы, карты и списки сообщений.
Большие возможности фильтрации информации позволяют настроить мониторинг практически под любую поставленную задачу. Суть технологии заключается - в предварительной обработке сообщений по множеству параметров и моментальном предоставлении наглядных отчетов по запросу пользователя [10].
Все рассмотренные выше системы имеют ряд недостатков. Такие продукты как «PolyAnalyst», «Медиалогия» и подобные им системы в основе своей ориентированы на бизнес и преследуют коммерческие цели. Зарубежные системы не учитывают синтаксис русского языка и направлены в основном на иностранных пользователей. Они ко всему прочему имеют довольно высокую стоимость, а бесплатные версии, в свою очередь, не предоставляют доступ ко всему функционалу программы и алгоритмам нахождения информации, что значительно снижает эффективность для поиска ответов и комментариев пользователей.
Программная система выявления мнений пользователей социальных сетей направлена, в первую очередь, на исследовательские цели, учитывает синтаксис русского текста и гораздо более доступна для пользователей.
2 . Разработка архитектуры базы данных
2.1 Описание предметной области и выделение информационных объектов
Разрабатываемая система выявления мнений пользователей социальных сетей, предусмотрена для проведения поиска тем и обсуждений сайта «Вконтакте» с целью исследования информационного поля по количественным и качественным параметрам включая: количество упоминаний в главной роли, оценку позитивного, негативного или нейтрального характера упоминаний.
Система должна использовать базу данных, в которой должны находиться все необходимые нам таблицы с данными (словари, список пользователей, и др.). В таблицах словарей будут содержаться оценочные слова и их веса, используемые при анализе текста полученного нами. Распределение качественности параметра проанализированного текста может быть представлено по стандартной шкале: позитивный, нейтральный, негативный. При этом можно будет использовать более расширенную шкалу, включающую больше градаций.
После проведения поиска и анализа производится вывод отчета по количественным и качественным параметрам, оценку позитивного, негативного или нейтрального характера упоминаний. Должна предусматриваться возможность сохранения результатов для последующего быстрого доступа к ним без проведения повторного исследования. Вывод отчетов необходимо сделать как в текстовой, так и в графической форме.
Проведя анализ предметной области и требований к разрабатываемой системе, было принято решение об организации набора баз данных. Состав информационного обеспечения представлен в таблице 2.1.
Таблица 2.1. Состав информационного обеспечения
Название информационного объекта (ИО)
Содержит информацию о пользователях системы.
Содержит информацию о словах для оценки мнения.
Содержит информацию о результатах анализа.
Содержит информацию о хранении информации о темах, которые нужно проанализировать.
Функциональные зависимости реквизитов представлены в таблице 2.2.
Таблица 2.2. Функциональные зависимости реквизитов
Разделение всех реквизитов информационных объектов на группы описательных и ключевых и установление между ними соответствия представлено в таблице 2.3.
Таблица 2.3. Соответствие описательных и ключевых реквизитов
Количество позитивных слов Количество нейтральных слов
Различают следующие уровни логической модели, каждая из которых отличается глубиной представления информации о данных:
1) диаграмма сущность-связь представляет собой модель данных верхнего уровня (рисунок 4.1). Она включает сущности и взаимосвязи, отражающие основные бизнес-правила предметной области.
Рисунок 2.1. Диаграмма сущность-связь
2) модель данных, основанная на ключах (рисунок 2.2). Данная модель предполагает уже более подробное представление данных и включает описание всех сущностей и первичных ключей.
Рисунок 2.2. Модель данных, основанная на ключах
3) полная атрибутивная модель (рисунок 2.3). Это наиболее детальное представление данных. Данная модель представляет данные в третьей нормальной форме и включает все сущности, атрибуты и связи.
Рисунок 2.3. Полная атрибутивная модель
Описание структуры реляционных таблиц представлено в таблице 2.4.
Таблица 2.4. Описание таблиц реляционной базы данных
Физическая модель данных представлена на рисунке 2.4.
Рисунок 2.4. Физическая модель данных
Требуется разработать систему мониторинга социальной сети «ВКонтакте», которая будет давать возможность осуществлять поиск комментариев по заданной теме, а также выводить подробные отчеты о проведенном анализе, сохранять всю информацию на жестком диске для его дальнейшего использования в системе.
Система выявления мнений пользователей социальных сетей должна обеспечивать следующие функции:
1) выполнять поиск мнений и комментариев по определенной теме или проблеме;
2) анализировать результат для определения количественных и качественных параметров;
3) отображать результаты по анализу в отчетах и графиках.
Система должна учитывать задачи следующих групп пользователей:
1) следить за работоспособностью системы (программных модулей, файлов, базы данных);
2) поддерживать наполнение базы данных в актуальном состоянии;
Пользователи должны иметь возможность:
1) просматривать результаты анализа тем;
2) генерировать графики и отчеты тем;
2. 5 Разработка архитектуры программного средства выявления мнений пользователей социальных сетей
Система выявления мнений пользователей социальных сетей - это клиент-серверная система. Весь программный комплекс размещается на сервере, данные хранятся в базе данных на этом же сервере. Пользователь, являющийся клиентом такой системы, использует на своем рабочем месте только стандартизированную программу интернет браузер, при помощи которой он будет взаимодействовать с системой, посредством выполнения определенных команд на сервере. Связь оператора с сервером осуществляется средствами международной сети Интернет. Такая модель распределения нагрузки называется модель сервера приложений (Application Server - AS). Такая модель сервера является расширением двухуровневой модели и в нее вводится дополнительный промежуточный уровень между клиентом и сервером.
Архитектура «клиент-сервер» определяет общие принципы организации взаимодействия в сети, где имеются серверы, узлы-поставщики некоторых специфичных функций (сервисов) и клиенты, потребители этих функций.
Практические реализации такой архитектуры называются клиент-серверными технологиями. Каждая технология задает собственные или использует действующие правила взаимодействия между клиентом и сервером, которые называются протоколом обмена. [10]
Архитектура модели сервера приложений приведена на рисунке 2.5.
Рисунок 2.5. Модель сервера приложений
В этой модели компоненты приложения делятся между тремя исполнителями:
Клиент обеспечивает логику представления, включая графический пользовательский интерфейс, локальные редакторы; клиент может запускать локальный код приложения клиента, который содержит обращения к локальной базе данных, расположенной на компьютере-клиенте. Клиент исполняет коммуникационные функции пользовательского интерфейса части приложения, обеспечивающие доступ клиенту в локальную или глобальную сеть. Дополнительно реализация взаимодействия между клиентом и сервером может включать в себя управление распределенными транзакциями, что соответствует тем случаям, когда клиент также является клиентом менеджера распределенных транзакций.
Серверы приложений составляют новый промежуточный уровень архитектуры. Они спроектированы как исполнения общих незагружаемых функций для клиентов. Серверы приложений поддерживают функции клиентов как частей взаимодействующих рабочих групп, поддерживают сетевую доменную операционную среду, хранят и исполняют наиболее общие правила бизнес-логики, поддерживают каталоги с данными, обеспечивают обмен сообщениями и поддержку запросов, особенно в распределенных транзакциях.
Серверы баз данных в этой модели занимаются исключительно функциями системы управления базами данных: обеспечивают функции создания и ведения базы данных, поддерживают целостность реляционной БД, обеспечивают функции хранилищ данных. Кроме того, на них возлагаются функции создания резервных копий и восстановления базы данных после сбоев, управления выполнением транзакций и поддержки устаревших (унаследованных) приложений.
Отметим, что эта модель обладает большей гибкостью, чем двухуровневые модели. Наиболее заметны преимущества модели сервера приложений в тех случаях, когда клиенты выполняют сложные аналитические расчеты над базой данных, которые относятся к области OLAP-приложений. В этой модели большая часть бизнес-логики клиента изолирована от возможностей встроенного SQL, реализованного в конкретной СУБД, и может быть выполнена на стандартных языках программирования, таких как С, C++. Это повышает переносимость системы, ее масштабируемость.
Функции промежуточных серверов могут быть в этой модели распределены в рамках глобальных транзакций путем поддержки протокола, который поддерживается большинством поставщиков СУБД [11].
AS-модель в наибольшей степени отражает сильные стороны технологии «клиент / сервер»:
1) четкое разграничение логических компонентов приложения;
2) возможность баланса загрузки между несколькими серверами;
3) значительное снижение трафика между клиентом и сервером приложений, дающее возможность работы по медленным линиям связи;
4) высокий уровень защиты данных, т.к. они являются «спрятанными» за сервисами приложения, в которые можно встроить проверку полномочий клиента;
5) возможность использования в качестве клиентской части приложения стандартного браузера;
6) упрощение процесса обновления программного обеспечения.
Процесс генерации динамических страниц происходит следующим образом:
1) клиент выполняет определенный запрос к HTTP-серверу из своего Web-браузера;
2) HTTP-сервер запускает определенный скрипт, который выполняет поставленную перед ним задачу в зависимости от запроса пользователя, например, проанализировать текст;
3) данные полученные в результате обращения на сервер БД обрабатываются и посылаются в html виде;
4) HTTP-сервер перенаправляет результаты обратно клиенту, а на их основании клиентский Web-браузер будет отображать страницу.
Разработанная в данной выпускной квалификационной работе программная система выявления мнений пользователей социальных сетей состоит из нескольких программных агентов, определённым образом взаимодействующих между собой. В состав программного обеспечения так же входят два специальных модуля, которые будут помогать в работе сайта, и в обработке текста, а так же генерации отчетов.
Общая схема архитектуры системы приведена на рисунке 2.6.
Рисунок 2.6. Общая архитектура программной системы
Пользователь в окне браузера взаимодействует с интерфейсом сайта. С помощью его он устанавливает задание и настройки для агента, а также инициирует его работу, с помощью интерфейса так же возможно дополнение словарей в базе данных.
Агент поиска и отбора текстов, исходя из настроек произведенных пользователем, обращается к определенным темам, которые заданы у него в базе данных. Он отбирает полезную текстовую информацию, соответствующую запросу. Она представляет собой сплошной текст по выбранной тематике, без зашумленности, который может быть на сайтах в виде HTML-Кода или JavaScript кода. Эта информация передается другому агенту.
Агент анализа текстов производит исследование полученных данных. Ведется подсчет количества оценочных комментариев из нашего словаря, далее с помощью проставленных каждому слову в словаре их веса он оценивает м
Разработка программной системы выявления мнений пользователей социальных сетей дипломная работа. Программирование, компьютеры и кибернетика.
Эссе Новая Форма Правление В Нидерландах
Сырье и схема получения гидрогенизированных жиров (саломас), требование к их качеству.
Реферат: Планирование себестоимости и прибыли предприятия. Скачать бесплатно и без регистрации
Реферат: Стратегический управленческий учет на примере ООО Сибзернопродукт
Реферат: Процессы глобализации на современном этапе. Скачать бесплатно и без регистрации
Реферат по теме Банківські резерви й ризик
Примеры Человечности В Жизни Для Сочинения
Глобальные Проблемы Современного Мира Эссе
Образование В России Реферат
Соотношение Отрасли Права И Системы Законодательства Курсовая
Культурно Досуговая Деятельность Курсовая
Пособие по теме Этика
Технико Экономическое Обоснование Покупки
Расчет дросселя бустерной схемы DC – DC преобразователя
Сочинение О Слове Полку Игоре
Реферат: Eye For An Eye Or Turn The
Тема Дороги В Повести Капитанская Дочка Сочинение
Букингемский Дворец Сочинение На Английском
Курсовая Работа На Тему Шамотні Вогнетриви Для Футеровки Мартенівських Печей
Книга: История иллюстрации в книгах
Изучение приемов и методов финансового анализа и управления на примере ООО Торговый дом "Востокмазавтодизельсервис" - Международные отношения и мировая экономика отчет по практике
Аудит внутрихозяйственных расчетов - Бухгалтерский учет и аудит курсовая работа
Рынок труда, его функции, модели и роль в экономике - Международные отношения и мировая экономика курсовая работа

Разработка программной системы выявления мнений пользователей социальных сетей - Программирование, компьютеры и кибернетика дипломная работа

Report Page