Новости
12.04.2024
Поздравляем с Днём космонавтики!
08.03.2024
Поздравляем с Международным Женским Днем!
23.02.2024
Поздравляем с Днем Защитника Отечества!
Оплата онлайн
При оплате онлайн будет
удержана комиссия 3,5-5,5%








Способ оплаты:

С банковской карты (3,5%)
Сбербанк онлайн (3,5%)
Со счета в Яндекс.Деньгах (5,5%)
Наличными через терминал (3,5%)

СОЗДАНИЕ ВТОРОЙ ВЕРСИИ АВТОМАТИЗИРОВАННОЙ ИНФОРМАЦИОННОЙ СИСТЕМЫ «ЭЛЕКС»

Авторы:
Город:
Москва
ВУЗ:
Дата:
28 марта 2016г.

На сегодняшний день компьютеры прочно вошли в повседневную жизнь любой медицинской организации, и невозможно представить формирование любого содержательного медицинского документа без использования ЭВМ [1,2, 3].

C точки зрения формирования электронных медицинских документов, то на сегодняшний день возможны два варианта: в медицинской информационной системе или с помощью установленных на компьютере текстовых редакторов. В обоих описанных случаях врачи пользуются таким базовым свойством любой информационной системы как способность размножать произвольное количество раз однажды полученную информацию без существенных временных затрат со стороны пользователя. Т.е. мы имеем дело с ситуацией, когда врач может взять готовый документ и просто «вставить» туда фамилию пациента, или «собрать» такой документ из фрагментов, подготовленных ранее, без связи с конкретным событием в клинической практике, которое врач должен описывать. Именно поэтому для  обеспечения  возможности автоматизированного контроля  качества создаваемых врачами медицинских документов мы и стали создавать автоматизированную систему лексического контроля «Элекс» [2].

В настоящее время нами завершена версия 2.0 системы «Элекс».

В рамках второй, усовершенствованной с точки зрения алгоритмов и наполненности медицинских словарей, версии системы нами реализованы следующие подходы:

1.     Алгоритм вычисления критериев оценки количественного содержания медицинской информации в текстовом документе. Данный алгоритм основывается на выделении медицинских терминов в тексте и оценке их частотности. Для повышения точности оценки количественного содержания медицинской информации в текстах эта оценка должна выполняться с учётом составных (многословных терминов). Выделение составных терминов выполняется с помощью обработки результатов морфологического и синтаксического анализа текста алгоритмом, выделяющим в тексте синтаксические поддеревья глубины, не превосходящей заданной (исходный параметр алгоритма). Выделенные синтаксические конструкции (например, именные группы) сверяются со словарём в системе управления базами данных (СУБД). При этом сопоставление этих конструкций ведётся как с учётом совпадения нормальных форм, входящих в них слов, так и с учётом вхождения соответствующих слов в одинаковые синтаксические связи (например, управление, подчинение). В зависимости от уровня совпадений определяется полное или частичное соответствие термина в тексте и термина в словаре. Обнаруженные таким образом медицинские термины получают соответствующую пометку. На следующем этапе производится расчёт частотных характеристик всех слов и словосочетаний в тексте (рассчитывается текстовая частота - TF). Составные термины рассматриваются как одна лексическая единица. Кроме того, на основе частотного анализа заранее сформированной коллекции медицинских документов различных типов (анамнезы, эпикризы и т.п.) осуществляется оценка значимости медицинских терминов (рассчитывается обратная документная частота - IDF). Эта величина позволяет отделить общеупотребительные («служебные») медицинские термины, относящиеся к общемедицинской тематике,  от специфичных медицинских терминов,  описывающих, например,  конкретные диагнозы, симптомы. Таким образом с применением классических формул TFIDF (с нормировкой на 1) выполняется оценка количественного содержания медицинской информации в текстовом документе.

2.     Для оценки степени уникальности (оригинальности формулировок) текста проверяемого медицинского документа реализовано пофрагментное сопоставление текста проверяемого с ранее созданными медицинскими текстами, имеющимися в индексной базе. В качестве фрагмента сравнения выступает предложение (возможно, сложное). Предполагается, что сопоставление текстов может производиться с учётом замены слов на синонимы и изменения порядка слов в предложении, не меняющего его смысла, а также с точностью до замены численных значений различных медицинских показателей. Поэтому в системе реализованы 4 критерия, основанных на анализе лексического состава предложений, а также совпадения их семантических и синтаксических структур. Текстовая информация при этом представляется в виде неоднородной семантической сети (НСС).

А) Первый критерий заключается в оценке количественного «пословного» совпадения предложения проверяемого текста и предложений - потенциальных источников заимствований. Эта оценка представляет собой TFIDF-оценку с нормировкой на 1.

Б) Второй критерий представляет собой оценку соответствия синтаксической структуры проверяемого предложения с предложениями-источниками.

В) Третий критерий основан на подсчёте количества совпадающих семантических значений у соответственных слов (совпадающих по нормальной форме).

Г) Четвёртый критерий базируется на подсчёте количества совпадающих семантических связей между соответственными словами (совпадающих по нормальной форме) в проверяемом предложении и предложениях- источниках.

Количественный анализ синтаксической и семантической информации по вышеприведённым критериям позволяет учесть специфику медицинских текстов, в которых значительная доля однословных терминов полисемична, но вместе с тем многословные, составные, термины вполне однозначно соответствуют определяемым ими понятиям.

Таким образом, реализованные во второй версии автоматизированной информационной системы «Элекс» критерии оценки степени уникальности текста проверяемого медицинского документа учитывают:

– совместную встречаемость, порядок слов запроса и расстояние между словами в текстах документов;

– синтаксические и семантические связи между словами запроса.

Основываясь на вышеизложенном, считаем, что разработанная в настоящее время версия 2.0. автоматизированной информационной системы «Элекс» позволяет эффективно осуществлять лексический контроль медицинских электронных документов в не зависимости от природы их происхождения, тем самым выявляя некачественно сформированные документы и позволяя использовать ее в качестве одного из инструментов повышения качества оказываемой медицинской помощи.

 

Список литературы

1.     Амиров Р.И., Марапов Д.И. Реализация кластерного подхода при создании единого информационного пространства в сфере здравоохранения на программной платформе компании «Витакор». // Материалы Всероссийской конференции «Информационные технологии в медицине». – М.: «Консэф», 2013. – С. 35- 38.

2.     Берсенева Е.А., Седов А.А., Голухов Г.Н. Актуальные вопросы создания автоматизированной системы лексического контроля медицинских документов. // Врач и информационные технологии. – 2014. - № 1. – С. 11-17.

3.     Берсенева Е.А., Седов А.А. Автоматизированный лексический контроль медицинских документов: предлагаемые подходы. // Современная медицина: актуальные вопросы и перспективы развития. Выпуск II.: Сборник научных трудов по итогам международной научно-практической конференции (10 сентября 2015 г.). – г. Уфа, 2015. – С.83-85.