СФД (Страховий фонд документації) Науково-виробничий журнал 2(9)'2010 Заснований у 2006 році


Скачати 1.49 Mb.
Назва СФД (Страховий фонд документації) Науково-виробничий журнал 2(9)'2010 Заснований у 2006 році
Сторінка 4/10
Дата 02.06.2013
Розмір 1.49 Mb.
Тип Документи
bibl.com.ua > Право > Документи
1   2   3   4   5   6   7   8   9   10

Література:

  1. Закон України «Про страховий фонд документації України» // ВВР України, – 2001. – № 20. – Ст. 101

  2. Степаненко В.Л., Кривулькін І.М. Нормативне забезпечення комплексу «Страховий фонд документації» та шляхи його вдосконалення // СФД (Страховий фонд документації). – 2008. – № 2 (5). – С. 3 – 12.

  3. Чарикова О.І., Водолажська Т.О. Аналіз автоматизації процесу контролю виконання робіт РЦ СФД з мікрофільмування документації // СФД (Страховий фонд документації). – 2009. – № 1 (6). – С. 48 – 52.

  4. Протоколи рішень комісії з питань техногенно-екологічної безпеки та надзвичайних ситуацій по Вінницькій обласній державній адміністрації, 2006 – 2009 роки.

5. Рішення 22-ї сесії 4 скликання Вінницької обласної ради від 21 липня 2005 р. № 854 «Про Програму створення обласного страхового фонду документації на період 2005 – 2009 років».

6. Рішення 27-ї сесії 5 скликання Вінницької обласної ради від 10 грудня 2009 р. № 899 «Про Програму створення страхового фонду документації Вінницької області на період з 2010 по 2014 рік».


УДК 681.3

Н. В. Борзенко, Є. М. Діков

ВИЗНАЧЕННЯ ЯКОСТІ ІНФОРМАЦІЇ
ДЕРЖАВНОГО РЕЄСТРУ ДОКУМЕНТІВ
СТРАХОВОГО ФОНДУ ДОКУМЕНТАЦІЇ УКРАЇНИ
ЗА ПОКАЗНИКОМ “РЕЛЕВАНТНІСТЬ ІНФОРМАЦІЇ”

У роботі запропоновано метод оцінювання якості інформації автоматизованої інформаційно-пошукової системи – Державний реєстр документів страхового фонду документації України (далі – Державний реєстр СФД) – за показником “Релевантність інформації”.

Аналіз літературних джерел [1 – 8] виявив, що розрізняють релевантність формальну та змістовну.

Формальна релевантність або системна релевантність – це ступінь близькості між формальною інформаційною потребою (запитом) та знайденим документом.

Змістовна релевантність в загальному сенсі – це ступінь відповідності отриманого результату бажаному. Змістовну релевантність ще називають когнітивною релевантністю або пертинентністю.

Метою даної роботи є висвітлення методу оцінювання показника “Релевантність інформації” Державного реєстру СФД.

Релевантність формальна – відповідність, яка визначається алгоритмічним шляхом порівняння інформації за пошуковим запитом та інформації документа-зразка на підставі критерію видачі, який застосовується в автоматизованих інформаційно-пошукових системах (далі – АІСП) [1].

Критерій видачі – сукупність ознак, за якими:

– визначається ступінь відповідності пошукового документа запиту;

– приймається рішення щодо видачі або невидачі документа у відповідь на інформаційний запит.

Математично інформаційний пошук, заснований на формальній релевантності, задається у вигляді кортежу [2]:


(1)

,
де – колекція (множина) документів;

– колекція (множина) запитів;

– моделі інформаційного пошуку;

– функція ранжирування, яка встановлює реальні числа у випадку відповідності документа із колекції запиту із колекції .
Моделі інформаційного пошуку поділяються на дві моделі: теоретико-множинна та ймовірна моделі.

Теоретико-множинна модель використовує теорію множин. Каркасом теоретико-множинної моделі є булева модель, яка формує запит з застосуванням операторів “І”, “АБО”, “НІ”.

Каркасом ймовірної моделі є теорія ймовірності. В якості оцінювання релевантності документа із колекції запиту із колекції використовується ймовірність того, що користувач АІПС визнає документ дійсно релевантним, тобто зацікавиться їм.

За цією моделлю ймовірність того, що документ – релевантний, визначається за формулою Байеса [3]:

(2)
,
де – релевантність;

– ймовірність того, що випадково обраний з колекції документ є релевантним;

– ймовірність випадкового обрання документа із множини релевантних документів;

– ймовірність випадкового обрання документа із колекції .
Релевантність змістовна трактується як відповідність документа інформаційному запиту, яка визначається неформальним шляхом. Тобто людина – користувач АІПС – сама вирішує, чи є інформація отриманого документа релевантною [1].

Змістовна релевантність у АІСП визначається методами експертних оцінок і використовується для отримання даних щодо якості роботи самої АІСП [1]. Один з таких методів наведений у роботах [6, 7].

Ідеальна АІСП повинна надавати документи, які мають релевантний зміст відповідно до запиту, і нічого іншого. Але на практиці може бути “мовчання” АІСП (ненадання деякої кількості документів) або “шум” (надання зайвих документів). За таких умов колекція документів, що містить АІСП, поділяється за двома критеріями: перший –документи такі, що надані, та документи такі, що не надані; другий – релевантні та нерелевантні документи [6, 7]. Тобто для кожного запиту існує чотири групи документів, які можна уявити у вигляді таблиці 1.
Таблиця 1




Наданий документ

Ненаданий документ

Релевантний документ

a

b

Нерелевантний документ

c

d




a + c

b + d


Співвідношення кількості документів в кожній з груп таблиці 1 визначає ефективність інформаційного пошуку. Для оцінювання ефективності використовують такі показники [6, 7]:


(3)
повнота надання документів, ;


(4)
– точність надання документів, ;


(5)
– пошуковий шум, . .
Для ідеальної АІСП показники “Повнота надання документів” та “Точність надання документів” мають значення 100%, а “Пошуковий шум” дорівнює нулю, тобто знайдені та надані усі документи і жодного зайвого. В реальних АІСП показник “Повнота надання документів” досягає 70%, показник “Точність надання документів” коливається у широких межах, іноді досягає 10% [8].

Оскільки користувач АІПС сам вирішує, чи є інформація отриманого документа релевантною, то означені показники можна вважати суб’єктивним уявленням користувача.

Приклади, наведені нижче, доводять, наскільки значення показників “Повнота надання документів” та “Точність надання документів” залежать від уявлення користувача АІПС.

Приклад 1. Користувач 1 зробив до Реєстру запит щодо існування в ньому інформації відносно морського транспортного засобу “фрегат”. Отримані результати наведені в таблиці 2.
Таблиця 2

Результати пошуку інформації за запитом “фрегат”

Керченський завод “Фрегат”

Підстанція 150 кВ “Фрегат” Чернігівської РЕС

Котельна мікрорайону “Фрегат” по вул. Корабельній в місті Миколаїв

Завод “Фрегат” місто Первомайськ Миколаївська область

Аналіз результатів показує, що Користувач 1 взагалі не отримав жодного документа щодо морського транспортного засобу “фрегат”. Тобто отримані документи, з точки зору Користувача 1, нерелевантні (вони йому не цікаві і не потрібні). За таких обставин показники “Повнота надання документів” та “Точність надання документів” дорівнюють нулю.

Приклад 2. Користувач 2 зробив до Державного реєстру СФД запит щодо існування в ньому інформації стосовно підприємства – «Завод “Фрегат”» і отримав такі саме результати, які наведено в таблиці 2. Для Користувача 2 із чотирьох отриманих документів релевантним є один документ – документ «Керченський завод “Фрегат”», а інші три документи – нерелевантні. Використовуючи формулу (3), отримаємо значення показника “Повнота надання документів” на рівні 25%.

Приклад 3. Користувач 3 зробив до Державного реєстру СФД запит щодо існування в ньому інформації стосовно виробу “Замок” та отримав результати, які наведені в таблиці 3.
Таблиця 3

Результати пошуку інформації за запитом “Замок”

“Замок” як виріб

“Замок” як будівля

Замок навісний модель ЗМ-098

Замок XVI-XVIII ст. місто Броди

Замок урізний ЗМ-100

Замок Даниловичів XIV-XVII ст. селище міського типу Олесько

Замок навісний модель ЗА-01

Замок Жолкевських місто Жовква

Замок навісний модель ЗМ-213

Замок міста Золочева

Замок для гаражів

Замок 1478 р.

Замок для гаражів

Замок 1550-1780 рр.

Замок урізний




Замок гідравлічний односторонній




Замок урізний циліндровий




Замок гідравлічний двосторонній





Із 16 документів, які отримав Користувач 3, тільки 10 документів мають інформацію щодо виробу “Замок” (релевантні), а інші шість документів нерелевантні, оскільки це документи стосовно історико-культурних пам’яток. Крім того, у Державному реєстрі СФД існує ще один документ щодо виробу “замок”, але він написаний з маленької літери, тому і не потрапив до наданої в таблиці 3 інформації. Використовуючи формули (3) та (4), отримаємо значення показників “Повнота надання документів” та “Точність надання документів”:
,

.

.



Наданий у роботі матеріал дозволить користувачам Державного реєстру СФД визначати ступінь релевантності отриманої інформації для прийняття рішення в конкретний період часу. Крім того, релевантність не є статичною величиною і може змінюватися протягом часу, оскільки знання користувача після отримання знайденого документа можуть бути поштовхом для складання нового запиту, що ілюструє інтерактивну природу інформаційного пошуку.

Запропоновані в роботі методи визначення релевантності інформації можуть бути використані при створенні експертних систем діагностики Державного реєстру СФД щодо якості його інформації.
Література:

1. Добрынин В. Ю. Теория информационно-логических систем. Информационный поиск: Метод. указания к курсу информационного поиска. – СПб. : Изд-во СПбГУ, 2002.

2. Кураленок И. Е., Некрестьянов И. С. Автоматическая классификация документов с использованием семантического анализа. Программирование, 4. – 2000. С. 31 – 41.

3. Моченов С. В., Бледнов А. М., Луговских Ю. А. Векторная модель представления текстовой информации / Ижевский государственный технический университет // Материалы междунар. науч. конф. – Ижевск, 13 – 17 июля 2006 г.

4. Гаврилова Т. А., Червинская К. Р. Извлечение и структурирование знаний для экспертных систем. М. : Радио и связь, 1992. – 223 с.

5. Солтон Дж. Динамические библиотечно-поисковые системы. – М. : Мир, 1979. – 287 с.

6. Федоровский А. Н, Костин М. Ю. Mail.ru на РОМИП-2005 // Труды РОМИП’2005 : Труды третьего российского семинара по оценке методов информационного поиска под ред. И. С. Некрестьянова. СПб. : НИИ Химии СПбГУ, 2005. – С. 106 124.

7. Клевердон У. Критическая оценка информационно-поисковых систем / Междунар. конгресс по научной информации. М., 16 18 сентября 1968 г.

8. Сметанников А. А. Использование в информационно-поисковой системе обратной связи по релевантности для классификации документов ГНЦ ВБ «Вектор» / НИИ молекулярной биологии. – Новосибирск, 1972.


УДК 771.531.3

В. М. Козирев, Л. О. Четверікова, Л. А. Шадріна
1   2   3   4   5   6   7   8   9   10

Схожі:

СФД (Страховий фонд документації) Науково-виробничий журнал 1(8)'2010 Заснований у 2006 році
Науково-дослідний, проектно-конструкторський та технологічний інститут мікрографії (НДІ мікрографії) – пров. Пархоменка, 1/60, м....
СФД (Страховий фонд документації) Науково-виробничий журнал 1(10)'2011 Заснований у 2006 році
Науково-дослідний, проектно-конструкторський та технологічний інститут мікрографії (НДІ мікрографії) – пров. Пархоменка, 1/60, м....
СФД (Страховий фонд документації) Науково-виробничий журнал 2(7)'2009 Заснований у 2006 році
Науково-дослідний, проектно-конструкторський та технологічний інститут мікрографії (НДІ мікрографії) – пров. Пархоменка, 1/60, м....
СФД (Страховий фонд документації) Науково-виробничий журнал 2(11)'2011 Заснований у 2006 році
Науково-дослідний, проектно-конструкторський та технологічний інститут мікрографії (НДІ мікрографії) – пров. Пархоменка, 1/60, м....
СФД (Страховий фонд документації) Науково-виробничий журнал 1(12)'2012 Заснований у 2006 році
Науково-дослідний, проектно-конструкторський та технологічний інститут мікрографії (НДІ мікрографії) – пров. Пархоменка, 1/60, м....
СФД (Страховий фонд документації) Науково-виробничий журнал 2(13)'2012 Заснований у 2006 році
Науково-дослідний, проектно-конструкторський та технологічний інститут мікрографії (НДІ мікрографії) – пров. Пархоменка, 1/60, м....
Перелік питань для підготовки до написання модульної контрольної...
Страховий захист – це … Страховий захист як економічна категорія має такі ознаки (5 ознак): …
Результати проведення держекоекспертизи проектної документації у 2010 році (за липень)

ХМЕЛЬНИЦЬКИЙ ОБЛАСНИЙ ЦЕНТР
Малої академії наук України у 2009/2010 навчальному році (Додаток 1). Просимо дотримуватись вимог вищезазначеного наказу Міністерства...
Програми з енергозбереження на 2006-2010 роки у м. Синельниковому...
Дніпропетровській області на 2010 – 2015 роки, з метою внесення змін та доповнень до міської Програми з енергозбереження на 2006-2010...
Додайте кнопку на своєму сайті:
Портал навчання


При копіюванні матеріалу обов'язкове зазначення активного посилання © 2013
звернутися до адміністрації
bibl.com.ua
Головна сторінка