iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК...

325
êéëëàâëäÄü îÖÑÖêÄñàü åàçàëíÖêëíÇé éÅêÄáéÇÄçàü à çÄìäà îÉÅéì Çèé íûåÖçëäàâ ÉéëìÑÄêëíÇÖççõâ ìçàÇÖêëàíÖí àçëíàíìí ÑàëíÄçñàéççéÉé éÅêÄáéÇÄçàü àçëíàíìí åÄíÖåÄíàäà à äéåèúûíÖêçõï çÄìä Ä. É. àÇÄòäé, û. Ö. äÄêüäàç àçîéêåÄñàéççõÖ ëàëíÖåõ à íÖïçéãéÉàà ì˜Â·ÌÓ ÔÓÒÓ·Ë í˛ÏÂ̸ àÁ‰‡ÚÂθÒÚ‚Ó í˛ÏÂÌÒÍÓ„Ó „ÓÒÛ‰‡ðÒÚ‚ÂÌÌÓ„Ó ÛÌË‚ÂðÒËÚÂÚ‡ 2013

Transcript of iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК...

Page 1: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

êéëëàâëäÄü îÖÑÖêÄñàü åàçàëíÖêëíÇé éÅêÄáéÇÄçàü à çÄìäà

îÉÅéì Çèé íûåÖçëäàâ ÉéëìÑÄêëíÇÖççõâ ìçàÇÖêëàíÖí àçëíàíìí ÑàëíÄçñàéççéÉé éÅêÄáéÇÄçàü àçëíàíìí åÄíÖåÄíàäà à äéåèúûíÖêçõï çÄìä

Ä. É. àÇÄòäé, û. Ö. äÄêüäàç

àçîéêåÄñàéççõÖ ëàëíÖåõ à íÖïçéãéÉàà

ì˜Â·ÌÓ ÔÓÒÓ·ËÂ

í˛ÏÂ̸

àÁ‰‡ÚÂθÒÚ‚Ó í˛ÏÂÌÒÍÓ„Ó „ÓÒÛ‰‡ðÒÚ‚ÂÌÌÓ„Ó ÛÌË‚ÂðÒËÚÂÚ‡ 2013

Page 2: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

УДК 004(075.8) ББК З973я73

И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ СИСТЕМЫ

И ТЕХНОЛОГИИ: учебное пособие. Тюмень: Издательство Тюменского государственного университета, 2013. 324 с.

Является одной из важных дисциплин в подготовке бакалавров по направле-

нию «Прикладная информатика». Рассмотрены общие вопросы, определяющие практические подходы к ис-

пользованию понятий «информация», «данные», «система», «информационные системы», а также определения основных терминов, используемых при работе с информацией, очерчен круг вопросов, рассматриваемых в теории информации, приведены способы хранения, обработки, преобразования, передачи и измерения информации. Предложен новый взгляд на классификацию информационных сис-тем. Рассматриваются вопросы состава, структуры и архитектуры информацион-ных систем. Дается представление о таких понятиях, как «автоматизированные информационно-поисковые системы», «информационно-поисковые языки и их классификация», а также «системы индексирования» и «математический аппарат поиска информации».

Рекомендовано к печати кафедрой информационных систем, Учебно-методической комиссией Института математики, естественных наук и информа-ционных технологий ТюмГУ.

Рабочая программа дисциплины опубликована на сайте ТюмГУ: http:// utmn.ru/ и в разделе web-кабинета информационной системы Института дистанци-онного образования: https://iside.distance.ru «Учебно-методическое обеспечение».

Рецензенты: А. А. Захаров, д-р тех. наук, профессор, зав. кафедрой ин-формационной безопасности Института математики, естест-венных наук и информационных технологий ТюмГУ

Б. Г. Аксенов, д-р физ.-мат. наук, профессор, зав. кафедрой математики ТюмГАСУ

Ответственный за выпуск: А. В. Трофимова, зав. отделом учебно-методического обес-

печения ИДО ТюмГУ

ISBN 978-5-400-00827-6

© ФГБОУ ВПО Тюменский государственный университет, 2013 © А. Г. Ивашко, Ю. Е. Карякин, 2013

– 2 –

Page 3: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

ОГЛАВЛЕНИЕ

ПРЕДИСЛОВИЕ ............................................................................................. 5 ГЛАВА 1. ТЕРМИНОЛОГИЯ........................................................................ 6

§ 1. Информация ....................................................................................... 6 § 2. Данные.............................................................................................. 12 § 3. Знания ............................................................................................... 13 § 4. Система............................................................................................. 14 § 5. Информационная система............................................................... 15 Резюме ..................................................................................................... 18 Вопросы для самопроверки ................................................................... 19

ГЛАВА 2. ИНФОРМАЦИЯ И ЕЕ ОБРАБОТКА........................................ 20 § 1. Понятие информации ...................................................................... 20 § 2. Виды информации ........................................................................... 24 § 3. Хранение, измерение, обработка и передача информации .......... 26 § 4. Способы измерения информации................................................... 28 § 5. Классификация и кодирование информации ................................ 37 § 6. Сжатие информации........................................................................ 45 § 7. Качество информации ..................................................................... 54 § 8. Классификация экономической информации ............................... 57 Резюме ..................................................................................................... 59 Вопросы для самопроверки ................................................................... 60

ГЛАВА 3. КЛАССИФИКАЦИЯ ИНФОРМАЦИОННЫХ СИСТЕМ...... 61 § 1. Классификация ИС по форме представления информации........ 68 § 2. Классификация систем по типу процесса автоматизации ........ 121 Резюме ................................................................................................... 139 Вопросы для самопроверки ................................................................. 140

ГЛАВА 4. СОСТАВ И СТРУКТУРА ИС.................................................. 141 § 1. Стандарты на АС ........................................................................... 145 § 2. Состав информационных систем ................................................. 153 § 3. Структура и архитектура информационной системы ............... 159

– 3 –

Page 4: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

Резюме ................................................................................................... 161 Вопросы для самопроверки ................................................................. 163

ГЛАВА 5. АВТОМАТИЗИРОВАННЫЕ ИНФОРМАЦИОННО-ПОИСКОВЫЕ СИСТЕМЫ И ИНФОРМАЦИОННО-ПОИСКОВЫЕ ЯЗЫКИ............................................................ 164

§ 1. Порядок функционирования автоматизированной информационно-поисковой системы .......................................... 164

§ 2. Состав и структура АИПС ............................................................ 165 § 3. Информационно-поисковые языки (ИПЯ) .................................. 169 § 4. Системы индексирования ............................................................. 192 § 5. Поисковый аппарат АИПС ........................................................... 197 § 6. Организация поисковых массивов ............................................... 220 Резюме ................................................................................................... 223 Вопросы для самопроверки ................................................................. 225

ГЛАВА 6. ПОДХОДЫ, ИСПОЛЬЗУЕМЫЕ ПРИ РАЗРАБОТКЕ ИС ... 226 § 1. Планирование развития информационных технологий

на предприятии ............................................................................. 226 § 2. Подходы к разработке программного обеспечения.................... 241 § 3. Выбор распределенной архитектуры........................................... 244 Резюме ................................................................................................... 253 Вопросы для самопроверки ................................................................. 254

ЗАКЛЮЧЕНИЕ ........................................................................................... 255 ПРАКТИКУМ.............................................................................................. 257 ЗАДАНИЯ ДЛЯ САМОПРОВЕРКИ ......................................................... 264

Тесты для самоконтроля ...................................................................... 264 Ключи к тестам для самоконтроля...................................................... 286 Темы контрольных работ..................................................................... 287 Вопросы для подготовки к экзамену (зачету) .................................... 289

ГЛОССАРИЙ............................................................................................... 295 СПИСОК ЛИТЕРАТУРЫ........................................................................... 316

– 4 –

Page 5: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

èêÖÑàëãéÇàÖ

Информационные системы являются основным интеллектуаль-ным инструментом процесса информатизации всех сфер современ-ного общества.

В учебном пособии рассмотрены общие вопросы, определяю-щие практические подходы к использованию понятий «информа-ция», «данные», «система», «информационные системы», а также определения основных терминов, используемых при работе с ин-формацией, очерчен круг вопросов, рассматриваемых в теории информации, приведены способы хранения, обработки, преобразо-вания, передачи и измерения информации.

Предложен новый взгляд на классификацию информационных систем. Приводится описание информационных систем, широко представленных в современном мире информационных техноло-гий. Рассматриваются вопросы состава, структуры и архитектуры информационных систем.

Дается представление о таких понятиях, как «автоматизирован-ные информационно-поисковые системы», «информационно-поис-ковые языки и их классификация», а также «системы индексирова-ния» и «математический аппарат поиска информации».

Рассматриваются подходы, используемые при разработке ин-формационных систем, включая планирование развития информа-ционных технологий на предприятии.

Написание материала учебного пособия распределилось сле-дующим образом: А. Г. Ивашко написаны главы 1, 3, 4, 6, Ю. Е. Карякиным — главы 2, 5.

Учебное пособие ориентировано на студентов, обучающихся по направлению «Прикладная информатика», а также может быть по-лезно для студентов других специальностей, изучающих современ-ные информационные технологии.

– 5 –

Page 6: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

É·‚‡ 1. íÖêåàçéãéÉàü

Для того чтобы понять предмет исследования, необходимо по-нять те термины, которые используются в данной области. Бурный рост компьютерных технологий, стремительное продвижение их во все сферы производства и социальную сферу не обходятся без из-держек. Неоднозначность терминологии можно отнести к издерж-кам роста.

В интернете на запрос «информационные системы» различные поисковые системы, которые, к слову сказать, также являются ин-формационными системами, найдут более 3 млн ссылок, а на за-прос «information system» — более 14 млн. Такое впечатление, что данный термин один из самых популярных в интернете.

Попробуйте найти ответы на следующие вопросы. Информаци-онная система предполагает использование информационных тех-нологий? В чем разница между информационной и автоматизиро-ванной системой? Библиотека может быть отнесена к информа-ционным системам? Можно было бы продолжить список вопросов. Но поиск в интернете, в словарях и энциклопедиях не дает одно-значного ответа на поставленные вопросы.

Что тогда нам с вами изучать, если нет общепринятого опреде-ления «информационные системы»? Нам остается только одно — разобраться в терминологии, т. е. договориться о смысловом со-держании терминов, и на основе этого понятийного базиса изучать данный предмет.

§ 1. àçîéêåÄñàü

Данный термин и отражаемое им понятие являются сегодня од-ними из самых распространенных и при этом имеющими самые разные толкования как на бытовом, так и на профессиональных уровнях. Ниже мы приведем некоторые из определений. Мы при-водим такое большое количество определений не для того, чтобы поразить их многообразием. Каждое определение используется в

– 6 –

Page 7: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

некотором контексте. Стандарт определяет нормативную базу в данной профессиональной области, Федеральный закон определяет правовые нормы в государстве. Наша задача — разобраться в этой разношерстной терминологии и выбрать определение, которое мы будем использовать в контексте данного учебного пособия.

1. «Информация (от лат. informatio — разъяснение, изложе-ние), первоначально — сведения, передаваемые одними людьми другим людям устным, письменным или каким-либо другим спо-собом (например, с помощью условных сигналов, с использовани-ем технических средств и т. д.), а также сам процесс передачи или получения этих сведений. Впоследствии термин притерпел два принципиальных изменения в трактовке. Во-первых, он был рас-ширен и включил обмен сведениями не только между человеком и человеком, но также между человеком и автоматом, автоматом и автоматом; обмен сигналами в животном и растительном мире. Передачу признаков от клетки к клетке и от организма к организму также стали рассматривать как передачу информации. Во-вторых, была предложена количественная мера информации (работы К. Шеннона, А. Н. Колмогорова и др.), что привело к созданию ин-формации теории» [1].

2. «Информация — данные, организованные таким образом, что имеют смысл для имеющего с ними дело человека» [2].

3. «Информация — 1) сведения, сообщение о чем-либо, пере-даваемое людьми; 2) уменьшаемая, снижаемая неопределенность в результате полученных сведений; 3) передача, отражение разнооб-разия» [3].

4. «Информация — 1) что-то сказанное, новости; знание, по-лученное любым способом; 2) в информационной теории и теории компьютеров: это точная мера информации, измеренная в битах и охватывающая диапазон от нуля (это когда все известно заранее) и до какого-то максимального значения, когда ничего заранее о со-держании сообщения не известно; 3) любые данные, хранящиеся в компьютере» (Webster New World Dictionary of the American Language ed. David Guralnik, Prentice Hall Press, Division of Simon & Schuster).

– 7 –

Page 8: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

5. «Информация — сведения, воспринимаемые человеком и (или) специальными устройствами как отражение фактов матери-ального или духовного мира в процессе коммуникации» [4].

6. «Информация — содержание, значение данных, которое видят в них люди. Обычно данные состоят из фактов, которые ста-новятся информацией в определенном контексте и понятны лю-дям» [5].

7. «Информация — сведения (сообщения, данные) независимо от формы их представления» [6].

8. «Информация — это данные, удовлетворяющие информа-ционную потребность того, кому они передаются, соответствую-щие действительности и материализованные в форме, удобной для использования, передачи, хранения и (или) обработки (преобразо-вания) человеком и автоматизированными средствами» [7].

9. «Информация — результат обработки, сбора, управления и организации данных, который добавляется к знанию получателя. Другими словами, это — контекст, в котором данные приняты» [8].

Различие в смысловом содержании вышеперечисленных опре-делений обусловлено контекстом применения данного термина. Можно выделить несколько контекстов использования термина информация: информация как сообщение, информация как модель, информация как воздействие для преобразования, информация как документ.

Информация как сообщение (определения 1, 3, 7). В этом случае предполагается как минимум два объекта (передатчик и приемник), а также сообщение, которое может быть передано по-средством любого материального носителя. Сигнал — это знак, физический процесс или явление, распространяющееся в канале связи и несущее сообщение о каком-либо событии, состоянии объ-екта наблюдения или контроля, команды управления, указания и т. п. Сообщение может быть понято приемником за счет того, что приемник и передатчик достигли определенного соглашения об интерпретации сигнала.

«Краеугольным камнем в теории информации является пре-зумпция того, что разнообразные сообщения, имеющие самые раз-

– 8 –

Page 9: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

личные содержания и относящиеся к самым различным вопросам, могут быть переведены на общий язык, а информация, которую эти сообщения несут, может быть количественно измерена. С помо-щью такой количественной меры можно оценивать передаваемые сообщения независимо от формы, в которую они облечены. Это положение создает объективную основу для построения общей научной теории информации» [9]. В этом случае понятие «инфор-мация» соотносится с понятием «энергия». Подобно тому, как вве-дение понятия энергии позволило рассматривать все явления при-роды с единой точки зрения, так и введение понятия информации, единой меры количества информации позволяет подойти с единой общей точки зрения к изучению самых различных процессов.

Вместе с тем понятие «информация» существенно отличается от понятия «энергия». Существуют три формы энергетического взаимодействия (работа, передача тепла, передача массы). Переда-ча информации в отличие от этих взаимодействий не подчиняется закону сохранения энергии. При передаче информации источник ее не теряет.

Контекст «информация как сообщение» определяет важность понятия информации в кибернетике1. Кибернетика изучает маши-ны и живые организмы с точки зрения их способности восприни-мать определенную информацию, сохранять ее в «памяти», переда-вать по «каналам связи» и перерабатывать ее в «сигналы», направляющие их деятельность в соответствующую сторону. Есте-ственно-научное понимание информации основано на трех опреде-лениях этого понятия, предназначенных для теории информации (статистическая теория связи), для теории статистических оценок (понятие информации в статистике было введено английским ста-тистиком Р. Фишером в 1921 г.) и для оценки сложности алгорит-мов (алгоритмическая теория информации).

1 Кибернетика (от греч. kybernetike — «искусство управления», от

греч. kybernao — «правлю рулем, управляю», от греч. Κυβερνήτης — «кормчий») — наука об общих закономерностях процессов управления и передачи информации в машинах, живых организмах и обществе [1].

– 9 –

Page 10: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

Теория информации интересуется лишь количественной сторо-ной информации, содержащейся в сообщении. Более подробное рассмотрение теории информации К. Шеннона приведено ниже.

Информация как модель (определения 1, 3, 4, 9). Информа-цию можно воспринимать как атрибут того объекта, к которому она относится. В то же время информация отделена от этого объек-та. Информация несет сведения об объекте. Но не все сведения об объекте воспринимаются как информация. Получатель восприни-мает информацией только те данные, которые ему полезны. Следо-вательно, можно понимать информацию как некоторую модель или образец объекта, к которому она относится, причем в модели отра-жены те основные свойства объекта, которые полезны получателю.

В количественной теории информации, выдвинутой в 1960 г. А. А. Харкевичем, ценность информации определяется как прира-щение вероятности достижения данной цели в результате исполь-зования данной информации. В работах Р. Карнапа дается матема-тическое определение количества семантической информации.

Информация как воздействие для преобразования (опреде-ления 3, 5, 7). Информация — такой вид представления, которое влияет на формирование или преобразование других представле-ний. В этом случае нет потребности в разумном понимании ин-формации, ее оценки. Структура организации данного учебного пособия несет информацию. У студента (как получателя) нет зада-чи оценки этой информации, но существует задача воздействовать на знания студента этой информацией. В таком смысле ферменты являются информацией.

Информация как документ (определения 1-4, 8, 9). Документы — специализированная форма информации. Можно

определить деятельность с целью создания документа и деятель-ность, побочным продуктом которой может стать документ. Стан-дарт ГОСТ Р ИСО 15489-1-2007 определяет документ как зафикси-рованную на материальном носителе идентифицируемую информа-цию, созданную, полученную и сохраняемую организацией или частным лицом в качестве доказательства при подтверждении пра-вовых обязательств или деловой деятельности [10].

– 10 –

Page 11: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

В силу того что данное учебное пособие рассчитано на студен-тов специальности «Прикладная информатика в экономике», необ-ходимо рассмотреть особенности экономической информации.

Экономическая информация — информация об экономиче-ских отношениях и процессах общественного воспроизводства. Знания, сведения, входящие в экономическую информацию, с точки зрения воспринимающих их субъектов содержат инфор-мацию лишь в той мере, в какой они новы и полезны для реше-ния каких-либо задач [2].

В зависимости от содержания экономическая информация может классифицироваться: а) по фазам и процессам воспроиз-водства — информация о производстве, распределении, обмене, потреблении; б) по элементам (факторам) воспроизводства — ин-формация о населении и трудовых ресурсах, природных ресурсах, продукции и услугах, денежных средствах и т. д.; в) по отображае-мым структурным единицам — отраслям народного хозяйства, экономическим районам, предприятиям и организациям и т. п.

Экономическая информация может передаваться и обрабаты-ваться в форме знаков, фиксируемых на различных материальных носителях. Знаковые системы, используемые для представления экономической информации. Разработана Единая система класси-фикации и кодирования технико-экономической информации (ЕСКК ТЭИ), назначение которой — обеспечить единое в масшта-бах страны, однозначное и формализованное представление эле-ментов экономической информации.

Типичной формой количественного представления для эконо-мической информации является показатель. Показатель понимается либо как переменная величина, характеризующая одно из свойств отображаемого экономического объекта, либо как конкретное ко-личественное значение этой переменной величины. Качественно показатель определяется набором содержательных признаков, ко-личественно — методикой измерения (расчета). Показатели эконо-мической информации посредством фиксации разнообразных взаимосвязей между ними объединяются в систему показателей,

– 11 –

Page 12: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

которая образует методологическую основу всей системы сбора и обработки информации, обеспечивает сводимость и сопостави-мость всех количественных данных.

В обороте экономической информации наибольший удельный вес занимают данные первичного и бухгалтерского учета (внутри предприятий), транспортная и платежно-расчетная документация (в обороте между предприятиями), бухгалтерская и статистическая отчетность, плановые и нормативные документы, данные опера-тивного управления.

Главный методический и организационный центр учетно-статистической экономической информации — Главный межре-гиональный центр обработки и распространения статистической информации Федеральной службы государственной статистики (ГМЦ Росстата) и Федеральная налоговая служба.

§ 2. ÑÄççõÖ

Данные очень часто используется как синоним информации. Именно поэтому понятие информационного менеджмента и управ-ления данными практически близки по смыслу. В то же время есть очень интересный эффект при сопоставлении терминов «информа-ция» и «данные», а также «information» и «data».

Приведем несколько определений. «Данные — информация, представленная в виде, пригодном

для обработки автоматическими средствами при возможном уча-стии человека» [11].

«Данные — информация, обработанная и представленная в формализованном виде для дальнейшей обработки» [4].

«Данные — факты, понятия или инструкции, представленные в условной форме, удобной для пересылки, интерпретации и обра-ботки человеком или автоматизированными средствами» (Ассо-циация стандартов Франции — АФНОР).

«Данные — некоторый факт, то, на чем основан вывод или лю-бая интеллектуальная система» [12].

– 12 –

Page 13: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

«Data: A representation of facts, concepts, or instructions in a man-ner suitable for communication, interpretation, or processing by humans or by automatic means2» [13].

Если мы сопоставим с определениями информации, приведен-ные выше, то окажется, что между информацией и данными может существовать три взаимоисключающих отношения: данные — производные от информации; информация — производная от дан-ных; данные и информация — понятия равнозначные. Цитируемые определения показывают некоторую закономерность. В русскоя-зычных стандартах и нормативных документах понимаются дан-ные, как обработанная информация, в англоязычной литературе наоборот. Мы будем придерживаться следующей трактовки: «Ин-формация — содержание, значение данных, которое видят в них люди. Обычно данные состоят из фактов, которые становятся ин-формацией в определенном контексте и понятны людям» [5].

§ 3. áçÄçàü

Так же, как и в случае с термином «информация», существует множество определений:

«Знания — проверенный практикой результат познания дейст-вительности, верное ее отражение в сознании человека. Знание противоположно незнанию, т. е. отсутствию проверенной инфор-мации о чем-либо. Сущность научных знаний заключается в пони-мании действительности в ее прошлом, настоящем и будущем, в достоверном обобщении фактов, в том, что за случайным оно на-ходит необходимое, закономерное, за единичным — общее и на этой основе осуществляет предвидение. Мышление человека по-стоянно движется от незнания к знанию, от поверхностного ко все более глубокому и всестороннему знанию» [1].

2 Данные: способ представления фактов, концепций или инструкций,

позволяющий людям или автоматическим средствам осуществлять их передачу, интерпретацию или обработку.

– 13 –

Page 14: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

«Знание — селективная, упорядоченная, определенным спосо-бом (методом) полученная, в соответствии с какими-либо крите-риями (нормами) оформленная информация, имеющая социальное значение и признаваемая в качестве именно знаний определенными социальными субъектами и обществом в целом» [9].

Список определений можно довольно легко расширить. Но все же нас интересует применение данного термина в контексте описа-ния информационных систем.

«Знание — информация, о которой кто-либо осведомлен. Знание (в теории искусственного интеллекта) — совокупность

сведений (у индивидуума, общества или у системы ИИ) о мире, включающих в себя информацию о свойствах объектов, законо-мерностях процессов и явлений, а также правилах использования этой информации для принятия решений. Главное отличие знаний от данных состоит в их активности, т. е. появление в базе новых фактов или установление новых связей может стать источником активности системы.

Знание — это закономерности предметной области (принципы, связи, законы), полученные в результате практической деятельно-сти и профессионального опыта, позволяющие специалистам ста-вить и решать задачи в этой области» [14, 15].

Знания отражают множество возможных ситуаций, характери-зующихся состоянием и конкретной реализацией объектов опреде-ленного типа, способы перехода от одного описания объекта к дру-гому. Для знаний характерна внутренняя интерпретируемость, структурированность, связанность и активность. Условно можно записать: «знания = факты + убеждения + правила» [16]. Данная формула довольно хорошо позволяет понять термин «база знаний», который мы будем рассматривать в интеллектуальных информаци-онных системах.

§ 4. ëàëíÖåÄ

Мы воспользуемся определением данным в ГОСТ Р ИСО/МЭК 15288-2005 [17]. Система (system): комбинация взаимодействую-

– 14 –

Page 15: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

щих элементов, организованных для достижения одной или не-скольких поставленных целей. Система может рассматриваться как продукт или как совокупность услуг, которые она обеспечивает. На практике интерпретация данного термина зачастую уточняется с помощью ассоциативного существительного, например, система самолета. В некоторых случаях слово «система» может заменяться контекстным синонимом, например, самолет, хотя это может впо-следствии затруднять восприятие системных принципов.

В третьей главе довольно подробно рассматриваются различ-ные подходы в описании систем.

§ 5. àçîéêåÄñàéççÄü ëàëíÖåÄ

Дело в том, что в отечественной литературе нет единого, сло-жившегося определения «информационная система», хотя это, наверное, одно из самых распространенных словосочетаний, встре-чающихся в интернете (17,5 млн ссылок в Googlе по запросу «информационные системы» и 1,3 млрд ссылок по запросу «information system»). В то же время практически во всех стандар-тах, посвященных информационным технологиям, данный термин не определяется. Только в ГОСТ 7.0-99 «Система стандартов по информации, библиотечному и издательскому делу. Информаци-онно-библиотечная деятельность, библиография. Термины и оп-ределения» дается определение информационной системы как системы, предназначенной для хранения, обработки, поиска, рас-пространения, передачи и предоставления информации. К сожале-нию, данное определение не раскрывает смысл информационных систем и скорее способствует терминологической путанице, чем ее разрешает.

Ярким примером неоднозначного понимания данного термина является определение, данное на русскоязычном сайте Википедия [8]: «Информационная система (ИС) — это система, предназначен-ная для ведения информационной модели, чаще всего — какой-либо области человеческой деятельности. Эта система должна обеспечивать средства для протекания информационных процес-

– 15 –

Page 16: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

сов: хранение, передача, преобразование информации. По мнению одних авторов, ИС включает в себя персонал, ее эксплуатирующий, по мнению других — нет».

В то же время на англоязычном сайте Википедия [15] дается довольно конкретное определение этого термина — Information System (IS) is the system of persons, data records and activities that process the data and information in a given organization, including manual processes or automated processes3 (в данном пособии мы бу-дем придерживаться этого определения). При этом необходимо от-метить, что обычно термин используется ошибочно как синоним машинных информационных систем4 (computer-based information systems), который является только компонентом информационных технологий в информационной системе. Машинные информацион-ные системы — область изучения информационных технологий (ИТ); однако навряд ли эти системы нужно рассматривать отдельно от ИС в широком понятии, которая всегда содержит машинные информационные системы. Машинная информационная система, по определению Langefors [18], является технологически средой для регистрации, хранения, и распространения данных и информа-ции. Информационная система — также социальная система, чье поведение наряду с технологией определяется целями, ценностями и мнениями, как отдельных личностей, так и целых групп.

В книге Ciborra [15] определяются «информационные систе-мы», как область, в которой мы «имеет дело с развертыванием ин-формационной технологии5 в организациях, учреждениях, и обще-стве в целом».

3 Информационная система (ИС) — система людей, хранимых данных

и процессов обработки данных и информации в контексте конкретной организации. Обработка включает ручные или автоматизированные про-цессы.

4 Наиболее близкий термин в русскоязычной литературе — автомати-зированные информационные системы.

5 Можно определить информационные технологии через ИС. Инфор-мационная технология — совокупность методов, производственных про-цессов и программно-технических средств, объединенных в технологиче-

– 16 –

Page 17: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

Часто определение ИС формулируется из понятия ИТ. В каче-стве примера приведем определение, данное в [15]. Информацион-ная система (ИС) — это организационно-упорядоченная взаимо-связанная совокупность средств и методов ИТ, используемых для хранения, обработки и выдачи информации в интересах достиже-ния поставленной цели. В этом случае предполагается использова-ние в качестве основного технического средства переработки ин-формации ЭВМ и средств связи, реализующих информационные процессы и выдачу информации, необходимой в процессе приня-тия решений задач из любой области. Хотя сама идея ИС и некото-рые принципы их организации возникли задолго до появления компьютеров, однако компьютеризация в десятки и сотни раз по-высила эффективность ИС и расширила сферы их применения. Трактовка информационных систем, как среды, составляющими элементами которой являются компьютеры, компьютерные сети, программные продукты, БД, люди, различного рода технические и программные средства связи и т. д., является весьма распростра-ненной в литературе. В этом случае ИС становится синонимом термина «автоматизированные информационные системы» (АИС). Можно отметить, что средствами автоматизации могли быть не только компьютерные технологии, но в настоящее время такие случаи крайне редки.

Исходя из того, что вы будущие специалисты в области инфор-мационных технологий, нас будут интересовать информационные системы, использующие компьютерную обработку информации.

Другой термин, широко используемый в литературе, — автома-тизированная система (АС). В серии стандартов 34 [19] его опреде-

ский комплекс, обеспечивающий сбор, создание, хранение, накопление, обработку, поиск, вывод, копирование, передачу и распространение ин-формации [4].

Чаще под ИТ понимаются приемы, способы и методы применения технических и программных средств при выполнении функций обработки информации [18]. В этом случае ИТ ассоциируется с компьютерными технологиями.

– 17 –

Page 18: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

ляют, как «система, состоящая из персонала и комплекса средств автоматизации его деятельности, реализующая информационную технологию выполнения установленных функций». Если учесть, что «функция автоматизированной системы — совокупность дей-ствий АС, направленная на достижение определенной цели» [19], то подмножеством АС являются информационные системы, ис-пользующие автоматизированный способ обработки информации (АИС). Обратите внимание, что термин АС шире АИС, т. к. вклю-чает понятия систем с неограниченным набором функциональных средств, в то время как функции АИС обязательно включают сбор, хранение и обработку информации.

êÖáûåÖ

В настоящее время не существует единого определения инфор-мации как научного термина. С точки зрения различных предмет-ных областей, данное понятие описывается своим набором призна-ков. Информация, существующая вне нашего сознания, имеет отражение в нашем восприятии как результат взаимодействия: от-ражения, чтения, получения в виде сигналов. Информация, зафик-сированная в данных, ее содержательный смысл необходимы поль-зователям информационных систем, являющимся специалистами различных наук и областей деятельности: химика интересует хи-мическая информация, географа — географическая, предпринима-теля — коммерческая, специалиста в информационных технологи-ях — информация по вопросам работы с данными.

Термин «Информационная система» используется как в широ-ком, так и в узком смысле. В широком смысле информационная система есть совокупность технического, программного и органи-зационного обеспечения, а также персонала, предназначенная для того, чтобы своевременно обеспечивать надлежащих людей надле-жащей информацией. В узком смысле информационной системой называют только подмножество компонентов ИС, в широком смыс-ле — включающую базы данных СУБД и специализированные прикладные программы. ИС в узком смысле рассматривают как

– 18 –

Page 19: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

программно-аппаратную систему, предназначенную для автомати-зации целенаправленной деятельности конечных пользователей, обеспечивающую, в соответствии с заложенной в нее логикой об-работки, возможность получения, модификации и хранения ин-формации.

Çéèêéëõ Ñãü ëÄåéèêéÇÖêäà

1. Что такое информация? 2. Как вы понимаете термин «система»? 3. С какими системами вы сталкиваетесь при проектировании

информационных систем? 4. Что такое АС? 5. Что такое АСУ? 6. В чем отличие информационной системы от АС? 7. Как вы думаете, что общего у информационной системы

и АСУ? 8. Как вы понимаете термин «знание»? 9. Чем, по вашему мнению, отличаются понятия «знания»

и «информация»? 10. Как вы считаете, чем отличаются понятия «информация»

и «данные»? 11. Как вы считаете, информация получается за счет переработ-

ки данных или данные получаются после переработки информа-ции?

– 19 –

Page 20: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

É·‚‡ 2. àçîéêåÄñàü à ÖÖ éÅêÄÅéíäÄ

§ 1. èéçüíàÖ àçîéêåÄñàà

Современная экономика немыслима без информации. Тысячи предприятий, миллионы налогоплательщиков, триллионы рублей, биржевые котировки, реестры акционеров — все эти информаци-онные потоки необходимо оценить, обработать, сделать необходи-мые выводы, принять правильное решение.

Современный специалист должен уметь принимать обоснован-ные решения. Для этого наряду с традиционными знаниями, такими как основы менеджмента, основы внешнеэкономической деятель-ности, банковское дело, административное управление, налогооб-ложение он должен владеть информацией по построению инфор-мационных систем.

Понятие информации весьма широко и многосторонне, по-этому имеет целый ряд определений и синонимов. Начиная с работ Н. Винера, К. Шеннона, Дж. фон Неймана до настоящего времени каждая попытка дать универсальное определение информации тер-пит крах из-за неразрешимости основного вопроса: един ли для всех «приемников» информации предлагаемый критерий отбора из всего множества воздействий материального мира тех и только тех воздействий, которые несут информацию для данного «приемни-ка»?

В настоящее время наиболее распространено убеждение, что такого универсального критерия и, следовательно, универсального определения информации не существует. Специфика информации определяется в первую очередь основной целью функционирова-ния системы. С этой точки зрения информацией являются все све-дения об объекте, полезные «приемнику» (человеку, коллективу, человеко-машинной системе) для решения задачи (достижения це-ли). Если данные сведения не нужны, они представляют собой «шум», а не информацию. Если данные сведения способствуют принятию неправильного решения, они представляют собой де-зинформацию.

– 20 –

Page 21: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

С позиции материалистической философии информация есть отражение реального мира с помощью сведений (сообщений). Со-общение — это форма представления информации в виде речи, текста, изображения, цифровых данных, графиков, таблиц и т. п. В широком смысле информация — это общенаучное понятие, вклю-чающее в себя обмен сведениями между людьми, обмен сигналами между живой и неживой природой, людьми и устройствами.

Вот пример одного из определений информации. Информа-ция — сведения об объектах и явлениях окружающей среды, их параметрах, свойствах и состоянии, которые уменьшают имею-щуюся о них степень неопределенности, неполноты знаний.

В силу того, что экономические системы занимают значитель-ное место в деятельности человека, можно выделить «экономиче-скую информацию». Значительная часть ее связана с обществен-ным производством и может быть названа «производственной информацией».

Экономическая информация — совокупность сведений, от-ражающих социально-экономические процессы и служащих для управления этими процессами и коллективами людей в производ-ственной и непроизводственной сфере.

В отличие от информации, имеющиеся данные — это зарегист-рированные на любых носителях сведения об объекте (реальном или вымышленном) независимо от того, дошли они до какого-нибудь приемника и интересуют ли они его [21]. В такой трактовке информация понимается как данные, ценные для получателя (при-емника). Это определение оказывается наиболее целесообразным для анализа информационных процессов, подчеркивает относи-тельную «важность» той или иной информации для решения кон-кретных задач. В такой трактовке данные представляют собой потенциальную информацию, и с этой точки зрения в информаци-онных системах накапливается не информация, а данные (потен-циальная информация). Информацией они становятся лишь по предоставлению их некоторому потребителю. В приведенном оп-ределении информация не отождествляется со знаниями. Инфор-мация — собрание данных, тогда как знание предполагает пости-

– 21 –

Page 22: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

жение действительности сознанием, организующим данные путем их анализа.

О знаниях невозможно говорить в отрыве от определения при-емника информации. Например, можно говорить о знаниях студен-та, ученого и т. д., т. е. о знаниях любого конкретного человека, можно говорить о знаниях, накопленных человечеством, но трудно говорить о знаниях дрессированной мыши или о знаниях ЭВМ. В первом случае мы имеем дело с сознанием человека или общест-ва в целом, во втором — такое сознание отсутствует. Можно пред-ставить себе машину с искусственным интеллектом, способную организовать данные. Однако нельзя говорить о «сознании» такой машины, поскольку аппарат организации данных предопределен сознанием ее создателей.

Говоря о данных, информации, нельзя обойти понятие «научная информация» [22]. Научная информация — это получаемая в процессе познания логическая информация, которая адекватно отображает закономерности объективного мира и используется в общественно-исторической практике. В этом определении названы четыре наиболее существенных признака, которые необходимы и, по-видимому, достаточны для раскрытия понятия «научная инфор-мация».

Однако не всякая информация, получаемая в процессе познания внешнего мира, есть научная. Например, чувственные познания человека не в состоянии раскрыть общего в явлениях, внутренней природы вещей, тогда как только знание законов природы и обще-ственной жизни может служить для него руководством в практиче-ской деятельности. Информация становится научной лишь тогда, когда она подвергнута обработке и обобщению абстрактно-логическим мышлением. Именно этим научная информация отли-чается от сведений, получаемых человеком в процессе чувственно-го познания мира (действительности) [9].

При работе с информацией всегда имеется ее источник и потре-битель (получатель). Пути и процессы, обеспечивающие передачу сообщений от источника информации к ее потребителю, называют-ся информационными коммуникациями.

– 22 –

Page 23: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

Для потребителя информации очень важной характеристикой является ее адекватность.

Адекватность информации — это определенный уровень со-ответствия создаваемого с помощью полученной информации об-раза реальному объекту, процессу, явлению и т. п.

В реальной жизни вряд ли возможна ситуация, когда вы сможе-те рассчитывать на полную адекватность информации. Всегда при-сутствует некоторая степень неопределенности. От степени адек-ватности информации реальному состоянию объекта или процесса зависит правильность принятия решений человеком.

Адекватность информации может выражаться в трех формах: семантической, синтаксической, прагматической.

Синтаксическая адекватность. Она отображает формально-структурные характеристики информации и не затрагивает ее смы-слового содержания. На синтаксическом уровне учитываются тип носителя и способ представления информации, скорость передачи и обработки, размеры кодов представления информации, надеж-ность и точность преобразования этих кодов и т. п. Информацию, рассматриваемую только с синтаксических позиций, обычно назы-вают данными, т. к. при этом не имеет значения смысловая сторо-на. Эта форма способствует восприятию внешних структурных ха-рактеристик, т. е. синтаксической стороны информации.

Семантическая (смысловая) адекватность. Эта форма опре-деляет степень соответствия образа объекта и самого объекта. Се-мантический аспект предполагает учет смыслового содержания информации. На этом уровне анализируются те сведения, которые отражает информация, рассматриваются смысловые связи. В ин-форматике устанавливаются смысловые связи между кодами пред-ставления информации. Эта форма служит для формирования понятий и представлений, выявления смысла, содержания инфор-мации и ее обобщения.

Прагматическая (потребительская) адекватность. Она от-ражает отношение информации и ее потребителя, соответствие ин-формации цели управления, которая на ее основе реализуется. Проявляются прагматические свойства информации только при наличии единства информации (объекта), пользователя и цели

– 23 –

Page 24: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

управления. Прагматический аспект рассмотрения связан с ценно-стью, полезностью использования информации при выработке по-требителем решения для достижения своей цели. С этой точки зре-ния анализируются потребительские свойства информации. Эта форма адекватности непосредственно связана с практическим ис-пользованием информации, с соответствием ее целевой функции деятельности системы.

§ 2. ÇàÑõ àçîéêåÄñàà

Информация может быть двух видов: дискретная информация и непрерывная (аналоговая). Дискретная информация характери-зуется последовательными точными значениями некоторой вели-чины, а непрерывная — непрерывным процессом изменения неко-торой величины. Непрерывную информацию может, например, выдавать датчик атмосферного давления или датчик скорости ав-томашины. Дискретную информацию можно получить от любого цифрового индикатора: электронных часов, счетчика магнитофона и т. п.

Дискретная информация удобнее для обработки человеком, но непрерывная информация часто встречается в практической рабо-те, поэтому необходимо уметь переводить непрерывную информа-цию в дискретную (дискретизация) и наоборот. Модем (это слово происходит от слов модуляция и демодуляция) представляет собой устройство для такого перевода: он переводит цифровые данные от компьютера в звук или электромагнитные колебания-копии звука и наоборот.

При переводе непрерывной информации в дискретную важна так называемая частота дискретизации ν, определяющая период (T = 1/ν) между измерениями значений непрерывной величины (рис. 2.1).

Чем выше частота дискретизации, тем точнее происходит пере-вод непрерывной информации в дискретную. Но с ростом этой час-тоты растет и размер дискретных данных, получаемых при таком переводе, и, следовательно, сложность их обработки, передачи и

– 24 –

Page 25: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

хранения. Однако для повышения точности дискретизации необя-зательно безграничное увеличение ее частоты. Эту частоту разумно увеличивать только до предела, определяемого теоремой о выбор-ках, называемой также теоремой Котельникова или законом Найк-виста.

Исходный сигнал

Дискретизированный сигнал

Рис. 2.1. Различные виды информации

Любая непрерывная величина описывается множеством нало-женных друг на друга волновых процессов, называемых гармони-ками, определяемых функциями вида

sin( )A tω +ϕ ,

где A — амплитуда, ω — частота, t — время и ϕ — фаза. Теорема о выборках утверждает, что для точной дискретиза-

ции ее частота должна быть не менее чем в два раза выше наи-большей частоты гармоники, входящей в дискретизируемую вели-чину.

Примером использования этой теоремы являются лазерные компакт-диски, звуковая информация на которых хранится в циф-ровой форме. Чем выше будет частота дискретизации, тем точнее будут воспроизводиться звуки и тем меньше их можно будет запи-

– 25 –

Page 26: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

сать на один диск, но ухо обычного человека способно различать звуки с частотой до 20 КГц, поэтому точно записывать звуки с большей частотой бессмысленно. Согласно теореме о выборках частоту дискретизации нужно выбрать не меньшей 40 КГц (в про-мышленном стандарте на компакт-диске используется частота 44.1 КГц).

При преобразовании дискретной информации в непрерывную определяющей является скорость этого преобразования: чем она выше, с тем более высокочастотными гармониками получится не-прерывная величина. Но чем большие частоты встречаются в этой величине, тем сложнее с ней работать. Например, обычные теле-фонные линии предназначены для передачи звуков частотой до 3 КГц. Связь скорости передачи и наибольшей допустимой частоты подробнее будет рассмотрена далее.

Устройства для преобразования непрерывной информации в дискретную обобщающе называются АЦП (аналого-цифровой пре-образователь) или ADC (Analog to Digital Convertor, A/D), а устрой-ства для преобразования дискретной информации в аналоговую — ЦАП (цифро-аналоговый преобразователь) или DAC (Digital to Analog Convertor, D/A).

§ 3. ïêÄçÖçàÖ, àáåÖêÖçàÖ, éÅêÄÅéíäÄ à èÖêÖÑÄóÄ àçîéêåÄñàà

Для хранения информации используются специальные устрой-ства памяти. Дискретную информацию хранить гораздо проще не-прерывной, т. к. она описывается последовательностью чисел. Если представить каждое число в двоичной системе счисления, то дис-кретная информация предстанет в виде последовательностей нулей и единиц. Присутствие или отсутствие какого-либо признака в не-котором устройстве может описывать некоторую цифру в какой-нибудь из этих последовательностей. Например, позиция на диске-те описывает место цифры, а полярность намагниченности — ее значение. Для записи дискретной информации можно использовать ряд переключателей, перфокарты, перфоленты, различные виды

– 26 –

Page 27: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

магнитных и лазерных дисков, электронные триггеры и т. п. Одна позиция для двоичной цифры в описании дискретной информации называется битом (bit, binary digit). Бит служит для измерения ин-формации. Информация размером в один бит содержится в ответе на вопрос, требующий ответа «да» или «нет». Непрерывную ин-формацию тоже измеряют в битах.

Бит — это очень маленькая единица, поэтому часто использу-ется величина в 8 раз большая — байт (byte), состоящая из двух 4-битных полубайт или тетрад. Байт обычно обозначают заглавной буквой B или Б. Как и для прочих стандартных единиц измерения для бита и байта существуют производные от них единицы, обра-зуемые при помощи приставок кило (K), мега (M), гига (G или Г), тера (T), пета (P или П) и др. Но для битов и байтов они означают не степени 10, а степени двойки: кило — 210=1024 ≈103, мега — 220 ≈ 106, гига — 230 ≈ 109, тера — 240 ≈ 1012, пета — 250 ≈ 1015. Напри-мер, 1 KB = 8 Кbit = 1024 B = 8192 bit, 1 МБ = 1024 КБ = 1048576 Б = = 8192 Кбит.

Для обработки информации используют вычислительные ма-шины, которые бывают двух видов: ЦВМ (цифровая вычислитель-ная машина) — для обработки дискретной информации, АВМ (аналоговая вычислительная машина) — для обработки непрерыв-ной информации. ЦВМ — универсальны, на них можно решать любые вычислительные задачи с любой точностью, но с ростом точности скорость их работы уменьшается. ЦВМ — это обычные компьютеры.

Каждая АВМ предназначена только для узкого класса задач, например, интегрирования или дифференцирования. Если на вход такой АВМ подать сигнал, описываемый функцией f(t), то на ее выходе появится сигнал F(t) или f ′ ( t). АВМ работают очень бы-стро, но их точность ограничена и не может быть увеличена без аппаратных переделок. Программа для АВМ — это электрическая схема из заданного набора электронных компонент, которую нуж-но физически собрать.

Бывают еще и гибридные вычислительные машины, сочетаю-щие в себе элементы как ЦВМ, так и АВМ.

– 27 –

Page 28: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

Кодированием, например, является шифровка сообщения, де-кодированием — его дешифровка.

Процедуры кодирования и декодирования могут повторяться много раз. Ошибки при передаче информации происходят из-за шума в канале (атмосферные и технические помехи), а также при кодировании и декодировании. Теория информации изучает, в ча-стности, способы минимизации количества таких ошибок.

Скорость передачи информации измеряется в количестве пере-данных за одну секунду бит или в бодах (baud): 1 бод = 1 бит/сек (bps). Производные единицы для бода такие же, как и для бита и байта, например, 10 Kbaud = 10240 baud.

Информацию можно передавать последовательно, т. е. бит за битом, и параллельно, т. е. группами фиксированного количества бит. Параллельный способ быстрее, но он часто технически слож-нее и дороже, особенно при передаче данных на большие расстоя-ния. Параллельный способ передачи используют, как правило, только на расстоянии не более 5 метров.

§ 4. ëèéëéÅõ àáåÖêÖçàü àçîéêåÄñàà

Понятие количества информации естественно возникает, на-пример, в следующих типовых случаях:

1. Равенство вещественных переменных a = b, заключает в се-бе информацию о том, что a равно b. Про равенство a2 = b2 можно сказать, что оно несет меньшую информацию, чем первое, т. к. из первого следует второе, но не наоборот. Равенство a 3 = b 3 несет в себе информацию по объему такую же, как и первое.

2. Пусть происходят некоторые измерения с некоторой по-грешностью. Тогда чем больше будет проведено измерений, тем больше информации об измеряемой сущности будет получено.

3. Математическое ожидание некоторой случайной величины (СВ) содержит в себе информацию о самой СВ. Для СВ, распреде-ленной по нормальному закону, с известной дисперсией знание ма-тематического ожидания дает полную информацию о СВ.

– 28 –

Page 29: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

4. Рассмотрим схему передачи информации. Пусть передатчик описывается СВ X, тогда из-за помех в канале связи на приемник будет приходить СВ Y = X + Z, где Z — это СВ, описывающая по-мехи. В этой схеме можно говорить о количестве информации, со-держащейся в СВ Y, относительно X. Чем ниже уровень помех (дисперсия Z мала), тем больше информации можно получить из Y. При отсутствии помех Y содержит в себе всю информацию об X.

В 1865 г. немецкий физик Рудольф Клаузиус ввел в статистиче-скую физику понятие энтропии или меры уравновешенности сис-темы.

В 1921 г. основатель большей части математической статисти-ки, англичанин Роналд Фишер впервые ввел термин «информация» в математику, но полученные им формулы носят очень специаль-ный характер.

В 1948 г. Клод Шеннон в своих работах по теории связи выпи-сывает формулы для вычисления количества информации и энтро-пии. Термин энтропия используется Шенноном по совету патри-арха компьютерной эры фон Неймана, отметившего, что получен-ные Шенноном для теории связи формулы для ее расчета совпали с соответствующими формулами статистической физики, а также то, что «точно никто не знает» что же такое энтропия.

Параметр количества информации имеет разные выражения и интерпретацию в зависимости от рассматриваемой формы адекват-ности. Каждой форме адекватности соответствует своя мера коли-чества информации.

Синтаксическая мера информации (вероятностный подход к измерению дискретной и непрерывной информации)

Эта мера количества информации оперирует с обезличенной информацией, не выражающей смыслового отношения к объекту.

Количество информации I на синтаксическом уровне невоз-можно определить без рассмотрения понятия неопределенности состояния системы (энтропии системы). Действительно, получение информации о какой-либо системе всегда связано с изменением степени неосведомленности получателя о состоянии этой системы.

– 29 –

Page 30: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

В основе теории информации лежит предложенный Шенноном способ измерения количества информации, содержащейся в одной СВ, относительно другой СВ. Этот способ приводит к выражению количества информации числом.

Для дискретных случайных величин X и Y, заданных законами распределения P(X = Xi) = pi, P(Y = Yi) = qi и совместным распреде-лением P(X = Xi, Y = Yj) = pij, количество информации, содержа-щейся в X относительно Y, равно

( )2

2,

4, log

2ij

iji ji j

p b b acI X Y p

p q a− ± −

=∑ .

Для непрерывных СВ X и Y, заданных плотностями распреде-ления вероятностей pX(t1), pY(t2) и pXY(t1, t2), аналогичная формула имеет вид:

( ) ( ) ( )( ) ( )∫∫

=2

2121

21221

,log,, dtdttptp

ttpttpYXIYX

XYXY .

Очевидно, что

( ) ( )0

,i ji

при i jP X X X X

P X X при i j

⎧ ≠⎪⎨= = =

= =⎪⎩

и, следовательно,

( ) 2 2, log loii i

i ii i

pI X X p p p

p p= =−∑ ∑ g i

i j

H X Y p=−∑

.

Энтропия дискретной СВ в теории информации определяется формулой

H(X) = HX = I(X, X). Свойства меры информации и энтропии: 1. I(X, Y) ≥ 0, I(X, Y) = 0 ⇔ X,Y — независмы. 2. I(X, Y) = I(Y, X). 3. HX = 0 ⇔ X — константа. 4. I(X, Y) = HX + HY – H(X, Y), где gij ijp . ( ) 2

,

, lo

5. I(X, Y) ≤ I(X,X). Если I(X,Y) = I(X,X), то X — функция от Y.

– 30 –

Page 31: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

Доказательство: 1. Логарифмированием из очевидного для всех x неравенства 1 xe x− ≥ (равенство устанавливается только при x = 1) получается

неравенство 1 lnx x− ≥ или ( ) 21 / ln 2 logx x− ≥ .

( ) 2, ,

,

,

1, log

ln 2

1 10,

ln 2 ln 2 ln 2

i j

i j ijij ij

iji j i j

i j iji j ij i j i j

i j

p qp q p

I X Y p pp

p q pp q p

− = ≤

−− −

= =

∑ ∑

∑ ∑ ∑∑

=

=

0

т. е. только при ( ),I X Y = ij i jp p q= для всех i и j, т. е. при неза-висимости X и Y. Если X и Y независимы, то ij i jp p q= и, следова-тельно, аргументы логарифмов равны 1 и, следовательно, сами ло-гарифмы равны 0, что означает: . ( ), 0I X Y =

2. Следует из симметричности формул относительно аргумен-тов.

3. Если HX = 0, то все члены суммы, определяющей HX, долж-ны быть нули, что возможно тогда и только тогда, когда X — кон-станта.

4. Из четырех очевидных соотношений , ,ij i ij j

j i

p p p= =∑ ∑ q

i

j

2 2,

log logi i iji i j

HX p p p p=− =−∑ ∑ ,

2 2,

log logj j ijj i j

HY q q p q=− =−∑ ∑

получается

– 31 –

Page 32: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

( ) ( ) ( )2 2 2,

, ,iHX HY H X Y I X Y+ − = =∑ . log log logij ij ji j

p p q p− −

5. Нужно доказать или .

( ) ( ), ,I X Y HX HY H X Y HX= + − ≤ ( ), 0HY H X Y− ≤

( ) 2 2 2,

logij ijji j, ,

, log log ijij j ij

i j i j

pHY p p

q=∑ ,

но ( ) ( ),ij i j j j

H X Y p q p− =− +∑ ∑

p P X X Y Y q P Y Y= = = ≤ = = , а значит аргументы

у в гарифмов не больше 1 , за это значит, что вся сумма не больше 0.

Если ) то для каждого равно либо q

i j

сех ло и, следовательно начения лога-рифмов не больше 0,

j

либо 0. Но из ( ) ), /ij i j

( ) (, ,HX I X X I X Y= = , ijip

(p P X X Y Y P Y= = = = X X Y= = ⋅

( ) { },0j jY Y q= ∈ следует ( ) { }/ 0,1i jP X X Y Y= = ∈ , что воз-

мож с

P⋅

H(X, Y) и H(Y, Y). кон распределения ероятн стей дискре ых

X .

но только в лучае, когда X — функция от Y. При независимости СВ X и Y одна из них ничем не описывает

другую, что и отражается в , что для так том их СВ I(X, Y) = 0. Рассмотрим пример измерения количества информации при

подбрасывании двух игральных костей. Пусть дискретная СВ X равна количеству очков, выпавших на

игральной кости, а дискретная СВ Y равна 0, если выпавшее коли-чество очков нечетно, и 1, если выпавшее количество очков четно. Найти

Составим и Y

за ы в о тн СВ

X 1 2 3 4 5 6 Y 0 1

p /6 p 1/6 1/6 1/6 1/6 1/6 1 1/2 1/2

– 32 –

Page 33: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

Таким образом, при i = 1, …, 6 ( ) 1/ 6ip P X i= = = и, соответ-ственно, при j = 0,1 q ( ) 1/ 2j P Y j= = = .

о вим акж закон совмест го ас ед ен вероятностей этих дискретных СВ

С ста т е но р пр ел ия

X 1 3 5 2 4 6 1 3 5 2 4 6

Y 0 0 0 1 1 1 1 1 1 0 0 0

p 1/6 1/6 1/6 1/6 1/6 1/6 0 0 0 0 0 0

Таким образом,

( )0 если четно,

, 1 , иначе.6ij

i jp P X i Y j

⎧ + −⎪⎨= = = =⎪⎩

( ) 2 2,

1 бит, log 6 log 2 1 .символ6ij

iji ji j

pI X Y p

p q= = =∑

( )1

20

1 бит, log 2 1 .символ2j jj

I Y Y q q=

=− = =∑

Точное количество выпавших очков дает точную информацию о четности, т. е. 1 бит. Из I(X, Y) = I(Y, Y) = 1 бит/сим и 3-го свойст-ва информации следует, что информация об X полностью опреде-ляе X) = 1 + log23 ≈ ≈ 2,58 бит/сим. Действительно, Y функционально зависит от X, а X от Y функционально не зависит.

Расчеты через энтропию будут следующим,

опии

т Y, но не наоборот, т. к. I(X, Y) ≠ I(X,

и: ( ) 2 2 2

,

, log log 6 1 log 3ij iji j

H X Y p p HX=− = = + =∑

( ), 1 бит/сим.I X Y HX HY HX HY= + − = =

Смысл энтр Шеннона

– 33 –

Page 34: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

Энтропия дискретной СВ — это минимум среднего количества бит, которое нужно передавать по каналу связи о текущем значе-нии данной дискретной СВ.

Рассмотрим пример (скачки). В заезде участвуют 4 лошади с равными шансами на победу, т. е. вероятность победы каждой ло-шади равна 1/4. Введем дискретную СВ X, равную номеру побе-дившей лошади. Здесь HX = 2. После каждого заезда по каналам связи достаточно будет передавать два бита информации о номере победившей лошади. Кодируем номер лошади следующим обра-зом: 1 — 00, 2 — 01, 3 — 10, 4 — 11. Если ввести функцию L(X), которая возвращает длину сообщения, кодирующего заданное зна-чение X, то математическое ожидание ML(X) — это средняя длина сообщения, кодирующего X. Можно формально определить L через две функции L(X) = len(code(X)), где code(X) каждому значению X станознач ного кода.

ее распределение:

P(X = 1) = 3/4, P(X = 2) = 1/8, P(X = 3) = P(X = 4) = 1/16,

т. е. лошадь с номером 1 — это фаворит. Тогда

ие называют префиксным). В среднем в 16

мат X) сейчас задает-ся делением вероятностей: P(L(X) = 1) = 3/4, P(L

.

вит в соответствие некоторый битовый код, причем взаимно од-но, а len возвращает длину в битах для любого конкретВ этом примере ML(X) = HX.

Пусть теперь дискретная СВ X имеет следующ

2 2 2

2

3 / 4 log 3 / 4 1 / 8 log 8 1 / 8 log 1619 / 8 3 / 4 log 3 1,186 бит/сим.

HX =− ⋅ + ⋅ + ⋅ =

= − ⋅ ≈

Закодируем номера лошадей: 1 — 0, 2 — 10, 3 — 110, 4 — 111, — т. е. так, чтобы каждый код не был префиксом другого кода (по-добное кодирован заез-дах 1-я лошадь должна победить в 12 из них, 2-я — в 2-х, 3-я — в 1-м и 4-я — в 1-м. Таким образом, средняя длина сообщения о по-бедителе равна (1 12 2 2 3 1 1 3) /16 1,375 бит/сим.⋅ + × + ⋅ + ⋅ = или

ематическое ожидание L(X). Действительно, L(следующим распре(X) = 2) = 1/8, P(L(X) = 3) = 1/8. Следовательно, ML(X) = 3/4 + 2/8 + 3/8 = 11/8 = 1,375 бит/сим

– 34 –

Page 35: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

Итак, ML(X) > HX. Можно доказать, что более эффективного кодирования для

двух рассмотренных случаев не существует. То, что энтропия Шеннона соответствует интуитивному пред-

ставлению о мере информации, может быть продемонстрировано в опыте по определению среднего времени психических реакций.

гается одна из N лампочек, которую н указать. Проводит-

ется с определенной вероятностью N

i i

Опыт заключается в том, что перед испытуемым человеком зажи- он долже

ся большая серия испытаний, в которых каждая лампочка зажига-

i 1

p p=

⎛ ⎞⎜ ⎟⎜ ⎟∑ , где i — это номер

азывается, среднее время, необходимое для правиль-

21

logN

i ii

⎝ ⎠лампочки. Окного ответа испытуемого, пропорционально величине энтропии

p p=

−∑ , а не числу лампочек N, как можно было бы поду-

мать. В этом о е информации будет получено обработки и, соо

жности существоваа

р явля-

пыте предполагается, что чем больш человеком, тем дольше будет время ее

тветственно, реакции на нее.

Семантическая мера информации

В 50-х гг. XX в. появились первые попытки определения абсо-лютного информационного содержания предложений естественно-го языка. Стоит отметить, что сам Шеннон однажды заметил, что смысл сообщений не имеет никакого отношения к его теории ин-формации, целиком построенной на положениях теории вероятно-стей. Но его способ точного измерения информации наводил на мысль о возмо ния способов точного измерения информации более общего вид , например, информации из пред-ложений естественного языка. Примером одной из таких меется функция ( ) ( )2inf logs p s=− , где s — это предложение, смы-словое содержание которого измеряется, p(s) — вероятность

ой функции-меры: 1. Если s1 ⇒ s2 (из s1 следует s2) — истинно, то inf(s1) ≥ inf(s2).

истинности s. Вот некоторые свойства эт

– 35 –

Page 36: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

2. inf(s) ≥ 0. 3. Если s — истинно, то inf(s) = 0.

. Пример: из s — «a > 3» и s

ической информации также используется фун

ации со способностью поль-зов

зователя.

еняется количество сем

в свой тезаурус.

:

ацию;

огда поступающая информация понятна пол

4. inf(s1s2) = inf(s1) + inf(s2) ⇔ p(s1s2) = p(s1)p(s2), т. е. независи-мости s1и s2.

Значение этой функции-меры больше для предложений, исклю-чающих большее количество возможностей 1

2 — «a = 7» следует, что s1 ⇒ s2 или inf(s1) ≥ inf(s2); ясно, что s2 исключает больше возможностей, чем s1.

Для измерения семанткция-мера cont(s) = 1 – p(s). Ясно, что cont(s) = 1 – 2–inf(s) или

inf(s) = –log2(1 – cont(s)). Кроме изложенных методик для измерения смыслового содер-

жания информации, т. е. ее количества на семантическом уровне, наибольшее признание получила тезаурусная мера, которая связы-вает семантические свойства информ

ателя принимать поступившее сообщение. Для этого использу-ется понятие тезаурус поль

Тезаурус — это совокупность сведений, которыми располагает пользователь или система.

В зависимости от соотношений между смысловым содержани-ем информации и тезаурусом пользователя изм

антической информации, воспринимаемой пользователем и включаемой им в дальнейшем

Рассмотрим два предельных случая, когда количество семанти-ческой информации равно 0

• при Sp ≈ 0 пользователь не воспринимает, не понимает по-ступающую информ

• при Sp → ∞ пользователь все знает, и поступающая информа-ция ему не нужна.

Максимальное количество семантической информации потре-битель приобретает при согласовании ее смыслового содержания со своим тезаурусом, к

ьзователю и несет ему ранее не известные (отсутствующие в его тезаурусе) сведения.

– 36 –

Page 37: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

Следовательно, количество семантической информации в со-общении, количество новых знаний, получаемых пользователем, является величиной относительной. Одно и то же сообщение может иметь смысловое ателя и быть бессмысл ьзователя не-ком

стями использова-ния

ческие свойства (ценность) информации можно определить приростом экономического эффек-та функционирования, достигнутым благодар ользованию этой

β упр

ления α, P(α/β) — ожидаемый эффект функционирования системы α при

усло и для управления будет использована информация со-держ

содержание для компетентного пользовенным (семантический шум) для пол

петентного.

Прагматическая мера информации

Эта мера определяет полезность информации (ценность) для достижения пользователем поставленной цели. Эта мера также ве-личина относительная, обусловленная особенно

этой информации в той или иной системе. Ценность информа-ции целесообразно измерять в тех же самых единицах (или близких к ним), в которых измеряется целевая функция.

В экономической системе прагмати

я испинформации для управления системой:

,

где IП,β(α) — ценность информационного сообщения для системы

( ) ( / ) ( )ПI P Pβ α = α β − α ,

авления α; P(α) — априорный ожидаемый экономический эффект функ-

ционирования системы управ

в и, что , ащаяся в сообщении β.

§ 5. äãÄëëàîàäÄñàü à äéÑàêéÇÄçàÖ àçîéêåÄñàà

Общие сведения о системе классификации

Важным понятием при работе с информацией является клас-сификация объектов.

– 37 –

Page 38: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

Классификация — система распределения объектов (предме-тов, явлений, процессов, понятий) по классам в соответствии с оп-ределенным признаком.

Под объектом понимается любой предмет, процесс, явление материального или нематериального свойства. Система классифи-кации позволяет сгруппировать объекты выделить определенные классы, которые будут характеризоваться рядом общих свойств. Классификация объектов — это процедура группировки на качест-вен

и-онн

бо признаками (например, цвет, марка машины, фамилия).

выявления общих свойств информационного объекта, кла

оизводимой продукции и т. д.

разную информацию, реализуются разны-

лательно, чтобы соблюдались

няются государственные, отр

ном уровне, направленная на выделение однородных свойств. Применительно к информации как к объекту классификации выде-ленные классы называют информационными объектами.

Свойства информационного объекта определяются информацыми параметрами, называемыми реквизитами. Реквизиты пред-

ставляются либо числовыми данными (например, вес, стоимость, год), ли

Реквизит — логически неделимый информационный элемент, описывающий определенное свойство объекта, процесса, явления и т. п.

Кромессификация нужна для разработки правил (алгоритмов) и про-

цедур обработки информации, представленной совокупностью рек-визитов.

Алгоритм обработки информационных объектов фирмы позво-ляет получить информацию об объемах продаж, о прибыли, заказ-чиках, видах пр

Алгоритмы обработки в том и другом случае преследуют раз-ные цели, обрабатывают ми способами.

При любой классификации жеследующие требования:

• полнота охвата объектов рассматриваемой области; • однозначность реквизитов; • возможность включения новых объектов. В любой стране разработаны и примеаслевые, региональные классификаторы. Например, классифи-

– 38 –

Page 39: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

цир

знака, кот

Разработаны иерархиче-ский, фасетн тся разной стр

тодов для создания систем классификации.

строится

ссификационного признака

соответствии со своим, харак-терным для него классификационным признаком делится на под-клас образуют 2-й уровень;

класс 2-го уровня аналогично делится на группы, ко-торые образуют 3-й уровень, и т. д.

ованы: отрасли промышленности, оборудование, профессии, единицы измерения, статьи затрат и т. д.

Классификатор — систематизированный свод наименований и кодов классификационных группировок.

При классификации широко используются понятия классифи-кационный признак и значение классификационного при

орые позволяют установить сходство или различие объектов. Возможен подход к классификации с объединением этих двух по-нятий в одно; названное как признак классификации. Признак классификации имеет также синоним «основание деления».

три метода классификации объектов: ый, дескрипторный. Эти методы различаю

атегией применения классификационных признаков. Рассмотрим основные идеи этих ме

Иерархическая система классификации

Иерархическая система классификации (рис. 2.2) следующим образом:

• исходное множество элементов составляет 0-й уровень и де-лится в зависимости от выбранного клана классы (группировки), которые образуют 1-й уровень;

• каждый класс 1-го уровня в

сы, которые• каждый

– 39 –

Page 40: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

0-й уровень

1-й уровень

2-й уровень

3-й уровень

Рис. 2.2. Иерархическая система классификации

Учитывая достаточно жесткую процедуру построения структу-ры классификации, необходимо перед началом работы определить ее цель, т. е. какими свойствами должны обладать объединяемые в классы объекты. Эти свойства принимаются в дальнейшем за при-знаки классификации.

В иерархической системе классификации из-за жесткой струк-туры особое внимание следует уделить выбору классификацион-

ационного

и, соответствующее числу признаков, выб , характеризу-ет г

ных признаков. В данной системе классификации каждый объект на любом

уровне должен быть отнесен к одному классу, который характери-зуется конкретным значением выбранного классификпризнака. Для последующей группировки в каждом новом классе необходимо задать свои классификационные признаки и их значе-ния. Таким образом, выбор классификационных признаков будетзависеть от семантического содержания того класса, для которого необходима группировка на последующем уровне иерархии.

Количество уровней классификациранных в качестве основания деления

лубину классификации. Достоинства иерархической системы классификации: • простота построения; • использование независимых классификационных признаков

в различных ветвях иерархической структуры.

– 40 –

Page 41: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

Недостатки иерархич й системы классификации: • жесткая структура, которая приводит к сложности внесения

изменений, т. к. приходится перераспределять все классификаци-онные группировки;

еско

очение. , фасет цвет содержит значения: красный, белый, зе-

леный, черный, желтый. Фасет специальность содержит названия специальностей. Фасет образование содержит значения: среднее, среднее специальное, высшее.

Схема построения фасетной системы классификации в виде таблицы отображена на рис. 2.3. Названия столбцов соответствуют выделенным классификационным признакам (фасетам), обозна-ченным Ф1, Ф2, …, Фi, …, Фn. Например, цвет, размер одежды, вес и т. д. Произведена нумерация строк таблицы. В каждой клетке таблицы хранится конкретное значение фасета. Например, фасет цвет, обозначенный Ф2, содержит значения: красный, белый, зеле-ный, черный, ж

• невозможность группировать объекты по заранее не преду-смотренным сочетаниям признаков.

Фасетная система классификации

Фасетная система классификации, в отличие от иерархической, позволяет выбирать признаки классификации независимо как друг от друга, так и от семантического содержания классифицируемого объекта. Признаки классификации называются фасетами (facet — рамка). Каждый фасет ( )iФ содержит совокупность однородных значений данного классификационного признака. Причем значения в фасете могут располагаться в произвольном порядке, хотя пред-почтительнее их упоряд

Например

елтый.

– 41 –

Page 42: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

Рис. 2.3. Фасетная система классификации

Процедура классификации состоит в присвоении каждому объ-екту соответствующих значений из фасетов. При этом могут быть использованы не все фасеты. Для каждого объекта задается кон-кретная группировка фасетов структурной формулой, в которой отражается их порядок следования:

( )1 2, , , , ,s i nK Ф Ф Ф Ф= … … ,

где Фi — i-й фасет; n — количество фасетов. При построении фасетной системы классификации необходимо,

чтобы значения, используемые в различных фасетах, не повторя-лис

кретные значения любого фасета.

овок;

ссификации является слож-

Дескрипторная система классификации

ь. Фасетную систему легко можно модифицировать, внося из-менения в кон

Достоинства фасетной системы классификации: • возможность создания большой емкости классификации, т. е.

использования большого числа признаков классификации и их зна-чений для создания группир

• возможность простой модификации всей системы классифи-кации без изменения структуры существующих группировок.

Недостатком фасетной системы кланость ее построения, т. к. необходимо учитывать все многообразие классификационных признаков.

– 42 –

Page 43: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

Для организации поиска информации, для ведения тезаурусов (словарей) эффективно используется дескрипторная (описательная) система классификации, язык которой приближается к естествен-ному языку описания информационных объектов. Особенно широ-ко она используется в библиотечной системе поиска.

Суть дескрипторного метода классификации заключается в следующем:

• отбирается совокупность ключевых слов или словосочета-ний, описывающих определенную предметную область или сово-купность однородных объектов. Причем среди ключевых слов мо-гут находиться синонимы;

• выбранные ключевые слова и словосочетания подвергаются нор

словарь дескрипторов, т. е. словарь ключевых

аны: студент, обучаемый, учащийся, преподава-

, практическое занятие, занятие и т. д. Среди указанных ключевых слов встречаются как студент, обучае-мый, учащийся; препо ; факультет, подраз-дел

, аудитория, лек-ция

орами устанавливаются связи, которые позво-ляю

некоторую совокупность

мализации, т. е. из совокупности синонимов выбирается один или несколько наиболее употребимых;

• создаетсяслов и словосочетаний, отобранных в результате процедуры нор-мализации.

Например, в качестве предметной области выбирается учебная деятельность в высшем учебном заведении. Ключевыми словами могут быть выбртель, учитель, педагог, лектор, ассистент, доцент, профессор, кол-лега, факультет, подразделение университета, аудитория, комната, лекция

синонимы такие, даватель, учитель, педагог

ение университета и т. д. После нормализации словарь дескрип-торов будет состоять из следующих слов: студент, преподаватель, лектор, ассистент, доцент, профессор, факультет

, практическое занятие и т. д. Между дескриптт расширить область поиска информации. Связи могут быть

трех видов: • синонимические, указывающие

ключевых слов как синонимы (студент — учащийся — обучаемый);

– 43 –

Page 44: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

• родо-видовые, отражающие включение некоторого класса объектов в более представительный класс (университет — факуль-тет — кафедра);

• ассоциативные, соединяющие дескрипторы, обладающие общими свойствами (студент — экзамен — профессор — аудито-рия).

Системы кодирования

Система кодирования применяется для замены названия объек-та на условное обозначение (код) в целях обеспечения удобной и более эффективной обработки информации.

Система кодирования — совокупность правил кодового обо-значения объектов.

Код строится на базе алфавита, состоящего из букв, цифр и других символов. Код характеризуется:

• длиной — число позиций в коде; • структурой — порядок расположения в коде символов, ис-

пользуемых для обозначения классификационного признака. Процедура присвоения объекту кодового обозначения называ-

ется кодированием. Можно выделить две группы методов, ис-пол

ользуется для иерархиче-

ьзуемых в системе кодирования, которые образуют: • классификационную систему кодирования, ориентированную

на проведение предварительной классификации объектов либо на основе иерархической системы, либо на основе фасетной системы;

• регистрационную систему кодирования, не требующую предварительной классификации объектов.

Классификационное кодирование. Классификационное коди-рование применяется после проведения классификации объектов. Различают последовательное и параллельное кодирование.

Последовательное кодирование испской классификационной структуры. Суть метода заключается в следующем: сначала записывается код старшей группировки 1-го уровня, затем код группировки 2-го уровня, затем код группировки 3-го уровня и т. д. В результате получается кодовая комбинация, каждый разряд которой содержит информацию о специфике выде-

– 44 –

Page 45: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

ленной группы на каждом уровне иерархической структуры. По-следовательная система кодирования обладает теми же достоинст-вам

классификации. Регистрационное кодирование. Регистрационное кодирование

используется для ъектов и не тре-бует предварительной классификации объектов. Различают поряд-ков

ющей. Применяется то-гда

и и недостатками, что и иерархическая система классификации. Параллельное кодирование используется для фасетной систе-

мы классификации. Суть метода заключается в следующем: все фасеты кодируются независимо друг от друга; для значений каждо-го фасета выделяется определенное количество разрядов кода. Па-раллельная система кодирования обладает теми же достоинствами и недостатками, что и фасетная система

однозначной идентификации об

ую и серийно-порядковую систему. Порядковая система кодирования предполагает последова-

тельную нумерацию объектов числами натурального ряда. Этот порядок может быть случайным или определяться после предвари-тельного упорядочения объектов, например по алфавиту. Метод применяется в том случае, когда количество объектов невелико (например, кодирование названий факультетов университета, ко-дирование студентов в учебной группе).

Серийно-порядковая система кодирования предусматривает предварительное выделение групп объектов, которые составляют серию, а затем в каждой серии производится порядковая нумерация объектов. Каждая серия также будет иметь порядковую нумера-цию. По своей сути серийно-порядковая система является смешан-ной: классифицирующей и идентифициру

, когда количество групп невелико.

§ 6. ëÜÄíàÖ àçîéêåÄñàà

Цель сжатия — уменьшение количества бит, необходимых для хранения или передачи заданной информации, что дает возмож-ность передавать сообщения более быстро и хранить более эко-номно и оперативно (последнее означает, что операция извлечения

– 45 –

Page 46: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

данх выше

ско

боту с модемом и т. д. Приархиваторыинформации математирая долгое время вины 1980-х г.) мало использо-вал мпьютерах на практике.

данных не мож ть большим нек теореия

тных иск СВ X.

Доказано, что среднеекодируемое значение дискретной СВ, не может быть ьэнтропия этой дискретной СВ для любой дис-кре

ной информации с устройства ее хранения будет проходить быстрее, что возможно, если скорость распаковки данны

рости считывания данных с носителя информации). Сжатие по-зволяет, например, записать больше информации на дискету, «уве-личить» размер жесткого диска, ускорить ра

работе с компьютерами широко используются программы- данных формата ZIP, GZ, ARJ и др. Методы сжатия были разработаны как ческая теория, кото-

(до первой поло гась в коСжатие ет бы оторого тиче-

ского предела. Для формального определен этого предела рас-сматриваем любое информационное сообщение длины n как после-довательность независимых, одинаково распределенных дискре СВ Xi или как выборки длины значений одной д ретной

количество бит, приходящихся на одно мен шим, чем

, т. е. ML(X) > HX тной СВ X и любого ее кода. Кроме того, доказано утверждение о том, что существует такое

кодирование (Шеннона–Фэно, Fano), что HX ≥ ML(X) – 1. Рассмотрим дискретные СВ X1 и X2, независимые и одинаково

распределенные, HX1 = HX2 и I(X1, X2) = 0, следовательно, H(X1, X2) = HX1 + HX2 – I(X1, X2) = 2HX1.

Вместо X1 и X2 можно говорить о двумерной дискретной СВ ( )1 2,X X X . Аналогичным образом для n-мерной дискретной СВ

( )1 2, ,..., nX X X X можно получить 1H X nHX= .

Пусть ( ) ( )1L X L X n= , где ( )1 2, ,..., nX X X X , т. е. ( )1L X — это

количество бит кода на единицу сообщения X . Тогда ( )1M L X — это среднее количество бит кода на единицу сообщения при пере-даче бесконечного множества сообщений X . Из ( )M L X −

– 46 –

Page 47: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

( )1 HX M L X− ≤ ≤ для кода Шеннона–Фэно для X cледует

( ) ( )M 1 1 11L X n HX M L X для этого же кода. азана основная теорема о вании

при отсутствии пом то, что с ростом длины n сооб-щения, при кодирова Шеннона–Фэно всего сообщения цел еднее колич во бит на единицу сообщения будесколь дно мало отличаться от энтропии единицы сообщения

ование практически ста-

ем Шеннона таких блоков, рассматри-ваемых как единицы сообщения, можно сделать среднее количество бит на е сообщения больш энтропии нее, чем на ε. ействит , сть

− ≤ ≤

Таким образом, док ех, а именнонии методом

кодиро

иком ср ест т уго .

Подобное кодир не реализуемо из-за того, что с ростом длины сообщения трудоемкость построения этого кодановится недопустимо большой. Кроме того, такое кодирование де-лает невозможным отправку сообщения по частям, что необходимо для непрерывных процессов передачи данных. Дополнительным недостатком этого способа кодирования является необходимость отправки или хранения собственно полученного кода вместе с его исходной длиной, что снижает эффект от сжатия. На практике для повышения степени сжатия используют метод блокирования.

По выбранному значению ε > 0 можно выбрать такое s, что ес-ли разбить все сообщение на блоки длиной s (всего будет n/s бло-ков), то кодировани –Фэно

диницу им меД ельно пу

(X ),1 2 1 1 2 2, ,... , , ,...,n ss

Y Y Y Y X X Y⎛ ⎞= =⎜ ⎟⎝ ⎠

( )2, ,...,,Y = 1 2s s sX += и

т. д., т. е ),..., is i s iY X − + − + .

X + X

. ( ) ( )( 1 1 1 2, Xi= sX

Тогда 1 1H Y sHX= и ( ) ( )1 1 1 1 11 1sML Y ML Y HY sHX= ≤ + = + ,

следовательн ( )1 1 11M L Y H X s≤ + , т. е. о, достаточно брать s = 1/ε.

Минимум s по заданному ε может быть гораздо меньшим 1/ε. Пример. Пусть дискретные СВ X1, X2,…, Xn независимы, одина-

ково распределены и могут принимать только два значения

– 47 –

Page 48: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

P(X

и таком а на единицу сообщени авно 1. Разобьем сообной 2. Закон распределения вероятностей и кодирование для 2-мер

i = 0) = p = 3/4 и P(Xi = 1) = q = 1/4 при i от 1 до n. Тогда HXi = 3/4 ⋅ log24/3 + 1/4 ⋅ l og24 = 2-3/4⋅ l og23 ≈ 0,811 бит/сим.

Минимальное кодирование здесь — это коды 0 и 1 с длиной 1 бит каждый. Пр кодиров нии количество бит в среднем

я р щение на блоки дли--

ной дискретной СВ ( )1 2,X X X=

X 00 01 10 11

p 9/16 3/16 3/16 1/16

( )code X 0 10 110 111

( )L X 1 2 3 3

Тогда во бит в среднем н

при таком минимальном кодировании количеста единицу сообщения будет уже

( )1279 3 3 1

1 2 3 3 2 0,8437516 16 16 16 32

M L X⎛ ⎞≤ + + + = =⎜ ⎟⎝ ⎠

,

т. е. меньше, чем для неблочного кодирования. Для блоков длины 3 количество бит в среднем на единицу сообщения можно сделать ≈ 0,823, для блоков длины 4 — ≈ 0,818 и т. д.

се изложенное ранее подразумевало, что рассматриваемые

дис-кретные СВ кодируются только двумя значениями (обычно 0 и 1). Пусть дискретная СВ кодируются m значениями. для дискретной С

В

ТогдаВ X и люб ее кодирования верно, что ого

( ) 2logML X H X m≥ и ( )1 1 log2ML X HX m≥

такое, что ( ). Кроме того, суще-

ствует кодирование 21 logML X H X m− ≤ и

( )1 1 21 logML X X mn− ≤ , где ( )dim .

ормулы теоретических пределов уровня сжатия, рассмотрен-ные ранее, задают предел для средней длины кода на единицу со-общений, передаваемых много раз, т . они ничего не говорят о

H n X=

Ф

. е

– 48 –

Page 49: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

нижьшей энтропии дискретной СВ,

реализующей сообщение.

Прос алгоритм сжатия инф и

Метод Шеннона–Фэно сост в следующем значения дис-кретной СВ располагают в порядке убывания их роятностей, а затем последовательно делят н е части с приблизительно рав-ными вероятностями, к коду первой части добавляют 0, а к коду второй — 1.

ля предшествующего примера получим:

ней границе уровня сжатия, которая может достигаться на не-которых сообщениях и быть мен

тейшие ы ормаци

оит , ве

а дв

Д

p ( )code X X

00 9/16 0

01 3/16 10

10 3/16 110

11 1/16 111

( )1

27 бит0,8437532 сим.ML X = =

Еще один пример. Код составляется после сортировки, т. е. по-сле перестановки значений B и C.

X p code(X)

A 0,4 0

B 0,2 11

C 0,4 10

– 49 –

Page 50: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

) ( )1

2

1,6 би( т/сиlog 0, 23 бит/с

ML X M XH

= =

=

Метод Хаф мен an) зрабо ан в 1952 г Он более практичен и по степени сжатия уступает етод енно а–Фэно, того, он сжимает ма имально пло . Код стро при помощи двоичного (би арног ) дер Вер тност значений дискретной СВ прип е лист м; вс дерев строится, опираясь на листья. чина, приписанная к уз у дерева, называ-ется весом узла. Два ста наименьшими ве создают -тельский узел с весом, равным сумме их весов; в дальнейшем этот узел учитывается наравне с оставшимися листьями, а образовавшие его узлы от такого рассмотрения устраняются. После остройки корня нужно приписать каждой из ветвей, исходящих из родитель-ских лов, значения 0 и 1. Код каждо значения дискр ой СВ — числ , полу при обходе вей от орня к у, соответствующему данному значению.

Для методо Хаффмена и Шеннона–Фэно кажд вме те с собственно соо щением жно передават и таблицу кодов На-пример, для сл ая из п 2 жно сообщить, что коду 10 со-от т символ C, к у 0 — A т. д.

Построим коды Хаффмена для значений дискретной СВ из двух предыдущих примеров.

м. 5− 8»1,5 им.

L

Xф а (Huffm ра т .

не м у Ш нболее кс тно ится

н о ева. оя и исываются го ья е о

Вели л ли с сами роди

п

уз ил го етн это о чаемое вет к лист

в ый раз сб ну ь . уч римера ну

ветствуе од и

X 00 01 10 11 p 9/16 3/16 3/16 1/16 0 1 4/16 0 1 7/16 0 1 1

( )code X 0 10 110 111

– 50 –

Page 51: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

( ) ( )1

27 бит0,843752 32ML X

ML X = = = сим.

X A B C p 0,4 0,2 0,4 0 1 0,6 0 1 1

code(X) 0 10 11

( ) )1 1,6 бит/симML X ML X= = .

Арифметическое кодирование

Алгоритм кодирования Хаффмена, в лучшем случае, не может передавать на каждый символ сообщения менее одного бита ин-формации. Предположим, что в сообщении, состоящем из нулей и единиц, единицы встречаются в 10 раз чаще нулей. При кодирова-нии методом Хаффмена и на 0 и на 1 придется тратить не менее одного бита. Но энтропия дискретной СВ, генерирующей такие сообщения ≈ 0.469 бит/сим. Неблочный метод Хаффмена дает для минимального среднего количества бит на один символ сообщения значение 1 бит. Хотелось бы иметь такую схему кодирования, ко-торая позволяла бы кодировать некоторые символы менее чем од-ним

(

битом. Одной из лучших среди таких схем является арифмети-ческое кодирование, разработанное в 70-х гг. XX в.

По исходному распределению вероятностей для выбранной для кодирования дискретной СВ строится таблица, состоящая из пере-секающихся только в граничных точках отрезков для каждого из значений этой дискретной СВ; объединение этих отрезков должно образовывать отрезок [0,1], а их длины должны быть пропорцио-нальны вероятностям соответствующих значений дискретной СВ. Алгоритм кодирования заключается в построении отрезка, одно-значно определяющего данную последовательность значений дис-кретной СВ. Затем для построенного отрезка находится число, при-

– 51 –

Page 52: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

над

сла строго бол

отрезок для сообщения длины сообщения длины n, разбиваем

его на столько же частей, сколько значений имеет рассматриваемая дискретная СВ. Это енно так же, как и самое первое (с сохранением порядка). Затем выбирается из -ченных отр соответств последовательности длины n.

Принципиальное отличие этого кодирован рассмотренных ранее методов в его непрерывности, т. е. в ненужности блокирова-ния. Код здесь строится не для отдельных значений дискретной СВ или их групп фиксированного размера, а для о предш ю-щего сообщения в целом. Эффективность арифметического коди-рования растет с ростом длины сжимаемого сообщения (дл ди-рования Хаффмена или Шеннона–Фэно этого оисходи отя арифметическое кодирование дает обычно лучшее сжатие, чем ко-дирование Хаффмена, оно пока используется рактике ни-тельно редко, т. к. оно появилось гораздо позже и требует больших вычислительных ресу сов.

При сжатии зада ых данных (например файла) -смотренные методы требуют двух проходов. Первый для сбора частот символов, используемых как приближ значен ро-ятностей символов, и второй — для собственно сжатия.

Пример арифметического кодирования. Пу скретная X может принимать только два значения 0 и 1 с ятностям 3 и 1/3 соответственно. Сопоставим значению 0 отрезок [0, 2/3], а 1 — [2/3, 1]. Тогда для дискретной СВ

лежащее его внутренней части и равное целому числу, делен-ному на минимально возможную положительную целую степень двойки. Это число и будет кодом для рассматриваемой последова-тельности. Все возможные конкретные коды — это чи

ьшие нуля и строго меньшие одного, поэтому можно отбрасы-вать лидирующий ноль и десятичную точку, но нужен еще один специальный код-маркер, сигнализирующий о конце сообщения. Отрезки строятся так. Если имеется n–1, то для построения отрезка для

разбиение делается соверш полу

конкретнойезков тот, который ует заданной

ия от

всег еству

я кот). Хне пр

на п срав

рнн , из все рас

енные ия ве

сть ди веро

СВи 2/

X , ( ) 3,=dim X 3H X HX= =

2log 3 2 3 0,9183бит сим.= − ≈

– 52 –

Page 53: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

Таблица построения кодов

Интервалы и коды Вероятность Код Хаффмена

26 31111 , 1 0,11111

27 32⎣ ⎦⎡ ⎤

∋ =⎢ ⎥ 1/27 0000

8 8 26 1511 , 1 110 , 0,1111

9 9 27 16⎡ ⎤ ⎡ ⎤

∋ =⎢ ⎥ ⎢ ⎥⎣ ⎦ ⎣ ⎦ 2/27 0001

22 8 7101 , 0,111⎡ ⎤

∋ =⎢ ⎥ 2/27 010 27 9 8⎣ ⎦

2 2 8 2 22 31⎡ ⎤ ⎡ ⎤ ⎡ ⎤⎢ , 1 10 , 100 , 0,1111

3 3 9 3 27 4∋ =⎥ ⎢ ⎥ ⎢ ⎥⎦ ⎣ ⎦ ⎣ ⎦

4/27 001 ⎣

16 2 5011 , 0,101

27 3 8⎡ ⎤

∋ =⎢ ⎥⎣ ⎦ 2/27 011

4 2 4 16 101 , 010 , 0,1

9 3 9 27 2⎤ ⎡ ⎤

∋ =⎢ ⎥ ⎢ ⎥⎣ ⎦ ⎣ ⎦ 4/27 100

8 4 3001 , 0,011⎡ ⎤

∋ = 4/27 101 27 9 8⎢ ⎥⎣ ⎦

2 4 8 10 0, 00 0, 000 0, 0,01

3 9 27 4⎡ ⎤ ⎡ ⎤ ⎡ ⎤

∋ =⎢ ⎥ ⎢ ⎥ ⎢ ⎥⎣ ⎦ ⎣ ⎦ ⎣ ⎦ 8/27 11

( ) ( )

( ) ( )

( ) ( ) ( )

1

1

1

65 81 0,8025 бит сим. ,

76 81 0,9383 бит сим. ,

1 бит сим. .

M L X арифметическое

M L X блочный Хаффмена

M L X M L X Хаффмена

= ≈

= ≈

= =

Среднее количество бит на единицу сообщения для арифмети-ческого кодирования получилось меньше, чем энтропия. Это свя-зано с тем, что в кодирования не описан код-маркер конца сообщения, введение которого неминуе-мо

рассмотренной простейшей схеме

сделает это среднее количество бит большим энтропии. Получение исходного сообщения из его арифметического кода

происходит по следующему алгоритму.

– 53 –

Page 54: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

Шаг 1. В таблице для кодирования значений дискретной СВ определяется интервал, содержащий текущий код, — по этому ин-тер

граница содер-

ченное число считается новым текущим значе-

ер, распаковку сообщения 111. Этому соо

ения — это 1. Далее от 7/8 вы-чит

ий знак — 1, т. е.

исх

валу однозначно определяется один символ исходного сообще-ния. Если этот символ — маркер конца сообщения, то конец.

Шаг 2. Из текущего кода вычитается нижняяжащего его интервала, полученная разность делится на длину этого же интервала. Полунием кода. Переход к шагу 1.

Рассмотрим, напримбщению соответствует число 7/8 ∈ [2/3, 1], что означает, что

первый знак декодируемого сообщается 2/3 и результат делится на 1/3, что дает 5/8 ∈ [0, 2/3],

что означает, что следующий знак — 0. Теперь, вычислив (5/8 – 0)⋅3/2 = 15/16 ∈ [2/3, 1], получим следующвсе исходное сообщение 101 декодировано. Однако из-за того, что условие остановки не определенно, алгоритм декодирования здесь не остановится и получит «следующий символ» 1 и т. д.

§ 7. äÄóÖëíÇé àçîéêåÄñàà

Возможность и эффективность использования информацииобусловливаются такими основными ее потребительскими показа-телями качества, как репрезентативность, содержательность, дос-таточность, доступность, актуальность, своевременность, точность, достоверность, устойчивость.

Репрезентативность информации связана с правильностью ее отбора и формирования в целях адекватного отражения свойств объекта. Важнейшее значение здесь имеют:

• правильность концепции, на базе которой сформулированоодное понятие; • обоснованность отбора существенных признаков и связей

отображаемого явления. Нарушение репрезентативности информации приводит нередко

к существенным ее погрешностям.

– 54 –

Page 55: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

Содержательность информации отражает семантическую ем-кость, равную отношению количества семантической информации в сообщении к объему обрабатываемых данных.

С увеличением содержательности информации растет семанти-ческая пропускная способность информационной системы, т. к. для пол

ьности, отражающим се-ман

о она со-

ор показателей). Понятие полноты информа-

нения цен

учения одних и тех же сведений требуется преобразовать мень-ший объем данных.

Наряду с коэффициентом содержателтический аспект, можно использовать и коэффициент информа-

тивности, характеризующийся отношением количества синтакси-ческой информации к объему данных.

Достаточность (полнота) информации означает, чтдержит минимальный, но достаточный для принятия правильного решения состав (набции связано с ее смысловым содержанием (семантикой) и прагма-тикой. Как неполная, т. е. недостаточная для принятия правильногорешения, так и избыточная информация снижает эффективность принимаемых пользователем решений.

Доступность информации восприятию пользователя обеспечи-вается выполнением соответствующих процедур ее получения и преобразования. Например, в информационной системе информа-ция преобразовывается к доступной и удобной для восприятия пользователя форме. Это достигается, в частности, и путем согла-сования ее семантической формы с тезаурусом пользователя.

Актуальность информации определяется степенью сохраности информации для управления в момент ее использования

и зависит от динамики изменения ее характеристик и от интервала времени, прошедшего с момента возникновения данной информа-ции.

Своевременность информации означает ее поступление не позже заранее назначенного момента времени, согласованного с временем решения поставленной задачи.

Точность информации определяется степенью близости полу-чаемой информации к реальному состоянию объекта, процесса, яв-

– 55 –

Page 56: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

ления и т. п. Для информации, отображаемой цифровым кодом, известны четыре классификационных понятия точности:

• формальная точность, измеряемая значением единицы млад-шего разряда числа;

• реальная точность, определяемая значением единицы по-следнего разряда числа, которого гарантируется;

• максимальная т чить в конкрет-ных условиях ф

• необходимая точность, определяемая функциональным на-зна

способность реагиро-ват

й ее отбора и формирования.

-нос

ки информационных систем. Параметры акт

верностьочность, которую можно полу

ункционирования системы;

чением показателя. Достоверность информации определяется ее свойством отра-

жать реально существующие объекты с необходимой точностью. Измеряется достоверность информации доверительной вероятно-стью необходимой точности, т. е. вероятностью того, что отобра-жаемое информацией значение параметра отличается от истинного значения этого параметра в пределах необходимой точности.

Устойчивость информации отражает ееь на изменения исходных данных без нарушения необходимой

точности. Устойчивость информации, как и репрезентативность, обусловлена выбранной методико

Необходимо также отметить, что такие параметры качества ин-формации, как репрезентативность, содержательность, достаточ

ть, доступность, устойчивость, целиком определяются на мето-дическом уровне разработ

уальности, своевременности, точности и достоверности об-условливаются в большей степени также на методическом уровне, однако на их величину существенно влияет и характер функциони-рования системы, в первую очередь, ее надежность. При этом па-раметры актуальности и точности жестко связаны соответственно с параметрами своевременности и достоверности.

– 56 –

Page 57: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

§ 8. äãÄëëàîàäÄñàü ùäéçéåà óÖëäéâ àçîéêåÄñàà

ен к разным классифика-цио

спользована в разных условиях, раз

кулирующей в орга-низ

а

Любая классификация всегда относительна. Один и тот же объ-ект может быть классифицирован по разным признакам или крите-риям. Часто встречаются ситуации, когда в зависимости от условий внешней среды объект может быть отнес

нным группировкам. Эти рассуждения особенно актуальны при классификации видов информации без учета ее предметной ориен-тации, т. к. она часто может быть и

ными потребителями, для разных целей. Приведем одну из схем классификации цирации (фирме) информации. В основу классификации положено

пять наиболее общих признаков: 1. Место возникновения. По этому признаку информацию

можно разделить на входную выходную, внутреннюю, внешнюю. Входная информация — это информация, поступающая в фир-

му или ее подразделения. Выходная информация — это информация, поступающ я из

фирмы в другую фирму, организацию (подразделение). Одна и та же информация может являться входной для одной

фирмы, а для другой, ее вырабатывающей, выходной. По отноше-нию к объекту управления (фирма или ее подразделение: цех, от-дел, лаборатория) информация может быть определена как внут-ренняя, так и внешняя.

Внутренняя информация возникает внутри объекта, внеш-няя — за пределами объекта.

2. Стадия обработки. По стадии обработки информация может быть первичной, вторичной, промежуточной, результатной.

Первичная информация — это информация, которая возника-ет непосредственно в процессе деятельности объекта и регистриру-ется на начальной стадии.

– 57 –

Page 58: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

Вторичная информация — это информация, которая получа-ется в результате обработки первичной информации и может быть промежуточной и результатной.

промежуточной информации и используется для вы-раб

ком носителе (бумага, изображение на

рисунки и т. д.

рофессия ра-ботника, номер цеха и т. п.;

• постоянная нормативн ция содержит местные, от-рас

Промежуточная информация используется в качестве исход-ных данных для последующих расчетов.

Результатная информация получается в процессе обработки первичной и

отки управленческих решений. 3. Способ отображения. По способу отображения информация

подразделяется на текстовую и графическую. Текстовая информация — это совокупность алфавитных,

цифровых и специальных символов, с помощью которых представ-ляется информация на физичес

экране дисплея). Графическая информация — это различного рода графики,

диаграммы, схемы, 4. Стабильность. По стабильности информация может быть

переменной (текущей) и постоянной (условно-постоянной). Переменная информация отражает фактические количествен-

ные и качественные характеристики производственно-хозяйствен-ной деятельности фирмы. Она может меняться для каждого случая как по назначению, так и по количеству. Например, количество произведенной продукции за смену, еженедельные затраты на дос-тавку сырья, количество исправных станков и т. п.

Постоянная (условно-постоянная) информация — это неиз-менная и многократно используемая в течение длительного перио-да времени информация. Постоянная информация может быть справочной, нормативной, плановой:

• постоянная справочная информация включает описание по-стоянных свойств объекта в виде устойчивых длительное время признаков. Например, табельный номер служащего, п

ая информалевые и общегосударственные нормативы. Например, размер

налога на прибыль, стандарт на качество продуктов определенного вида, размер минимальной оплаты труда, тарифная сетка оплаты государственным служащим;

– 58 –

Page 59: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

• постоянная плановая информация содержит многократно ис-пользуемые в фирме плановые показатели. Например, план выпус-ка

бъекта упр

ис-пользуемая в оперативном управлении и характеризующая произ-водственные процессы времени. К опе-ративной инфор требования по

также по степени ее досто-ественно проводится ее на рынке.

лученных ние в форму, обеспе-овека. Так, рентге-

фотографию с использо-

автомобилей, план подготовки специалистов определенной ква-лификации.

5. Функция управления. При классификации по функциям управления обычно выделяют следующие группы: плановую, нор-мативно-справочную, учетную и оперативную (текущую).

Плановая информация — информация о параметрах оавления на будущий период. На эту информацию идет ориента-

ция всей деятельности фирмы. Нормативно-справочная информация содержит различные

нормативные и справочные данные. Ее обновление происходитдостаточно редко.

Учетная информация — информация, которая характеризует деятельность фирмы за определенный прошлый период времени. На основании этой информации могут быть проведены следующие дей-ствия: скорректирована плановая информация, сделан анализ хозяй-ственной деятельности фирмы, приняты решения по более эффек-тивному управлению работами и пр. На практике в качестве учетной информации может выступать информация бухгалтерского учета, статистическая информация и информация оперативного учета.

Оперативная (текущая) информация — это информация,

в текущий (данный) период мации предъявляются серьезные

скорости поступления и обработки, а верности. От того, насколько быстро и кач

ит успех фирмыобработка, во многом завис

êÖáûåÖ

Основным видом обработки первичных сигналов, поразличными приборами, является преобразовачивающую ее восприятие органами чувств челновский снимок преобразуют в обычную ванием специальных фотоматериалов.

– 59 –

Page 60: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

Обработка и некоторой це-лью. Для ее достижения действий над информа кой порядок действий называется алгоритмом. Кроме самого алгоритма необхо-дим

я должна оцениваться не стати-сти

5. Что такое энтропия?

нформации всегда производится с должен быть известен порядок

цией, приводящий к заданной цели. Та

о также некоторое устройство, реализующее этот алгоритм. В научных теориях такое устройство называется автоматом.

При обработке данных и (или) информации может возникать новая информация без изменения старой. Следовательно, в инфор-мационном взаимодействии не могут действовать законы, подоб-ные закону сохранения энергии в материальном мире.

Определение смысла (содержания) является основной задачей семантической обработки информации, применяемый в информа-ционно-поисковых системах и системах машинного перевода. В отличие от данных информаци

ческии характеристиками, а смысловым содержанием, которое описывается с помощью искусственных языков, отражающих смы-словые связи между словами исходного текста. Словарь такого языка, называется тезаурусом. Смысл сообщения определяется пу-тем соотнесения слов или словосочетаний в нем с тезаурусом.

Çéèêéëõ Ñãü ëÄåéèêéÇÖêäà

1. Вид адекватности информации. 2. Что такое система классификации? 3. Формула Шеннона. 4. Понятие экономической информации.

6. Какие вы знаете алгоритмы сжатия информации? 7. Какие существуют меры информации? 8. Виды систем кодирования информации. 9. Виды связи между дескрипторами. 10. Показатели качества информации. 11. Классификация информации по функциям управления.

– 60 –

Page 61: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

É·‚‡ 3. äãÄëëàîàäÄñàü

àçîéêåÄñàéççõï ëàëíÖå

Из первой главы видно, что не существует единого подхода в понимании информационной системы. В силу этого классификация

на основе выяв-

организации. Люди участвуют в бизнес-процессе6 с

участвует информационная система. Процесс является сос

ичных стандартах. Есл

(постановка на производство, единич-ное

информационных систем затруднена. Информационная система состоит из ряда подсистем, в то же время ее элементы входят в со-став других систем. Построим классификацию ИСления общих элементов взаимодействия ее с другими системами.

Сама информационная система — система людей, хранимых данных и процессов обработки данных и информации в контексте конкретнойпомощью программных средств.

Следовательно, можно выделить систему — процесс. В данном процессе

тавляющей в жизненном цикле продукции7, поэтому можно рассматривать в качестве системы жизненный цикл продукции. Жизненный цикл продукции определен в разл

и использовать термины «система разработки» и «постановка продукции на производство (СРПП)», то можно выделить следую-щие взаимосвязанные группы работ: исследования (аванпроект); опытно-конструкторские работы (ОКР), опытно-технологические работы (ОТР); производство

повторяющееся, серийное, массовое производство); поставка (обращение); эксплуатация (применение, хранение); ремонт; обес-

6 Процесс — совокупность взаимосвязанных или взаимодействующих

видов деятельности, преобразующих входы в выходы. Выходом процесса является продукция. Имеются четыре общие категории продукции: услуги (например, перевозки); программные средства (например, компьютерная программа, словарь); технические средства (например, узел двигателя); перерабатываемые материалы (например, смазка) [41].

7 Совокупность взаимосвязанных процессов последовательного изме-нения состояния продукции от формирования исходных требований к ней до окончания ее эксплуатации или применения [44].

– 61 –

Page 62: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

печение эксплуатации и ремонта предприятиями промышленности; снятие с производства [55].

В дальнейшем, чаще всего, будут рассматриваться бизнес-про-цессы. Бизнес-процесс — последовательность взаимосвязанных задач, решающих специфическую проблему. Есть три типа бизнес-процесса.

• Процессы управления — процессы, которые управляют дей-ствием системы. Типичные процессы управления включают «об-щее управление» и «стратегическое управление».

• Операционные процессы — в этих процессах создаются пер-вичные потоки данных, они — часть основного бизнеса. Типичные операционные процессы — покупка, производство, маркетинг и продажа.

• Вспомогательные процессы — поддерживают основные про-цессы. Например, бухгалтерский учет, наем работников, ИТ-под-держка.

Люди, кроме того, работают в соответствующих подразделени-ях предприятия, поэтому еще одна система, с которой соприкасает-ся информационная система, это организация8.

В информационной системе можно выделить компьютерную подсистему (computer — based information system), которая состоит из программно-технического обеспечения (это hard и soft) инфор-мационной системы (именно эту подсистему часто называют ин-формационной системой).

Компьютерные подсистемы на предприятии образуют компью-терную систему. Отношение организации, компьютерной системы и биз

И ией технических средств, компьютеров средств, мате-риа

нес-процессов показано на рис. 3.1. нформационная система является конкретной комбинац

, программныхлов, персонала и возможностей. Программные средства служат

для обеспечения выполнения некоторых функций данных процес-сов с помощью компьютеров. Программные средства могут быть постоянно (резидентно) размещены в компьютерах, встроены как

8 Организация — группа работников и необходимых средств с рас-

пределением ответственности, полномочий и взаимоотношений [41].

– 62 –

Page 63: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

про

средства могут представлять сложно-организованную систему пер-сональных компьютеров, рабочих станций, майн-фреймов, сервера, сетевых коммуникаций и телекоммуникационного оборудования.

граммы, реализованные техническими средствами, или интег-рированы в объект технических средств (рис. 3.2). Технические

Рис. 3.1. Отношение компьютерной системы, бизнес-процессов

и организации [42]

Автоматизация бизнес-процессов, как цель использования ин-формационной системы, хорошо прослеживается на рис. 3.2. Авто-матизация не единственная цель, которую можно преследовать при внедрении информационной системы. Многие бизнес-процессы не могут быть реализованы без использования информационных тех-нологий, как, например, системы e-learning, системы электронной коммерции и т. д.

– 63 –

Page 64: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

Применение информационных систем может привести к полно-му изменению бизнес-процессов (реинжиниринг бизнес-процессов).

Средства

Ручные операции

Технические средства

Прог

Реальные процессыв системе

Автоматизированные процессы

раммные средства

Информационная система

Компьютерная система

Рис. 3.2. Соотношение между информационной системой, программными средствами и компьютерной системой

Современное предприятие настолько глубоко пронизано ин-формационными технологиями9, что организацию предприятия следует рассматривать в контексте организации информационных

9 Технология (от греч. téchne — искусство, мастерство, умение и

...логия), совокупность приемов и способов получения, обработки или переработки сырья, материалов, полуфабрикатов или изделий, осуществ-ляемых в различных отраслях промышленности, в строительстве и т. д.; научная дисциплина, разрабатывающая и совершенствующая такие прие-мы и способы [1].

Информационная технология, как определено ИТ Ассоциацией СШ (Information Techno ), является «изуче-нием, проектирован жкой или управ-лением компьютерных информационных систем (computer-based informa-tion

Аlogy Association of America — ITAAием, развитием, разработкой, поддер

systems), в особенности применениям программного обеспечения и компьютерного оборудования» [15].

– 64 –

Page 65: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

сис

ктуры. ИТ-инфраструктура пре

тем. В этом случае рекомендуется описывать архитектуру10 предприятия с точки зрения использования ИТ-средств (рис. 3.3). Такой подход, при рассмотрении организации, дает нам возмож-ность обобщить задачи ИТ-инфрастру

дприятия образует систему, которая должна рассматриваться вместе с информационными системами. В данную систему входит организация ИТ-департамента предприятия.

Перечислим еще раз все системы, которые мы выделили: • информационная система; • система жизненного цикла продукции; • процессы, как системы; • система организации предприятия; • ИТ-инфраструктура предприятия, как подсистема предпри-

ятия; • компьютерная система (computer-based information system); • техническая система (система технических средств); • программное обеспечение.

Рис. 3.3. Архитектура предприятия

10 Понятие «архитектура» будет рассмотрено ниже. Пока будем считать

архитектурой системы некоторое обобщенное описание этой системы.

– 65 –

Page 66: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

Компьютерной системой иногда называют программно-техни-ческий комплекс информационной системы11 (ПТК ИС). Только компьютерная система и программное обеспечение являются под-

ционным системам. Функциональные возможности АС ни-

ы присутствовать функции сбора, хранения и обработки

современном мире компьютерных технологий проблемы

либо по мере появления , либо по мере развития

ы-

укту-ры информационных систем дает возможность выявить общие тен-денции их развития.

Исходя из вышеприведенного перечня систем, можно выделить сле

системами информационной системы. В первой главе информационные системы сравнивались с авто-

матизированными системами (АС). Было определено, что инфор-мационные системы являются подмножеством автоматизирован-ных систем. Так, например, промышленные роботы обычно относятся к автоматизированным системам, но не относятся к ин-формачем не ограничиваются, в то время как в информационных систе-мах должнинформации.

В классификации информационных систем нет. Каждый вид инфор-мационных систем исторически возникалновых технологий обработки информациибизнес-процессов, с которыми интегрировалась ИС. В соответствии с этим появлялись новые информационные системы с немыслимми аббревиатурами (например, АДФИПС СНМОУ).

Задача систематизации информационных систем возникает, обычно, в учебных целях. С другой стороны, определение стр

дующие признаки классификации: • место, занимаемое информационной системой в жизненном

цикле продукции (ИС поддержки жизненного цикла продукции (CALS), ИС управления релизами и т. д.);

11 ПТК ИС: Продукция, представляющая собой совокупность средств

выч

аточных для выполнения одной или более задач.

ислительной техники, программного обеспечения и средств создания и заполнения машинной информационной базы при вводе системы в дей-ствие дост

– 66 –

Page 67: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

• процес мационная система (процесс пки, процесс уп ления, процесс продажи, процесс произво

900

ия информационных систем на бизнес-про-цес

с, в котором используется данная инфор заку равдства);

• уровень организационных структур предприятия, исполь-зующих ИС (классификация в современных условиях не прием-лема, т. к. противоречит процессному подходу стандарта ISO

0, в то же время сохранилось понятие «корпоративная инфор-мационная система»12 (КИС), используемое, чтобы подчеркнуть, что данная ИС охватывает процессы всей компании или корпора-ции);

• уровень управления государственных структур, использую-щих ИС;

• степень влиянс; • доля ручного труда при выполнении процесса (чаще исполь-

зуют понятие «степень автоматизации»); • форма представления информации; • ИТ технологии, используемые при построении ИС (данный

классификационный признак трудно отделить от предыдущего); • методология или стандарт, реализуемые в процессе. Выбор классификационных признаков можно продолжить

(отрасль производства, вид деятельности человека и т. д.).

12 Корпорация — в правовой терминологии США и ряда других стран

понятие, обычно означающее юридическое лицо, организацию. Термином «корпорация» пользуются всякий раз, когда хотят подчеркнуть, что орга-низация, называемая этим именем, рассматривается как едино целое и мож

е

Корпоративная информационная система обычно означает информа-цио

ет выступать участником в гражданском обороте. В законодательстве РФ термин «корпорация» употребляется только как составная часть соб-ственного названия государственных коммерческих организаций.

нную систему, интегрированную в различных бизнес-процессах орга-низации.

– 67 –

Page 68: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

§ 1. äãÄëëàîàäÄñàü àë èé îéêåÖ èêÖÑëíÄÇãÖçàü àçîéêåÄñàà

В литературе используются различные способы классификации. Наиболее популярна классификация [46], основанная на различном представлении информационных систем в различных ГОСТах.

Можно выделить три представления информационных систем в отечественных стандартах (примерно, 90-х гг.). Надо оговориться, что стандарты зафиксировали уровень развития информационных систем на момент своего появления. Мы привязываем информаци-онные системы к стандартам только потому, что именно в них за-фиксированы наиболее актуальные направления развития инфор-мационных систем.

Первое направление связано с группой стандартов ГОСТ 24, а затем ГОСТ 34 (ГОСТ 34 заменял стандарты ГОСТ 24). Данная группа стандартов обобщала разнородные нормативные материалы разработки автоматизированных систем, существующих в различ-ных отраслях. Все АС рассмотрены в ГОСТ 34 с единых позиций, унифицированы их структура и процесс разработки.

Второе направление логично вытекало из задач поиска и систе-матизации информации, представленных в виде текстов. Данная задача наиболее актуальна в библиотечной деятельности, поэтому второе направление связано с «Системой стандартов по информа-ции, библиотечному и издательскому делу» (СИБИД), которая объ-единяет в себе общетехнические и организационно-методические стандарты, регламентирующие правила представления данных, описания документов, функционирования библиотечных фондов, оформления печатных и электронных изданий и т. д. В этой группе стандартов определяются информационно-поисковые системы (ИПС) и информационно-поисковые языки (ИПЯ).

Третья группа стандартов связана с гибкими производственны-ми системами13 (ГПС). От внедрения ГПС ожидалось: уменьшение

13 ГПС — управляемая средствами вычислительной техники совокуп-

ность технологического оборудования, состоящего из разных сочетаний

– 68 –

Page 69: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

размеров предприятий, увеличение коэффициента использования оборудования и снижение накладных расходов, значительное уменьшение объема незавершенного производства, сокращение затрат на рабочую силу в результате организации «безлюдного» производства, ускорение сменяемости моделей выпускаемой про-дук

им факта). Данные хранились либо в обыч-ном файлах (с произвольным доступами), либо в файлах б анилось и мета-опи

С, а к документальным — все виды ИПС и И

ис-темы (АДФИПС), которые относились к автоматизированным сис-тем

ции в соответствии с требованиями рынка, сокращение сроков поставок продукции и повышение ее качества. Третья группа явля-лась развитием концепции АС.

АС, по мнению авторов этой классификации, объединяла пред-ставление информации в виде различных данных (в указанном слу-чае — данные — синон

или последовательнымиаз данных (в этом случае хр

сание данных). ИПС работали с текстовой информацией, в ко-торой требовалось реализовать алгоритмы представления тексто-вой информации в структуры данных.

Естественное разделение систем было связано с формой пред-ставления информации, отсюда и деление информационных систем на документальные и фактографические. К фактографическим сис-темам отнесли все виды А

ПЯ (хотя, странно относить языки к информационным систе-мам).

В данной классификации есть некоторые нестыковки. Наиболее серьезная нестыковка — АС могли работать и с текстовой инфор-мацией (правильнее сказать, что ИПС являлось подмножеством АС). Поэтому в дальнейшем были выделены автоматизированные документально-фактографические информационно-поисковые с

ам, использующим алгоритмы и методы поисковых систем при

гибких производственных модулей и (или) гибких производственных яче-ек, автоматизированной системы технологической подготовки производ-ства и системы обеспечения функционирования, обладающая свойством автоматизированной переналадки при изменении программы производст-ва изделий, разновидности которых ограничены технологическими воз-можностями оборудования [47].

– 69 –

Page 70: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

раб

лагается разделить ИС, в зави-

ы

графические системы берут свое начало с так называемых сис

ных методов и средств сбора и обработки вления объектами.

нении ЭВМ и других современных их также называют ав-

том

оте с документами. Современные технологии внесли корректи-вы в такое представление. Появление HTML-, а затем XML-файлов дает возможность разметить текстовый документ, но, самое глав-ное, развитие web-сервисов кардинально поменяло представление о технологии работы с документом.

Исходя из вышесказанного, предсимости от формы представления данных, на документальные (ос-новным носителем информации является текстов й документ), фак ртог афические (информационными объектами являются дан-ные) и XML-документальные (информационными объектами яв-ляются XML14-файлы).

Фактографические системы

Отличительной особенностью этих подсистем является исполь-зование данных, как способа представления фактов, концепций или инструкций. Данные могут быть представлены в виде текста. При этом не ставится задача автоматического структурирования этого текста. Другими словами, если описание факта и имеет структуру, то автоматический поиск этой структуры не является задачей фак-тографической системы.

Фактотем обработки данных. Системы обработки данных (СОД) —

комплекс взаимосвязанданных, необходимых для организации упраСОД основываются на примесредств информационной техники, поэтому

атизированными системами обработки данных (АСОД) [1]. 14 XML (англ. eXtensible Markup Language — расширяемый язык раз-

метки; произносится [экс-эм-э л]) — рекомендованный Консорциумом Всемирной паутины язык разметки, фактически представляющий собой свод общих синтаксических правил. XML предназначен для хранения структурированных данных (взамен существующих файлов баз данных), для обмена информацией между программами, а также для создания на его основе более специализированных языков разметки (например, XHTML), иногда называемых словарями [14].

– 70 –

Page 71: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

СОД — это часть и первая ступень развития автоматизирован-ной системы управления (АСУ). Комплекс стандартов ГОСТ 24, вышедший в 70-е гг., регламентировал требования к данным сис-тем

изированного вы-

ганизация), производство, цех, участок, технологический агр

средств автоматизации его дея

ам. АСУ предназначена для обеспечения эффективного функ-ционирования объекта управления путем автоматполнения функций управления [48].

Основными классификационными признаками, определяющи-ми вид АСУ, являются:

• сфера функционирования объекта управления (промыш-ленность, строительство, транспорт, сельское хозяйство, непро-мышленная сфера и т. д.)

• вид управляемого процесса (технологический, организаци-онный, экономический и т. д.);

• уровень в системе государственного управления, включая управление народным хозяйством в соответствии с действующими схемами управления отраслями (для промышленности: отрасль (министерство), всесоюзное объединение, всесоюзное промышлен-ное объединение, научно-производственное объединение, предпри-ятие (ор

егат). Функции АСУ в общем случае включают в себя следующие

элементы (действия): • планирование и (или) прогнозирование; • учет, контроль, анализ; • координацию и (или) регулирование. ГОСТ 34 отменил положения некоторых стандартов ГОСТ 24 и

ввел концепцию автоматизированных систем (АС). АС — система, состоящая из персонала и комплекса

тельности, реализующая информационную технологию выпол-нения установленных функций. В зависимости от вида деятельно-сти выделяют следующие виды АС: автоматизированные системы управления (АСУ), системы автоматизированного проектирования (САПР), автоматизированные системы научных исследований (АСНИ) и др. [19] АСУ стало подмножеством АС.

– 71 –

Page 72: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

Необходимо отметить, что создатели ГОСТ не устанавливали ограничения на вид используемой информации, поэтому понятие АС покрывало и большинство документальных систем.

Развитие фактографических систем связано с развитием техно-логий хранения и обработки информации.

Из истории развития технологии хранения можно выделить следующие этапы. Первый этап — хранение данных в файлах. В таком случае использовались файлы последовательного доступа и файлы с произвольным доступом. Отличительная особенность этого этапа — работа программиста с низкоуровневыми операция-ми ввода, вывода, поиска и т. д. Второй этап — использование баз данных. Используются также файлы, хранящие кроме данных еще и структуру данных. Развитие баз данных и систем управления ба-зами данных (СУБД) является одним из основных факторов разви-тия современных фактографических систем. Появление OLAP-систем (описание OLAP см. ниже) и хранилищ данных (Data Warehouse — DW) связано с появлением технологий работы с мно-гомерными таблицами данных. Вместе с тем, развиваются не толь-ко технологии программного уровня, но и технологии аппаратного уровня.

Есл лась в основном о

с

сет

и в 70-80-х гг. ХХ в. емкость систем хранения выража в мегабайтах, то в наши дни речь нередко идет уже те-

ра- и петабайтах. Сегодня системы хранения — одна из самых бы-строразвивающихся областей в ИТ. В настоящее время на рынке присутствуют несколько систем хранения. Наиболее известные из них: системы прямого подключения типа DAS (Direct-Attached Storage); устройства хранения данных, подключаемые к сети — NAS (Network Attached Storage), а также сети хранения данных — SAN (Storage Area Network) (рис. 3.4).

В технологии Network Attached Storage (NAS), аналогично то-му, как принт- ервер берет на себя функции печати, NAS-сервер берет на себя хранение общих файлов пользователей локальной сети. Storage Area Network (SAN) — это специальная выделенная

ь, объединяющая устройства хранения данных с серверами при-ложений. В отличие от NAS, SAN не имеет понятия о файлах: фай-

– 72 –

Page 73: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

ловые операции выполняются на подключенных к SAN серверах. SAN оперирует блоками, как некий гигантский жесткий диск. Иде-альный результат работы сетей хранения данных — возможность доступа любого сервера под любой операционной системой к лю-бой части дисковой емкости, находящейся в этой системе. Появле-ние SAN дало возможность передавать хранение данных на аутсор-синг.

Приложение

Файловая система

Дисковое устройство

Клиент КлиентКлиент Клиент

Сервер

LANLAN

Сервер Сервер

Файловое SANхранение

Хранилище данных

Ленточныйнакопитель

DAS NAS SAN Рис. 3.4. Архитектура построения систем хранения данных

Функциональное развитие автоматизированных систем про-должается с появлением новых концепций обработки и представ-ления информации, использованных в фактографических инфор-мац

киx peшeний oтч

ионных системах. С пoявлeниeм кoнцeпций информационно-управляющих систем (management information systems — MIS), былa дoбaвлeнa фyнкция, нaпpaвлeннaя нa oбecпeчeниe мeнeд-жepoв нeoбxoдимыми для пpинятия yпpaвлeнчec

eтaми, cocтaвлeнными нa ocнoвe coбpaнныx o пpoцecce дaнныx (information reporting systems). Очень часто к информационно-управляющим системам относят системы принятия решений (СППР), экспертные системы (ЭС) и управленческие информаци-онные системы.

Концепция систем поддержки принятия решений (СППР, decision support systems — DDS) отражала потребность менеджеров

– 73 –

Page 74: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

в специализированном инструменте, обеспечивающем интepaктив-ную пoддepжку пpoцeccoв принятия yникaльныx рeшeний. Совре-менные системы поддержки принятия решения (СППР), возникшие как естественное развитие и продолжение управленческих инфор-мационных систем и систем управления базами данных, представ-

ьности. Они являются

], состоит из 5 различных частей:

замена, выработки решений менеджерами

СППР специального вида

ержки принятия важных решений. е

жной информацией для

систему как специализацию СППР. В ИСР акцентиру-ской интерпретации данных. Они предла-

ляют собой системы, максимально приспособленные к решению задач повседневной управленческой деятелинструментом, призванным оказать помощь лицам, принимающим решения (ЛПР). Обобщенная архитектура СППР, предложенная Marakas [15

• система управления данными (the data management system — DBMS);

• система управления моделями (the model management sys-tem — MBMS);

• машина знаний (the knowledge engine (KE)); • интерфейс пользователя (the user interface); • пользователь (the user(s)). Система поддержки принятия решений обладает следующими

четырьмя основными характеристиками: • использование и данных, и моделей; • помощь менеджерам в принятии решений для слабострукту-

рированных и неструктурированных задач; • поддержка, а не

(лицо, принимающее решение — ЛПР); • применение с целью улучшения эффективности решений. В 1993 г. Е. Коддом (E. F. Codd) для

был предложен термин OLAP (Online Analytical Processing) — опе-ративный анализ данных, онлайновая аналитическая обработка данных для подд

Одним из направлений развития СППР стали Информационнысистемы руководства (ИСР, executive information systems — EIS). ИСР определили тип информационно-управляющих систем, кото-рые обеспечивают высшее руководство нувыработки стратегических целей организации. Можно рассматри-вать даннуюется внимание на графиче

– 74 –

Page 75: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

гают отчеты, дающие возможность топ-менеджерам проводить анализ деятельности с акцентом на тенденциях изменения пара-метров, по которым они могли бы контролировать выполнение ра-боты и идентифицировать риски и открывающиеся возможности.

руются на стандартных для организации запро-

ийные возможно-

аправления:

ровневых процессов мышления человека, на знаний;

тевое, восходящее) основано низкоуровневых структур мозга

равлений применяются следующие методы. е системы: программы, которые, действуя по оп-

батывают большое количество инфор-мац

Для ИСР характерны следующие основные черты: • отчеты бази

сах, число которых относительно невелико; • отчеты представляются в максимально удобном виде, вклю-

чающем таблицы, деловую графику, мультимедсти и т. п.;

• ориентация на конкретный вертикальный рынок, например, финансы, маркетинг, управление ресурсами.

Крупным дocтижeниeм былo coздaниe и пpимeнeниe cиcтeм и мeтoдoв иcкyccтвeннoгo интeллeктa (artifical intellegence — AI). Искусственный интеллект — раздел информатики, изучающийвозможность обеспечения разумных рассуждений и действий с по-мощью вычислительных систем и иных искусственных устройств. Явно не определено, что именно считать необходимыми и доста-точными условиями достижения интеллектуальности. Обычно к реализации интеллектуальных систем подходят именно с точки зрения моделирования человеческой интеллектуальности. Таким образом, в рамках искусственного интеллекта различают два ос-новных н

• символьное (семиотическое, нисходящее) основано на моде-лировании высокоупредставлении и использовании

• нейрокибернетическое (нейросена моделировании отдельных (нейронов) [8].

В рамках этих нап• Экспертны

ределенным правилам, обраии и выдают заключение на ее основе. • Рассуждение на основе аналогичных случаев (Case-based

reasoning). • Байесовские сети.

– 75 –

Page 76: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

• Поведенческий подход: модульный метод построения систем искусственного интеллекта, при котором система разбивается на автономные программы поведения, которые запускаются в зависи-мос

х промыш-лен

пользователь;

ти от изменений внешней среды. • Нейронные сети: системы с отличными способностями к

распознаванию. • Нечеткие системы: методики для рассуждений в условиях

неопределенности (широко используются в современныных и потребительских системах контроля). • Эволюционные вычисления: здесь применяются понятия,

традиционно относящиеся к биологии, такие как популяция, мута-ция и естественный отбор для создания лучших решений задачи. Эти методы делятся на эволюционные алгоритмы (например, гене-тические алгоритмы) и методы роевого интеллекта (например, му-равьиный алгоритм).

Все перечисленные методы используются в настоящее время в СППР подсистемах анализа данных, как, например, Business Intelligenc.

Обратите внимание, что экспертная система (ЭС, expert system) — это компьютерная программа, а не информационная система. Ее цель — заменить специалиста-эксперта в решении проблемной си-туации.

Можно определить следующую структуру экспертной системы: • база знаний; • интерфейс пользователя; • решатель или система вывода; • подсистема объяснений; • интеллектуальный редактор базы знаний; • • эксперт; инженер по знаниям. •

База знаний состоит из правил анализа информации от пользо-вателя по конкретной проблеме. Задача инженера по знаниям — отобразить знания экспертов в предметной области в формальную структуру базы знаний.

– 76 –

Page 77: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

Экспертная система может использоваться как самостоятельная программа или встраиваться в бизнес-процесс принятия решения. В последнем случае она преобразуется в информационную систему.

Мы проследили историю развития СППР. СППР проделали

иoнныx cиcтeм) до систем, ис-

системах. Это направление развития СППР привело к

закций, каждый из которых со-

ьзовать для анализа хранимых данных.

тку данных (On-Lin

длинный эволюционный путь от СОД и сиcтeмы гeнepaции oтчeтoв (information reporting systems (IRS) — нaибoлee pacпpocтpaнeнная фopма yпpaвлeнчecкиx инфopмaцпользующих алгоритмы искусственного интеллекта15.

В первых системах СППР требовалось хранение больших мас-сивов данных и выполнение с большой скоростью транзакций в рас-пределенных созданию систем оперативной обработки транзакции (OLTP16 — Online Transaction Processing). OLTP-системы проектируются для управления большим потоком транпровождался внесением незначительных изменений в оперативные данные предприятий. Данные системы должны иметь инструмент обработки информации (операций, документов) в режиме реально-го времени. Объем данных может колебаться от нескольких мега-байт до терабайт и петабайт. В то же время такие системы трудно испол

В 1993 г. Е. Коддом была предложена концепция инструментов, реализующая оперативную аналитическую обрабо

e Analysis Processing — OLAP). OLAP состоит из многочислен-ных умозрительных сценариев прогнозируемого развития модели данных («что — если» и (или) «почему») в контексте некоторого определенного базиса (ретраспективные данные, точные в данный момент времени) и определенных временных перспектив [121]. Были предложены 12 правил оценки OLAP-системы, которые поз-

15 Наиболее ярким представителем последних систем являются систе-

мы анализа данных (см. ниже системы BI — Business Intelligenc). 16 Понятие OLTP (Online Transaction Processing — онлайновая обра-

ботка транзакций) относится также к способу организации БД, при кото-ром система работает с транзакциями, небольшими по размерам, но иду-щими большим потоком, и при этом клиенту требуется от системы максимально быстрое время ответа [14].

– 77 –

Page 78: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

же были переработаны в так называемый тест Быстрый Анализ Раз-деляемой Многомерной Информации — или кратко — тест FASMI (Fast Analysis of Shared Multidimensional Information) (см. http://www.basegroup.ru — глоссарий):

• Fast (быстрый) — предоставление пользователю результа-тов анализа за приемлемое время (обычно не более 5 с), пусть даже ценой менее детального анализа;

• Analysis (анализ) — возможность осуществления любого логического и статис ерного для данного приложения и его со я конечного пользо-ват

яемой) — многопользовательский доступ к

тического анализа, характхранения в доступном дл

еля виде; • Shared (раздел

данным с поддержкой соответствующих механизмов блокировок и средств авторизованного доступа;

• Multidimensional (многомерной) — многомерное концепту-альное представление данных, включая полную поддержку для иерархий и множественных иерархий (ключевое требование OLAP);

• Information (информации) — возможность обращаться к лю-бой нужной информации независимо от ее объема и места хране-ния.

В силу принципа «Multidimensional», OLAP ассоциируется с многомерным кубом или гиперкубом17 (рис. 3.5).

Например, при использовании модели данных о таварах гипер-куб может строиться по следующим измерениям: товар, адрес, по-купатель, время. На пересечениях измерений (dimensions) — нахо-дятся данные с опредленной размерностью (measures), или же агрегатные функции (min, max, avg, дисперсия, ср. отклонение и пр.). Каждое dimensions включает направления консолидации дан-ных, состоящее из серии последовательных уровней обобщения (уровней иерархии), где каждый вышестоящий уровень соответст-вует большей степени агрегации данных по соответствующему из-мерению (различные уровни их детализации).

17 Гиперкуб является концептуальной логической моделью организа-

ции данных, а не физической реализацией их хранения, поскольку хра-ниться такие данные могут и в реляционных таблицах.

– 78 –

Page 79: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

ТюменьМосква

Рязань

Рис. 3.5. Пример гиперкуба

Над гиппер

еркубом производятся аналитические OLAP-операции, е.

восприятия. Например, для таб-лиц

техника анализа, которая дает воз

общения) может быть задано иерар-

выполнить операцию down для измерения

icing and dicing). Термин, исполь-зуе

ечисленные нижСечение. Фиксируется (задается) одно или несколько значений

измерения и формируется новый гиперкуб. Например, если задать название товара, время и адрес магазина, то мы получим цену (ска-ляр), если задать название товара и адрес магазина, то получим значение цены в различное время (двумерная таблица).

Вращение (rolling). Изменяется порядок представления измере-ний, что обеспечивает удобстово

ы это транспонирование. Углубление в данные (Drill Down/Up — Drill Down) или Консо-

лидация (обобщение) (Drill Up) как отдельных измерений, так и выбранных элементов измерений) —

можность переходить вверх по направлению от детального (down) представления данных к агрегированному (up) и наоборот. Направление детализации (обхией измерений, так и различными отношениями, установленными в данной модели. Например, если при анализе данных об объемах продаж в г. Тюмени«Адрес», то на экране будут отображены различные магазины в г. Тюмени.

Разбиение с поворотом (slмый для описания функции сложного анализа данных: выборка

данных из многомерного куба с использованием операций враще-ния концептуального куба данных и детализации (агрегирования) данных.

– 79 –

Page 80: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

Физическая организация концептуальной модели возможна в трех вариантах:

• MOLAP (Multidimensional OLAP); • ROLAP (Relational OLAP); • HOLAP (Hybrid OLAP). MOLAP (Multidimensional OLAP) В MOLAP-модели многомерное представление данных реали-

зуется физически. В специализированных СУБД, основанных на многомерном представлении данных, данные организованы не в форме реляционных таблиц, а в виде упорядоченных многомерных массивов.

Достоинства: • высокая производительность, т. к. в случае использования

многомерных СУБД поиск и выборка данных осуществляется зна-чительно быстрее, чем при использовании реляционных баз данных;

• в МOL ии, которые тру

); нения:

гигабайт);

й пере-

я ответа системы на нерегламентированные запросы яв-ляе критичным параметром.

дан

-

AP легко встраиваются различные функцдно реализовать в SQL. Недостатки MOLAP-модели: • не позволяют работать с большими массивами данных; • трудности хранения и обработки разреженных данных (дан-

ные или неизвестны, или нулевыеОбласть приме• объем исходных данных для анализа не слишком велик (не

более нескольких• набор информационных измерений стабилен (поскольку лю-

бое изменение в их структуре почти всегда требует полностройки гиперкуба);

• времтся наиболее ROLAP (Relational OLAP) Системы оперативной аналитической обработки реляционныхных (ROLAP) позволяют представлять данные, хранимые в ре-

ляционной базе в многомерной форме, обеспечивая преобразова-ние информации в многомерную модель через промежуточный

– 80 –

Page 81: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

слой метаданных. В этом случае гиперкуб эмулируется СУБД на логическом уровне.

Для большинства хранилищ данных наиболее эффективным способом моделирования N-мерного куба фактов является схема «звезда» (star schema) (рис. 3.6).

Рис. 3.6. Пример реализации схемы «звезда»

Основными составляющими структуры хранилищ данных яв-ляются таблица фактов (fact table) и таблицы измерений (dimension tables). В сложных задачах с многоуровневыми измерениями ис-пользуются различные расширения схемы «звезда» — схема сне-жинка» (snowflake s

У

AP (Hybrid OLAP)

«chema).

Достоинства: • размер хранилища не является критичным параметром, как в

случае MOLAP; • внесение изменений в структуру измерений не требует физи-

ческой реорганизации базы данных, как в случае MOLAP; • реляционные С БД обеспечивают высокий уровень защиты

данных. Недостаток: • меньшая производительность. HOLГибридные системы (Hybrid OLAP, HOLAP) разработаны с це-

лью совмещения достоинств и минимизации недостатков, прису-щих предыдущим классам. В книге Т. Конноли [49] данная техно-

– 81 –

Page 82: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

логия описана как инструмент, управляемый средой(MQ

Основные данные базе (ROLAP), агре-гированны ерной структуре к. си-

нужны в о редко пред

куб д

Достоинства: н и

сопровождения; ь т-

бы данных.

запросов E) c промежуточным MOLAP-кубом.

хранятся в реляционной е — в многом (кубе MOLAP), т.

туация, когда для анализа . Многомерные данные

се данные, возникает достаточнставляются в виде киосков дан-анных анализируется средстваминых (рис. 3.7). Построенный

многомерного OLAP.

• относительная простота и сталляции, администрирования

• способность каждого полвенные ку

зователя создавать свои собс

Рис. 3.7. Архите

сн -

мационные хранилища) были предложены фирмой IBM как реше-ние

ктура HOLAP

С OLAP-технологией тесноных18. Изначально хранилища да

вязано понятие хранилищ дан-ных (тогда их называли инфор

, обеспечивающее доступ к данным, накопленным в нереля-ционных системах. В настоящее время хранилища данных являются рабочей средой для СППР, которая включает не только технологию управления данными, но и их анализ. В табл. 3.1 при-ведены данные сравнения OLTP-систем и хранилищ данных.

18 Хранилище данных (DW — data warehouse) — предметно-ориенти-

рованная информационная корпоративная база данных, предназначенная для подготовки отчетов, анализа бизнес-процессов и поддержки принятия решений.

– 82 –

Page 83: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

Таблица 3.1 Сравнение основных характеристик типичной OLTP-системы

и хранилища данных [49]

OLTP-система Хранилище данных Содержит текущие данные Содержит исторические данные

Хранит подробные сведения Хранит подробные сведения, а так-же частично и значительно обоб-щенные данные

Данные являются динамическими Данные в основном являются ста-тическими

Повторяющийся способ обработки данных

Нерегламентированный, неструк-турированный и эвристический способ обработки данных

Высокая интенсивность обработки транзакций

Средняя и низкая интенсивность обработки транзакций

Предсказуемый способ использова-ния данных

Непредсказуемый способ использо-вания данных

Предназначена для обработки тран-закций

Предназначена для проведения анализа

Ориентирована на прикладные об-ласти

Ориентирована на предметные об-ласти

Поддержка принятия повседневных решений

Поддержка принятия стратегиче-ских решений

Обслуживает большое количество работников исполнительного звена

Обслуживает малое количество ра-ботников руководящего звена

На сегодняшний день существуют два основных подхода к ар-

хитектуре Хранилищ данных. Это так называемая корпоративная информационная фабрика (Corporate Information Factory — CIF) и хранилище данных с архитектурой шины (Data Warehouse Bus — BUS). В архитектуре CIF данные представляются в виде киосков данных, ориентированных на организационные структуры. В архи-тектуре BUS представление данных осуществляется в виде киос-ков, ориентированных на процессы [50]. Архитектура хранилища данных приведена на рис. 3.8.

– 83 –

Page 84: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

Рис. 3.8. Архитектура хранилища данных [49]

Логическим продолжением применения хранилища данных яв-ляются системы бизнес-анализа (Business Intelligence). Business Intelligence — интеллектуальный инструментарий, позволяющий решать п нию от-четов по могут вкл

а-бот

димо осуществить для того, чтобы из исходных данных получить зна

роблемы доступа к разнородным данным, построельзователей и анализу данных. Данные системы

ючать: хранилища данных, запросы конечного пользователя и инструмент для создания отчетов, OLAP-инструменты, Data Mining инструменты. Архитектура Business Intelligence представлена на рис. 3.9. Knowledge Discovery in Databases (KDD) — процесс поис-ка полезных знаний в «сырых данных». KDD включает в себя про-цессы: подготовки данных, выбора информативных признаков, очистки данных, применения методов Data Mining (DM), постобр

ки данных. KDD не задает набор методов обработки и алгорит-мов, он определяет последовательность действий, которые необхо-

ния.

– 84 –

Page 85: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

Рис. 3.9. Архитектура организации Business Intelligence

Data mining19. Добыча данных — процесс аналитического ис-следования больших массивов информации (обычно экономиче-ского характера) с целью выявления определенных закономерно-стей и систематических взаимосвязей между переменными, которые затем можно применить к новым совокупностям данных. Этот процесс включает три основных этапа: исследование, по-строение прогнозирующей модели или структуры и ее проверку.

В основу data mining заложены готовые фрагменты, отражаю-щие фрагменты данных (паттерны данных). Он позволяет опреде-

19 http://ru.wikipedia.org/wiki/Data_mining.

– 85 –

Page 86: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

лить заранее неизвестные типы закономерности из известных. При этом применяются различные алгоритмы для нахождения знаний:

• нейронные сети; • деревья решений; • алгоритмы кластеризации; • установления ассоциаций; • фильтрации; • нечеткая логика; • ассоциативные правила и т. д.

Документальные системы

Документальн системы термин весьма разм тый. Мы ис-пользуем его для того, чтобы обозначить системы, в которых вы-полняется преобразование информации документальной (ИДП). ИДП — процесс аналитико-синтетического изучения документов

ые — ы

я дан

20 (текстов) и подготовки вторичной информации, отражающей наиболее существенные элементы содержания этих документов. Наиболее распространенные формы представления результатов ИДП — библиографическое описание, аннотация, реферат, кон-спект, обзор и т. п. Преобразование может осуществляться в виде индексирования21, извлечения из документов необходимых факто-графических данных, свертывания объема текста при относитель-ном сохранении объема смысловой информации, представлени

ных в наиболее рациональной для хранения и восприятия фор-ме и т. д. В общем смысле ИДП включает также перевод текстов с одного языка на другой [1].

Кроме того, к документальным системам мы будем относить до-кументные системы. Документная система или система управления

20 Документ (document, records): Зафиксированная на материальном

носителе идентифицируемая информация, созданная, полученная и со-храняемая организацией или частным лицом в качестве доказательства при подтверждении правовых обязательств или деловой деятельности.

щения доступа к док .

21 Индексирование (indexing): Процесс проставления условных обо-значений и составления указателей, служащих для упро

ументам и (или) информации [50]

– 86 –

Page 87: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

док

мационного обслужива-ния

ибернетика» сос

ументами (records system) — информационная система, обеспе-чивающая сбор документов (включение документов в систему), управление документами и доступ к ним в течение времени [50]. Большинство систем управления документами используют ИДП.

Документальные системы ведут свое происхождение от биб-лиотечно-реферативных служб или информационных центров, вы-пускающих реферативную информацию (обзоры, экспресс-инфор-мацию, реферативные журналы).

В СССР в начале 50-х гг. была создана система НТИ22, которая представляет совокупность организаций, осуществляющих обра-ботку первичных и создание потоков вторичных документов. В РФ Государственная система научно-технической информации (ГСНТИ) — это средство создания и эффективного использования государственных ресурсов научно-технической информации. ГСНТИ осуществляет сбор, хранение и обработку отечественных и зарубежных источников НТИ; ведение информационных фондов, баз и банков данных; организацию инфор

на их основе. В ГСНТИ входят федеральные, отраслевые, ре-гиональные органы НТИ и научно-технические библиотеки. Так, например, ВИНИТИ (Всесоюзный институт научно-технической информации) — осуществляет координацию СНТИ РФ, выпуск РЖ23, экспресс-информации, обзоров «Итоги науки и техники». С 1979 г. РЖ выпускается в виде машиночитаемых баз данных.

Годовой комплект РЖ ВИНИТИ «Техническая ктоит из 12 выпусков Собственно РЖ и двух указателей. Каждый

выпуск содержит более 500 статей, описывающих либо первоис-точники, либо их фрагменты (журнальные статьи и др.). В статье указаны автор, заглавие, библиографические данные (год, том, но-мер, классификационный индекс, место издания и др.), реферат. Запись имеет уникальный внутренний номер, идентифицирующий внутренний данный документ (реферат) в авторском и предметном указателях.

22 Научно-техническая информация; НТИ: Информация, получаемая и

(или) используемая в области науки и (или) техники [4]. 23 РЖ — реферативный журнал.

– 87 –

Page 88: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

Обработку такого большого информационного массива необхо-димо было формализовать и автоматизировать. Система стандартов по информации, библиотечному и издательскому делу (СИБИД) призвана была регламентировать ИДП в информационно-библио-течных системах. Первыми документальными системами, создан-ным

ого университет

у. В 1

Одним из в интернете стала програм rer), разрабо-тан

ы. Компанией «Ст

я 1997 г. заработал Yandex, выросший из ком

Параллельно с разработкой поисковых машин начались попыт-ки

ко

и в ВИНИТИ, были системы информационного поиска. К этому времени уже существовала первая компьютерная информационно-поисковая система SMART, созданная профессором Корнеллск

а Джерарданом Солтоном. В данной системе впервые применялась плоская векторная модель, и поныне широко исполь-зуемая в поисковых машинах, наряду с алгоритмами релевантной обратной связи.

Несколько позднее появились поисковые системы, призванные автоматизировать поиск информации по FTP и Gopher протокол

989 г. Алан Эмтадж написал программу Archie, впоследствии признанную первой поисковой машиной.

самых первых инструментов для поискама «Скиталец» (World Wide Web Wande

ная Мэтью Греем. Он первый выдвинул идею об Internet-роботах, которые сканировали сеть www. В последующие годы появилось большое число поисковых систем, из которых наиболее яркой в настоящее время является система Google. 45% запросов в интернете обрабатываются этой поисковой системой.

В России были созданы свои поисковые системек» (Пущино) была создана собственная поисковая система,

которую назвали Rambler — «скиталец». Осенью 1996 г. был готов окончательный вариант, 26 сентября был зарегистрирован домен rambler.ru. 23 сентябр

паний Comptek и «Аркадия»; вскоре в нем были реализованы запросы на естественном языке.

создать каталоги ресурсов. В 1994 г. открылся EINet Galaxy. В апреле того же года Дэвид Фило и Джерри Янг создали каталог Yahoo! Directory, торый впоследствии был трансформирован в

– 88 –

Page 89: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

одноименную поисковую машину. Создание каталогов, в отличие от индексации страниц интернета в поисковых системах, осущест-вляется обычно не в автоматическом режиме, а в автоматизирован-ном до сих пор содержит штат, состоящий примерно из 150 модераторов.

Поисковые системы являются основным модулем информаци-онно-библиотечных систем. Многие документные системы содер-жат модули полнотекстовой индексации и поиска информации.

Наряду с решением задач поиска и классификации информа-ции, в документальных системах решались лингвистические зада-чи. Эти задачи приходилось решать и разработчикам поисковых систем. Тогда же появились самостоятельные документальные ин-формационные системы, которые решали вопросы автоматическо-го перевода, реферирования текста, проверки орфографии и т. д.

Документальные системы получили широкое развитие в биб-лиотечно-поисковых системах и системах документооборота.

Информационно-поисковые системы

И em), ИПС — тех-нич

вать не будут. В с

. Yahoo!

нформационно-поисковая система (Information retrieval systсовокупность справочно-информационного фонда и

еских средств информационного поиска в нем [54]. Информа-ционный поиск осуществляется с целью распространения инфор-мации24. Распространенная информации является составной частью справочно-информационного обслуживания (СИО).

Необходимо отметить, что ИПС может не использовать компь-ютерные технологии, но нас эти системы интересо

илу этого термины «Автоматизированная ИПС» и «ИПС» будем считать синонимами.

Основная терминология, используемая в ИПС, регламентиро-вана СИБИД (Система стандартов по информации, библиотечному

24 Распространение информации: процесс предоставления информа-

ции, имеющейся в информационно-поисковых системах, потребителям информации [54].

– 89 –

Page 90: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

и издательскому делу). На основе СИБИД можно выделить группы поисковых систем, представленных на рис. 3.10. На рис. 3.11 при-ведена схема функционирования ИПС.

Рис. 3.10. Классификация информационно-поисковой системы

Основной операцией, выполняемой поисковой системой, является индексиров ие содержа-ни -фо индексирования -ное, сводное и фактографическое .

Индексирование должно проводиться на основе непосредст-вен

нно-поисковой системы (ИПС) в соответствии с общи-

-ание, под которым понимается выражен

я документа и (или) смысла информационного запроса на инрмационно-поисковом языке. Выделяют следующие виды

: классификационное (систематизация), предмет индексирование

ного анализа документа с учетом характера информационно-поискового массива, элементом которого становится ПОД, с учетом характера информационных потребностей пользователей данной информациоми принципами индексирования и особенностями их применения в конкретной организации. Различают два основных принципа ин-дексирования — классификационный и предметизационный.

– 90 –

Page 91: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

Рис. 3.11. Схема функционирования ИПС: ИПЯ — информационно-поисковый язык25; ПОД/ПОД — поисковый

образ документа 26 27 (факта) ; ПОЗ поисковый образ запроса ; ПП — поисковое предписание28

25 Информационно-поисковый язык — формализованный искусствен-

ный язык, предназначенный для индексирования документов, информа-цио я и пои

е документа или конкретное све-ден

зыка, выражающий содержание документа или

нных запросов и описания фактов с целью последующего хранениска [55]. 26 Поисковый образ документа (факта) — поисковый образ, выра-

жающий основное смысловое содержаниие. Поисковый образ — текст, состоящий из лексических единиц ин-

формационно-поискового я

– 91 –

Page 92: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

Классификационный принцип29 индексирования базируется из представления содержания документа в некоторой специально разработанной классификационной системе и использовании в качестве терминов индексирования классификационных индек-сов, в которых отношения между классами этой системы выраже-ны в явном виде.

Предметизационный принцип индексирования базируется на представлении содержания документа в понятийной системе опре-деленного естественного языка и на использовании в каминов индекси естественного языка.

К о поисковы ков относят дескрипторные ые рдинатного индексирования доку-онных запросов посредством дескрипторов30 и

лее подробно об ИПЯ, индексировании и информационно- емах смо

с ы - и документаль емами31. В к-

одиться доку-а, но фактов поэтому

поисковые системы разделяются на документальные, фактографи-

честве тер-рования лексических единиц (ЛЕ)

собому виду х языИПЯ, предназначеннментов и информаци

для коо

(или) ключевых слов. Бо

поисковых сист трите главу 5. Выше уже отмечала

ческимиь условность границными сист

между фактографио-первых, полноте

стовая индексация текстментального поиск

а может пров и поиска

не только для. Именно

29 ИПЯ может решать задачи классификации и (или) рубрикации.

.

атуре.

информационного запроса и предназначенный для реализации информа-ционного поиска [55].

27 Поисковый образ запроса — поисковый образ, выражающий смы-словое содержание информационного запроса [55].

28 Поисковое предписание — текст, включающий поисковый образ запроса и указания о логических операциях, подлежащих выполнению в процессе информационного поиска [55].

30 Дескриптор — лексическая единица, выраженная информативным словом (вербально) или кодом, являющаяся именем класса синонимичных или близких по смыслу ключевых слов

31 Мы используем эту классификацию только потому, что она широко применяется в литер

– 92 –

Page 93: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

чес

могут относиться к ф

кие32 и документально-фактографические поисковые системы. Во-вторых, определение в СИБИД фактографического поиска пол-ностью соответствует поиску данных, выполняемых СУБД, следо-вательно, фактографические поисковые системы

актографическим системам. Фактографические поисковые сис-темы относят к системам выборки данных (data retrieval systems) — СВД, ярким представителем которых является СУБД. В табл. 3.2 приведен сравнительный анализ СВД и ИПС.

Таблица 3.2 Сравнительный анализ СВД и ИПС

Свойства СВД ИПС Соответствие данных поисковому запросу Точное Частичное

Классификация докумен-тов Детерминированная Вероятностная

Язык запросов Искусственный Естественный Критерии выборки доку-ментов

Булева функция реле-вантности

Вероятностная функ-ция релевантности

Устойчивость к ошибкам в данных и запросах Неустойчивы Устойчивы

Основной задачей СВД является обеспечение надежного и эф-

фективного хранения данных, а также высокой скорости выполне-ния поисковых запросов пользователей. Основная задача ИПС — выбор релевантной33 поисковому запросу информации. В идеаль-ном случае степень релевантности может определяться как смы-словая близость к поисковому запросу. В этом случае поисковые запросы в ИПС должны быть основаны на естественном языке, т. е. на языке, в котором сформулирована исходная информация.

32 Не надо путать фактографические информационные системы, рас-

смотренные выше, и фактографические поисковые системы, которые от-носятся к документальным системам.

33 Релевантность — соответствие полученной информации информа-ционному запросу.

– 93 –

Page 94: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

Вместе с тем, ИПС и ВД не могут быть строго разделены, т. к. и в тех, и в других системах используются общие концепции и алго-ритмы. Так, например, в ИПС выборка данных чаще всего произ-водится по ключевому слову (сравните с СУБД).

В фактографическом поиске пользователь может искать не просто информацию на тему, а конкретный ответ на вопрос, на-пример: «Когда построена пирамида Хеопса?». Обеспечение та-кой функциональности поисковой системой подразумевает обра-ботку вопроса на естественном языке, его переформулировку в стандартные запросы для данной системы, нахождение докумен-та, содержащего нужный фрагмент, и извлечение ответа. В этом случае фактографическая поисковая система относится к доку-ментальным системам.

К отличительным особенностям поисковых систем можно от-нести структуру или, лучше сказать, отсутствие структуры в ин-формации, с которой они работают. Под структурой тут понимает-ся реляционная или концептуальная (семантическая) структура. Примером такой информации может быть текст, аудио, видео, изо-бражения и т. д. Данная информация имеет смысловое содержание, может иметь парадигматическую ценность для потребителя, но не может базу данны рук-туры и от Из этого много вых, объ

ин

Классическая задача информационного поиска которой и на-чалось развитие этой области, — это поиск документов, содержа-щих информацию, релевантную запросу в рамках некоторой стати-чес

быть автоматически преобразована в реляционнуюх, к которой можно сделать запрос. Отсутствие этой ст

личает алгоритмы работы поисковых систем. образия выделены тексты по двум причинам. Во-пер

ем этой информации намного больше, поэтому актуальность поиска в документах несравненна выше. Во-вторых, алгоритмы поиска мультимедийной информации основываются на текстовых поисковых системах (сначала мультимедийная формация преоб-разуется в текст).

, с

кой (на момент выполнения поиска) коллекции документов. Будем считать, что релевантная запросу информация — это ин-

– 94 –

Page 95: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

форвать эффективность различных методов решения задач информа-ционного поиска, необходимо определит какие критерии будут использованы для оценки эффективности. Конечно, вычислитель-ная

воНа

мация, которая нужна пользователю34. Для того чтобы сравни-

ь,

производительность метода является одним из критериев оцен-ки эффективности, однако более важными критериями обычно яв-ляются критерии, характеризующие качест результатов поиска.

рис. 3.12 схематично показан результат поиска.

АR

S

Рис. 3.12. Схематическое отображение результатов поиска: А — множество всех документов, на котором ведется поиск,

R — множество релевантных запросу документов, S — множество документов, выбранных поисковой системой

В терминах теории множеств точность (precision) — доля ис-тинно релевантных документов в общем числе найденных, и пол-нота (recall) — доля обнаруженных истинно релевантных доку-ментов определяется по формулам:

R S R SPrecision ; Recall

S R∩ ∩

= = .

34 Обратите внимание, что пока мы ничего не говорим о смысловом

соответствии.

– 95 –

Page 96: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

Можно также рассматривать долю нерелевантной информации:

( )S\ R SJunk

∩= .

S

В идеале хотелось бы получить точность и полноту равными единице. На практике чем выше точность, тем меньше полнота и наоборот.

Принцип, по которому строится релевантность, определяет мо-дель поисковой системы. Выделяют три основные модели, различ-

сическом представлении булевой модели релевантность — это как раз бинарная классификация, что влечет за собой много неудобств. Например, неправильное употребление терма (слова) в запросе или

где

ные расширения которых осуществлены в сегодняшних поисковых системах [56-58]:

Булева (логическая). В булевой модели документы и запрос рассматриваются как логические множества. Если документ пере-секается с запросом, то он ему релевантен. Таким образом, в клас-

же опечатка в тексте может классифицировать релевантный доку-мент как нерелевантный. Поэтому дальнейшие расширения (моди-фикации) модели были направлены на преодоление данной про-блемы. Например, учет весов (значимости) слов в тексте документов и запроса сделал возможным ранжирование результа-тов булева поиска. Реализация булевой модели — самая простая и эффективная, что сделало популярным ее применение в web.

Векторная (алгебраическая). В рамках векторной модели по-иска документы и запрос преобразуются в вектора, где компонентывектора — это веса слов. Наиболее популярной схемой взвешива-ния слов является произведение:

wik = tfik × idfk ,

количестводокументов, в которых встречается -терм

количество документовkk

idf = —

мера того, насколько часто данное слово встречается во всей кол-лекции документов,

– 96 –

Page 97: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

частота встречив -документе -термачастота встречив -документе всех термовik

i ktf

i= — мера того,

насколько часто данное слово встречается в данном документе. Возможно использование бинарной схемы взвешивания: «1» —

слово присутствует в документе, «0» — отсутствует. Близость век-тора запроса и документа (например, их корреляция) и определяет ран дг окумента в списке результатов поиска. Векторная модель получила большое распространение, как среди классических поис-ковых систем, так и среди поисковых систем в web.

Вероятностная. В вероятностной модели поиска вероятность того, что данный документ релевантен данному запроется н 35

су, основыва-

мы Байеса:

а предположении, что термы запроса по-разному распреде-лены среди релевантных и нерелевантных документов. Используе-мая формула вероятности, как правило, исходит из теоре

( )( ) ( )

( )|

|P d R P R

P R dP d⋅

= ,

где P(R) — вероятность того, что случайно выбранный из коллек-ции документ D является релевантным; P(d|R) — вероятность слу-

оятность случайного выбора документа d из кол

. 3.11 объеди-нен

чайного выбора документа d из множества релевантных докумен-тов; P(d) — вер

лекции А. Из перечисленных выше моделей реализуются основные функ-

ции поисковой системы: нормализация документа, индексирова-ние, поиск. Нормализация и индексирование на рис

ы в процессе индексирования. Нормализация документа выполняется с соблюдением грам-

матики ИПЯ. Процесс нормализации может включать в себя: • транслирование (перевод текстовых документов в определен-

ную кодировку, графических — в определенный формат файла);

35 Под «термом» могут пониматься ключевые слова или же n-граммы

(последовательность n символов), или же ключевые слова с отброшенны-ми суффиксами.

– 97 –

Page 98: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

• зонирование (разбиение документа на логические части, ис-пользуемые в данной системе, например, название документа, ан-нотация к нему);

• дополнительные операции, необходимые для преобразования документа в удобную для

– выделение лекси (семантически зна

трудно. Условно можно считать лингвистиче-

ектив-

зможно использование других критериев (таких, как но-

поиска структуру: ческих единиц или токенов

чимых слов); – нормализация самих лексических единиц (отбрасывание

окончаний и т. п.). При нормализации могут применяться различные лингвистиче-

ские методы: • автоматическое определение языка документа; • токенизация (графематический анализ): выделение слов, гра-

ниц предложений; • исключение неинформативных слов (стоп-слов); • лемматизация (нормализация, стемминг): приведение слово-

изменительных форм к «словарной». В том числе и для слов, не входящих в словарь системы;

• разделение сложных слов (компаундов) для некоторых язы-ков (например, немецкого);

• амбигуация: полное или частичное снятие -нимии (омони-мия, синонимия).

Между статистическим методом и лингвистическим точные границы провестискими методы, опирающиеся на словари (морфологические, син-таксические, семантические), созданные человеком.

Так же, как и в СУБД, для достижения приемлемой эффности поиск производится не напрямую по документам в коллек-ции, а по информации о них в избыточной индексной структуре. Существует несколько способов индексирования текстов: инвер-тированный файл, файл сигнатур и т. п.

Поисковый модуль отвечает за получение и выполнение за-просов пользователей. Ранжирование результатов поиска, как пра-вило, основывается на степени релевантности документа запросу. Однако во

– 98 –

Page 99: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

визна документа). Более того, при поиске в интернете ранжирова-ние по релевантности показало свою неэффективность, что потре-бовало разработки иных подходов к задаче ранжирования (см. по-иск в интернете).

Поиск в интернете

Сегодня, более 75% пользователей интернет используют поис-ковые системы для доступа к информации [56]. Специфика интер-нета обусловила необходимость модификации классических мето-дов поиска. Необходимо принимать во внимание, что поиск в интернете — это поиск информации на серверах различного типа: http, ftp, gopher. Кроме поиска во Всемирной паутине (WWW) оста-ется актуальным поиск на FTP-серверах. В дальнейшем обсуждает-ся поиск в www.

Специфика web-поисковых систем обусловлена некоторыми факторами: особенностью данных, представленных в интернете; особенностью поведения пользователей интернета; целенаправлен-ное создание алгоритмов обмана поисковых систем.

Методы поиска, используемые в классических ПС, разрабаты-вались и тестировались на относительно небольших и однородных коллекциях документов. Можно выделить следующие особенности web-информации [56].

• Размер. Размер Всемирной паутины оценивается в несколько тысяч террабайт.

• Динамика развития. Ежемесячно изменяется около 40% ин-формации. Объем всей информации растет по экспоненциальному закону (объем информации за последние два года удвоился).

• Неструктурированность и избыточность. Гипертекстовая структура страниц создается часто без концептуальной модели. Около 30% информации в Веб являются точными или приблизи-тельными копиями других документов.

• Неконтролируемое качество. В интернете содержится масса ложной информации, непроверенные данные, орфографические ошибки (запрос в google «инфармация» дает примерно тысячу (!) ссылок).

– 99 –

Page 100: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

• Экспертные оценки web-информации. Экспертные оценки могут быть как явными (публикация на том, или ином сайте), так и не явными (подобие индекса цитируемости). Важным источником экспертных оценок в Веб являются гипертекстовые ссылки.

• Тематическая локальность. Эмпирически доказано интуитив-ное предположение о том, что ссылки со страниц в Веб в основном ведут на страницы близкой тематики.

К особенностям поведения пользователей поисковых систем в Веб можно отнести следующие.

• «Плохие» запросы. Более 60% поисковых запросов в Веб со-стоят из 1-2 слов, что очень отличается от 7-9 слов в классических ПС. Большая часть пользователей не используют расширенные возможности поиска.

• Разнородный контингент. В отличие от классических ИПС, пользователи интернета обладают разными знаниями, потребно-стями и т. д.

• Требование быстрого поиска. Более 50% пользователей неидут да пыток модифицировать свой первоначальный запрос.

х но-вые

льше первого экрана, а 67% не предпринимают по

Хотя размер базы в интернете на поверхностный взгляд не ка-жется критическим фактором, это не так. Недаром рост посещае-мости таких машин, как Google и Fast, хорошо коррелируют имен-но с ростом их баз. Основная причины: «редкие» запросы, т. е. те, по которым находится менее 100 документов, составляют в сумме около 30% от всей массы поисков.

Указанные особенности нашли отражения в архитектуре поис-ковых систем в интернете (рис. 3.13) [56].

Ключевым архитектурным отличием от классических ПС явля-ется наличие сетевых роботов. Сетевые роботы — это программы, которые, исходя из некоторого начального множества ссылок (URL), рекурсивно сканируют веб-страницы, извлекая из ни

ссылки. Как правило, извлеченные ссылки сначала передаются модулю стратегии сканирования, который определяет, какие из них стоит посещать и отдает соответствующие ссылки обратно се-тевым роботам. Этот выбор напрямую зависит от направленности поисковой системы.

– 100 –

Page 101: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

Рис. 3.13. Обобщенная схема поисковой системы для Веб

Собранные роботами документы складываются в хранилище. Хранилище содержит большое количество объектов данных (веб-страниц) и, в этом смысле, очень похоже на СУБД или файловую систему. Однако многие возможности таких систем в данном слу-чае совершено не нужны (например, транзакции или иерархия ди-ректорий), зато очень важны другие: масштабируемость, эффек-тивная поддержка двух режимов доступа: случайного — для того, чтобы быстро найти конкретную страницу по ее идентификатору (например, для создания копии страницы из кэша ПС), и потоково-го — для того, чтобы вынуть значительную часть всей коллекции (например, для индексирования или анализа), эффективная под-держка обновлений, сборка «мусора» (устаревших страниц).

Для повышения эффективности поиска используются индекные структуры. За создание этих структур отвечает модуль индек-сирования. Кроме текстовых индексов, часто дополнительно стро-

руктурном мо-

с-

ятся структурный и вспомогательный индексы. В стиндексе описывается структура графа Веб, и эта информация

– 101 –

Page 102: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

жет

вило, используется для ранжирования рез

быть полезна модулю стратегии сканирования. Во вспомога-тельном индексе хранится любая другая нужная конкретная ПС информация, которая, как пра

ультатов поиска, например, размер веб-страниц, количество ис-пользуемых графических изображений, PageRank метрика.

Получение и выполнение запросов пользователей — это задача модуля поисковая машина. В основном, поиск осуществляется по индексным структурам, но может — и напрямую по документам в хранилище (пунктирная связь на рисунке). Информацию о том, ка-кие ресурсы наиболее часто посещаемы пользователями, поисковая машина передает модулю стратегии сканирования.

В силу перечисленных выше особенностей, важной задачей в контексте Веб является упорядочивание результатов поиска так, чтобы первыми оказались те результаты, которые вероятнее всего интересны для пользователя. За этот процесс отвечает модуль ранжирования. Классические подходы к ранжированию, опираю-щиеся на понятие релевантности, как меру схожести текста запроса и текста документа, работают плохо.

Поэтому оказалось более перспективным использовать в до-полнение к релевантности еще и меру важности (полезности, попу-лярности) веб-страницы при ранжировании результатов поиска. Типичным примером такой метрики является индекс цитирования, т. е. количество ссылок на данную страницу, при этом учитывается важность ссылающихся страниц.

Первым, и наиболее известным, расширением индекса цитиро-вания в Веб стала метрика PageRank, реализованная в Google (http://www.google.com). Метрика PageRank рекурсивно определяет важность страницы p на основе информации о ссылках со страниц q на нее:

( )( ) (1 )

по всемq страницамссылающимся

на p

PageRank qPageRank p d d

количество ссылок с q страницы= − + × ∑ ,

где d — это некоторый параметр (обычно порядка 0,85).

– 102 –

Page 103: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

Еще одним примером модифицированного индекса цитирова-ния в Веб является Яндекс цитирования в поисковой системе Ян-декс (http://www.yandex.ru).

Другой популярной метрикой определения важности Веб-стра-ницы является HITS (Hyperlink-Induced Topic Search). Если Page-Rank вычисляется один раз глобально для всех страниц в индексе, то в рамках модели HITS предполагается, что важность страницы зависит от запроса, т. к. в разных тематических сообществах — разные авторитеты. Поэтому HITS вычисляется локально для каж-дого запроса. Примером поисковой системы, использующей HITS, является Teoma (http://www.teoma.com).

На рис. 3.14 показана архитектура наиболее популярной поис-ковой системы в интернете [59]. В Google, выгрузка данных из ин-тернета осуществляется несколькими «пауками». Есть URLserver, который направляет списки URL, которые нужно выбрать пауку. После того, как паук посетил страницу, она отправляется на сервер хранения, в котором производится сжатие и отправка страницы в репозиторий. Каждая web-страница имеет связанный ID-номер, на-зываемый docID. Он назначается каждый раз, когда новый URL анализируется из web-страницы. Функция индексации выполнена модулем индексации и сортировщиком. Модуль индексации вы-полняет множество функций: чтение из репозитория, распаковкадокументов и и вертируется во мно

зей с web-стра-ниц

х анализ. Каждый документ кон

жество экземпляров слова, называемых хитами. Хиты регист-рируют слова, положение в документе, аппроксимацию размера шрифта и выделение прописных букв. Модуль индексации распре-деляет эти хиты на множество «цилиндров», создавая частично от-сортированный прямой индекс. Модуль индексации выполняет еще другую важную функцию анализа всех внешних свя

. Информация об этих связях сохраняется в файле анкеров (анкер — элемент HTML, связывающий web-документы). Этот файл содержит достаточно информации, чтобы определить текст связи и какая web-страница с какой связана.

– 103 –

Page 104: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

Рис. 3.14. Архитектура ИПС Google

URLresolver читает файл анкеров и конвертирует относитель-ный URL-адрес в абсолютный URL, связывает его с docIDs. При этом текст анкера помещается в прямой индекс, связанный с docID, на который анкер указывает. При этом генерируется база данных связей, состоящая из пар docIDs. База данных связей используется при вычислении PageRanks для всех документов.

Сортировщик выбирает цилиндры, сортирует, обращает их, и генерирует инвертированный индекс, в котором отсортированные wordID указывают на docID. Инвертированный индекс дает воз-можность ускорить процесс поиска web-страниц по ключевому слову. Сортировщик также генерирует список wordIDs и смещение

– 104 –

Page 105: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

в иарем, созданный модулем индексации и гене-

е. ьзуя словарь, сгенериро-

вертируемым индексом и

ребляют как синоним системы управ-туре существует до-

СЭД. В конце 1980-х и начале 90-х гг. получили широ-ми

.

a

нными арх е

нвертированном индексе. Программа DumpLexicon берет этот список вместе со словрирует новый словарь, который будет использоваться при поискПоиск выполняется web-сервером, исполванный DumpLexicon совместно с инPageRanks.

Системы электронного документооборота (СЭД)

Системы электронного документооборота — CЭД, русскоязыч-ный термин, иногда его употления документом. В англоязычной литеравольно большое количество терминов, которые используются как синонимы кое развитие Системы управления электронными документа(EDMS — Electronic Document Management Systems). Впоследствии их чаще называют Системами управления документами (DMS — Document Management Systems)

EDMS развивались как автономные системы, в одном из четы-рех направлений [15]: отображения документов (Document ima-ging), поддержка рабочих процессов или делопроизводства (Workflow), управление документов (document management) и управление электронными архивами (Electronic Records Manage-ment). Каждое из этих направлений решало ту или иную узкую за-дачу. Так, например, отображения документов (или управление изображениями документов — Document Imaging Management) ре-шало проблемы сканирования бумажных документов и (или) мик-рофильмов и хранение этих изображений. Assocation for Information and Im ging Management (AIIM) разработала новые технологии описания и хранения изображений. Многие требования порождались на уровне подразделений. Развитие методов отобра-жения документов определялось обработкой бланков, рабочих про-цессов — обработкой претензий по гарантиям, управление докумен-тов — инжинирингом документов, управление электро

ивами — распространением и хранением жемесячных финансо-вых отчетов.

– 105 –

Page 106: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

Внедрение первых автономных EDMS-технологий показало ос-новные достоинства:

• снижение обращений бумаги и ошибок ручной обработки; • сокращение бумажных хранилищ; • уменьшение потерь документов; • быстрый доступ к информации; • диалоговый доступ к информации, которая прежде была дос-

тупна только на бумаге, микрофильмах или микрофишах; • улучшенный контроль над документами и процессами, ори-

ентируемых на документы; • уменьшение ручного рутинного труда; • обеспечение безопасности доступа к документам и их моди-

фикации; • обеспечение надежного и точного аудиторского анализа; • совершенствование технологий мониторинга и контроля, по-

зволяющих определить узкие места и изменить систему с целью повышения ее эффективности.

В конце 1990-х гг. и рынок и поставщик и программного обес-печения начали понимать стратегический потенциал ПО, который объединил независимые технологии EDMS и web-технологии в ин-тегрированное решение. Начиная с 2001 г., промышленность ис-пользует термин «управление контентом предприятия» (enterprise content management — ECM), обозначая интегрированное решение, объединяющее EDMS-технологий. Использование термина «enter-

миллионов документов обеспечивается файловыми храни-

prise» говорит о том, что данное решение охватывает процессы все-го предприятия (ECM). Одними из первых решений (2005-2006 г.) на рынке были продукты Microsoft (семейство продуктов SharePoint) и Oracle Corporation (Oracle Content Management). Тре-бование масштабируемости средств просмотра и поддержки для сотенлищами (размером Тбайт, Пбайт, Ебайт), которые соответствуют стандартами типа HIPAA, SAS 70, BS7799 и ISO/IEC 27001.

Управления контентом может иметь множество аспектов: управление контентом предприятия, управление web-контентом

– 106 –

Page 107: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

или контент-менеджмент (Web content management — WCM, очень часто управление контеном ассоциируется именно с этим аспек-том), синдикация контента (публикация контента в нескольких web-узлах), управление цифровыми и медиа-ресурсами. ECM мож-но рассматривать как некоторый обобщенный термин различных технологий, существующий параллельно с технологиями связан-ных документов (DRT — Document Related Technologies) или управление жизненным циклом документов (DLM — Document Lifecycle Management).

Различие в ECM и WCM весьма условно. Обе технологии стро-ятся на разворачиваемом интернет-портале. Управление web-контентом решает задачи, связанные с представлением контента через web-портал в интернете. В то время изначально ECM исполь-зовала web-портал для представления информации в интранете. В статье [61, 15] определено три ключевых отличия ECM и WCM.

ECM — интегральный middleware36. ECM предполагает ин-фраструктуру, основанную на web-технологиях, и активно исполь-зует архитектурные решения EAI37 и SOA38.

ECM — независимые сервисы. ECM используется, чтобы управлять информацией, не связывая ее с источником или требуе-мым представлением. Например, когда мы представляем электрон-ный документ в виде бумажной копии или в виде pdf-файла, то в системе документооборота регистрируются различные документы:

36 middleware — межплатформенное ПО (ПО промежуточного слоя),

раб чет уни

приятия, объединение в одну систему «старых» и вновь создаваемых при-кла

направление разработки инструментальных средств ПО [62].

отающее поверх операционной системы и обеспечивающее за сфицированной поддержки функций прозрачную работу приложений в

неоднородной сетевой среде. Предоставляет услуги (API — application programming interface, программный интерфейс приложения) по объеди-нени ю частей приложения, распределенных по разным машинам сети [62].

37 Enterprise Application Integration — интеграция приложений пред-

дных систем предприятия [62]. 38 Service-oriented architecture: сервис-ориентированная архитектура,

современное

– 107 –

Page 108: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

электронный документ системы, бумажный документ и внешний документ — pdf-файл. По сути, это один и тот же документ только в трех различных формах, но система документооборота представ-ляет его как три различных документа. В EMC-системе информа-ция отделена от формы представления, поэтому в EMC это один документ в трех формах представления39. Функциональные воз-можности EMC обеспечиваются в виде сервисов, которые можно использовать из всех видов приложений. Преимущество концепции сервисов состоит в том, что для любой заданной функциональной возможности является доступным только один общий сервис, что уст емые

е данных и

Поэтому интеграция

ных (Capture), управление, хранение, долгосрочное хранение стати-чес

раняет избыточные, дорогостоящие и трудно поддерживапараллельные функции.

ECM — однородный репозиторий для всех типов информации. ECM используется как контент-хранилище (хранилищхранилище документов), которое объединяет информацию компа-нии в репозитории с однородной структурой. контента и Управление жизненным циклом информации (ILM — Information Lifecycle Management) играет важную роль в реализа-ции и использовании ECM.

В 2005 г. AIIM (Association for Information and Image Manage-ment) определил ECM следующим образом:

Управление информационными ресурсами предприятия (Enter-prise Content Management) — технологии, применяющие сбор дан-

кой информации (например, микрофильмов) и доставка контента и документов, связанных с организационными процессами.

В 2006 г. AIIM добавила еще один параграф к определению: ECM комплекс инструментов и стратегий, позволяющий управ-

лять неструктурированной информацией организации везде, где эта информация используется [61].

Термин «управление информационными ресурсами предпри-ятия» относится к решениям, нацеленным на обеспечение корпора-

39 Интересно, что закон о цифровой подписи не определяет разницу в

подтверждении данных документа и подтверждении электронного доку-мента [63].

– 108 –

Page 109: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

тивной информации, при этом обычно используются web-техно-логии. Решение предусматривает предоставление intranet-услуги для служащих (B2E40), а также включает портал предприятия, в кот

ой с хранилищем электронно-циф

та (сollaboration) или же ПО, обеспечиваю-щее

ором реализовано взаимодействие B2B41, B2G42, G2B43 и т. д. Данная категория включает большинство решений управления до-кументами (DM). Например, включаются средства автоматизации коллективной работы (groupware) и технологические процессы (workflow). Управление цифровыми ресурсами (DAM) также отно-сится к одной из форм ECM, связанн

рового контента. К сфере традиционного применения ECM можно отнести: • управление документами (Document management — DM); • совместная рабо и (или) автоматизирующее коллективную работу; • управление web-контентом (Web content management —

WCM), которое может включать web-портал; • управление записями (Records management — RM), которое

включает системы управления архивацией и формированием фай-лов для долгосрочных аудио-, видеохранилищ;

• технологический процесс (Workflow) — управление бизнес-процессами (Business process management — BPM).

Рассмотрим пять ведущих категорий, составляющих, согласно AIIM, Управление информационными ресурсами предприятия:

40 B2E, business-to-employee — «бизнес для персонала»: взаимодейст-

вие предприятия со своим персоналом; схема организации такого взаимо-дей

с привлечением интернет-ресурсов.

ствия и совместной деятельности сотрудников с использованием ин-формационных технологий.

41 B2B, business-to-business — «бизнес для бизнеса»: взаимодействие между предприятиями; схема организации такого взаимодействия, в т. ч.

42 B2G, business-to-government: «бизнес для правительства»: взаимо-действие между бизнесом и правительством, схема организации такого взаимодействия.

43 G2B, government-to-business: взаимодействие правительства с биз-несом общее обозначение методов электронного взаимодействия государ-ственных структур с компаниями.

– 109 –

Page 110: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

сбор данных (Capture), управление (Manage), хранение (Store), дол-говременное хранение статической информации (Preserve) и дос-тавка контента и документов (Deliver).

Сбор данных можно условно разделить на ручной режим и ав-томатизированный режим. Ручной режим включает все формы ин-формации, от бумажных документов до электронных документов, под

зиро-ван

tical Mark Recognition — OMR), штрих код (Barcode). Сбо

готовленных в офисных приложениях, электронную почту, формы, объекты мультимедийных средств информации, оцифро-ванную речь, видео- и микрофильм.

Автоматический или полуавтоматический сбор информации может использовать EDI44 или XML45 документы бизнес-приложе-ний и ERP-систем или же данные существующих специали

ных приложений. При сборе информации могут использоваться следующие тех-

нологии: оптическое распознавание символов (Optical character recognition — OCR), распознавание рукописных символов (Handprint Character Recognition — HCR), интеллектуальное распо-знавание символов (Intelligent Character Recognition — ICR), опти-ческое распознавание отметок на специально подготовленных бланках (Op

р информации может использовать следующие модули: ото-бражение документов, обработка форм (как электронных, так и бу-мажных), COLD/ERM — модуль для автоматической обработки структурированных входных данных, объединение данных из раз-личных источников, а также компонент, включающий индексиро-вания, классификации и категоризацию.

Категория менеджмент определяется для управления, обработ-ки и использования информации. Она объединяет базы данных для администрирования и выборки, а также системы разрешения дос-

44 Electronic Data Interchange — электронный обмен данными, набор

стандартов для пересылки финансовых документов по телекоммуникаци-онным сетям. Разработан ассоциацией DISA.

45 XML (Extensible Markup Language) — расширяемый язык разметки (гипертекста), язык XML предложенный W3C метаязык форматирования документов World-Wide Web, подмножество языка SGML.

– 110 –

Page 111: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

тупа. Эти два модуля предоставляют услуги для всех компонентов управления, таких как: Управление документами, Совместная ра-бота, Управление web-контентом, Управление записями и Техно-логический процесс/Управление бизнес-процессами. Объединяя различные компоненты управления, модули реализуют стандарти-зацию интерфейса и общий процесс обеспечения безопасности.

я термин «управление выходом».

зования и безопасность, по-

ем ECM-компонентам. Учитывая, что ECM включает управление всем контентом

предприятия, очень часто к управлению информационными ресур-сам

остранения знаний при повторном использо-

Категория хранилище используется для временного хранения информации. Хранилище — специальный фильтр для долговре-менного хранения статической информации (Preserve).

Компонент «хранилище» можно разделить на три категории: репозиторий, как место хранения; библиотека сервисов, как компо-нент администрирования репозитория; технологии хранения.

Долговременное хранение статической информации (Preser-ve) — компоненты ECM идентифицируют долгосрочное и безопас-ное хранение и резервирование статической, неизменяемой инфор-мации. Иногда этот компонент называют «электронным архивом». Решающий фактор для всех долгосрочных систем хранения — своевременное планирование и правильное выполнение работ по перемещению, содержание доступной информации в актуальном состоянии.

Компоненты доставки ECM используются для того, чтобы представить информацию от компонентов управления, хранения и долговременного хранения. Функциональные возможности катего-рии доставки известны также как «выход», поэтому для компонент доставки может использоватьсКомпоненты включают аудиовизуальную среду и три группы функций: технологий преобразования, технологий безопасности, распространение. Функции преобраскольку эти услуги принадлежат ПО промежуточного слоя, долж-ны быть доступны вс

и предприятия относят и Управление знаниями (Knowledge Management — KM). Управление знаниями включает комплекс ме-тодов, применяемых организациями для идентификации, создания, представления и распр

– 111 –

Page 112: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

вании, понимании и изучении. Эта дисциплина существует с 1995 г., но только при повсеместном внедрении информационных техноло-гий создана возможность реализовать управление знаниями как

и системы до-кум

р определяется многообразием концеп-

трудно вписать в русскоязычный термин СЭД. лил понятие доку-

х разработки и внедрения. егулирует процессы управления документами

коммерческих организаций, предназначае-мы вания. Следовательно, рег

ься и для автоматизированных систем. Документ должен от-веч ловой деятельности, к которой он относит-ся, етности.

меть метаданные, от- деятельности или быть постоянно с ними. В организации должна быть

ва документов: т не-

санкционированного использо-вания и со

единый процесс, пронизывающий все предприятие. Информацион-ные системы управления знаниями составляют многомиллиардный рынок программных продуктов.

Выше были рассмотрены различные технологии ентооборота, получившие широкое распространение в мире.

Многообразие аббревиатуций, технологий и историей создания тех или иных систем. Боль-шую часть систем Принятый ГОСТ Р ИСО15489-1 — 2007 опредементных систем46, а также регламент иДанный стандарт ргосударственных или

ми для внутреннего или внешнего пользоламент работы с документами, описанный в нем, может исполь-

зоватать потребностям деи использоваться в целях отчПомимо содержания, документ должен и

ражающие операции деловойсвязанным или объединенным утверждена политика управления документами, реализующая сле-дующие свойст

• аутентичность — документы должны быть защищены о дополнения, удаления, изменения,

крытия (засекречивания); • достоверность — полное и точное представление подтвер-

ждаемых операций;

46 Документная система; система управления документами (records

system): Информационная система, обеспечивающая сбор документов к (включение документов в систему), управление документами и доступ

ним в течение времени.

– 112 –

Page 113: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

• целостность — любые санкционированные примечания, до-бавления или удаления в документе следует четко обозначать и контролировать;

• пригодность для использования — документ можно локали-зовать, найти, воспроизвести и интерпретировать, причем при вос-про

экспертиза информации, подлежащей включению в доку-ментну

классификато-

е или

ирование процессов управления документами.

документах

ационных систем, использующих XML-доку зрения, оправдано по следующим при-чин

-документы — это не просто структурированные доку-менты. XML-документ состоит из вложенных элементов, некото-рые из которых имеют атрибуты и содержимое.

изведении он должен отражать связь с деловой деятельностью или операцией, в результате которой он был создан.

Жизненный цикл документов в документных системах состоит из следующих процессов:

• ю систему;

• назначение сроков хранения документов; • включение документов в систему; • регистрация; • классификация: – классификация деловой деятельности; – создание и ведение контрольных словарей и

ров; – индексирование; – кодирование документов; • хранение и обращение с документами; • управление доступом; • контроль и мониторинг; • отбор и передача документов на последующее хранени

уничтожение; • документ

Системы, основанные на XML-

Выделение информменты, с нашей точкиам. • XML

• XML является упрощенным подмножеством языка SGML.

– 113 –

Page 114: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

• Словари, основанные на XML (например, RDF, RSS, описаны, что

енять и проверять документы на основе зна-

- в

[8].

: 8 PM PackageName = «ex_choice_all»-->

dentifier = «MANIFEST_6525DD156E0B45199BEC889 EA9169793» xmln _v1p1» xmlns:adlcp = «httxm

scww.imsglobal.org/xsd/imsmd_v1p2

sd»>

MathML, XHTML, SVG), сами по себе формальнопозволяет программно измэтих словарей, не зная их семантики, т. е. не зная смысловогочения элементов.

На рис. 3.15 приведена выдержка из XML-документа курса, созданного в среде Lotus Workplace Collaboration Learning и сжатогостандарте SCORM 1.2, а на рис. 3.16 — пример из Википедии

<?xml version = «1.0»?> <!-- IBM Lotus Learning Management System Authoring Tool created

12/10/2003 4:46:5<manifest i

s = «http://www.imsglobal.org/xsd/imscpp://www.adlnet.org/xsd/adlcp_rootv1p2»

lns:ibmls = «http://www.ibm.com/learningspace» xmlns:imsmd = «http://www.imsglobal.org/xsd/imsmd_v1p2» xmlns:imsss = «http://www.imsglobal.org/xsd/imsss» xmlns:xsi = «http://www.w3.org/2001/XMLSchema-instance» xsi:schemaLocation = «http://www.imsglobal.org/xsd/im p_v1p1 imscp_v1p1p3.xsd http://w

dimsm _v1p2p2.xsd http://www.adlnet.org/xsd/adlcp_rootv1p2 adlcp_rootv1p2.xsd http://www.ibm.com/learningspace ibmls_0p1.xsd http:// _v0p8p2.xwww.imsglobal.org/xsd/imsss imsss

<metadata> <schema>ADL SCORM</schema> <schemaversion>1.2</schemaversion> <imsmd:lom> <imsmd:general> <ibmls:identifier>6525DD156E0B45199BEC889EA9169793</ibmls:

identifier>

Рис. 3.15. Фрагмент файла imsmanifest.xml, открытого в блокноте

– 114 –

Page 115: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

<?xml version = «1.0» encoding = «UTF-8»?> <recipe name = «хлеб» preptime = «5» cooktime = «180»>

</ingredient> >Дрожжи</ingredient>

ть тканью и оставить на один час в теплом помеще-ни

противень и поставить в духов-

<title>Простой хлеб</title> <ingredient amount = «3» unit = «стакан»>Мука<ingredient amount = «0.25» unit = «грамм»<ingredient amount = «1.5» unit = «стакан»>Теплая вода</ingredient> <ingredient amount = «1» unit = «чайная ложка»>Соль</ingredient> <Instructions> <step>Смешать все ингредиенты и тщательно замесить.</step> <step>Закрыи.</step>

<step>Замесить еще раз, положить на ку.</step> </Instructions>

</recipe>

Рис. 3.16. Фрагмент XML-документа

Рис. 3.15 демонстрирует описательную часть контента, выпол-

ознакомления можно обратиться к книге Д. Шеперд

риентированный) — это формат, одновре-мен

ненную в стандарте SCORM 1.2, а рис. 3.16 показывает возможности языка, используемые для структурирования контента. Для более подробного[64].

Достоинства XML: • XML (человеко-оно понятный и человеку и компьютеру; • XML поддерживает Юникод; • в формате XML могут быть описаны основные структуры

данных — такие, как записи, списки и деревья; • XML — это самодокументируемый формат, который описы-

вает структуру и имена полей так же, как и значения полей; • XML имеет строго определенный синтаксис и требования к

анализу, что позволяет ему оставаться простым, эффективным и непротиворечивым;

• XML широко используется для хранения и обработки доку-ментов;

• XML — формат, основанный на международных стандартах;

– 115 –

Page 116: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

• иерархическая структура XML подходит для описания прак-тически любых типов документов;

• XML представляет собой простой текст, свободный от ли-цензирования и каких-либо ограничений;

• XML не зависит от платформы; • XML является подмножеством SGML (используется с 1986 г.).

Уже накоплен большой опыт работы с языком и созданы специали-зированные приложения;

• XML не накладывает требований на расположение символов на строке.

Недостатки XML: • синтаксис XML избыточен; • размер XML-документа существенно больше бинарного

представления тех же данных (примерно в 10 раз); • размер XML-документа существенно больше, чем документ в

альтернативных текстовых форматах передачи данных, особенно в форматах данных, оптимизированных для конкретного случая ис-пользования;

• избыточность XML может повлиять на эффективность при-ложения, возрастает стоимость хранения, обработки и передачи данных;

• для большого количества задач не нужна вся мощь синтакси-са XML. Можно использовать значительно более простые и произ-водительные решения.

XML-документ дает возможность построить универсальный формат обмена данными между различными приложениями. Ис-пользование XML в качестве открытого стандарта обмена данными между приложениями позволяет эффективно использовать отдель-ны а-

оптимальной как с точки зрения функциональности, так и с точки зре

е модули различных производителей в рамках одной информционной системы, тем самым, достигая их комбинации, наиболее

ния финансовых вложений. Современные СУБД, такие как SQL Server, Oracle, DB2 поддерживают анализ, обработку и выгрузку XML-документов.

Язык XML дал возможность реализовать технологию взаимо-действия различных программ в разнородных средах на качествен-

– 116 –

Page 117: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

но-

-дур ную

пакетной форме, поддерживающей асинхронную и

новом уровне абстракции, используя веб-сервисы47. Уровень абстракции, на котором оперируют веб-сервисы, предполагает та-кие виды взаимодействия, как эмуляцию удаленного вызова проце

ы (RPC), асинхронный обмен сообщениями, однонаправленпередачу сообщений, широковещание и публикацию. Для пользо-вателя взаимодействие с веб-сервисами может проявляться в интер-активной или синхронную модели связи. Такое взаимодействие может привязы-ваться к любому типу базовой программной системы более низкого уровня (рис. 3.17).

Рис. 3.17. Взаимодействие систем при использовании веб-сервисов.

Треугольник Publish — Find — Bind (публикация — поиск — связывание) 47 Веб-служба, веб-сервис (англ. web service) — программная система,

идентифицируемая строкой URI, чьи публичные интерфейсы и привязки определены и описаны языком XML. Описание этой программной системы может быть найдено другими программными системами, которые могут взаимодействовать с ней согласно этому описанию посредством сообщений, осн ых с помощью интернет-протоколов. ованных на XML, и передаваем

– 117 –

Page 118: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

Стандарты веб-сервисов разрабатываются совместно такими компаниями, как IBM, Microsoft, Ariba и некоторыми другими, и обс

ля такой архитектуры необ-ход

язь с ними с помощью соответ-ств

жбами), посредством четко опреде-

уждаются комитетом World Wide Web Consortium (W3C). Веб-сервисы базируются на трех основных веб-стандартах: • SOAP (Simple Object Access Protocol) — на протоколе для

посылки сообщений по протоколу HTTP и другим Internet-протоколам;

• WSDL (Web Services Description Language) — на языке для описания программных интерфейсов веб-сервисов;

• UDDI (Universal Description, Discovery and Integration) — на стандарте для индексации веб-сервисов.

Web-сервисы, как правило, представляют собой независимые элементы с абстрактным бизнес-интерфейсом, который не зависит от лежащей в его основе реализации, а процесс разработки подра-зумевает комфортабельность и удобство доступа для клиентов. С точки зрения сервера нужно иметь возможность создать любой пользовательский web-сервис и представить WSDL (описание ме-таданных web-сервиса) клиенту, который сможет соответствую-щим образом подключиться к нему. Д

им унифицированный и простой механизм принятия и распространения исправлений и изменений. Провайдеры сервисов публикуют свои сервисы в UDDI, где инициаторы запросов могут найти эти сервисы и установить св

ующих механизмов. Веб-сервисы стали основой реализации сервис-ориентирован-

ной архитектуры. Сервис-ориентированная архитектура48 (Service-Oriented Architecture или SOA) — это компонентная модель, кото-рая связывает различные функциональные модули приложений, называемые сервисами (или слуленных интерфейсов и соглашений между этими сервисами. Ин-терфейсы не зависят от аппаратной платформы, операционной сис-темы или языка программирования, на котором реализован сервис. Такой подход позволяет создавать сервисы на различных системах,

48 http://ru.wikipedia.org/wiki/.

– 118 –

Page 119: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

которые взаимодействуют друг с другом единообразным и стан-дартным образом.

х, можно получить нов

ятого сервиса, кото-рые

tive

лек

SOA — это архитектура, которая позволяет компаниям раздро-бить монолитные приложения на меньшие компоненты или серви-сы, которые могут быть использованы для обеспечения или изме-нения функциональности. Преимущество в том, что, написав меньшую программу и собрав сервисы вместе, используя потоки документов, основанных на бизнес-процесса

ую функциональность быстрее, увеличить производительность разработки и сделать приложения более гибкими в реакции на из-менения бизнеса. Определение интерфейсов, не связанных с кон-кретной реализацией, определяет так называемую «слабую связь» (loose coupling) между сервисами. Достоинством слабосвязных сис-тем является быстрота адаптации бизнес-приложений в соответст-вии с изменением требований бизнес-окружения (изменение поли-тик, объем бизнеса, партнерство, репутация в индустрии и т. д.), а также возможность выдерживать эволюционные изменения в структуре и реализации каждого отдельно вз

составляют приложение в целом. Одним из достоинств языка XML является удивительная «биз-

нес-гибкость» XML, проявляющаяся в том, что XML постоянно находит новое практическое применение. Ниже перечислены неко-торые из приложений XML-языка.

Стандарт SDMX. Стандарт SDMX определяет форматы для об-мена агрегированных статистических данных и метаданных, необ-ходимых для понимания того, как эти данные структурированы. Основное внимание обращается на данные, представленные в виде временных рядов, но также поддерживаются и так называемые пе-рекрестные XML-форматы.

Язык разметки для прогнозного моделирования (predicmodeling mark-up language, сокр. PMML). PMML — это XML-диа-

т, который используется для описания статистических моделей и моделей data mining. Его главное преимущество заключается в том, что PMML-совместимые приложения позволяют легко обме-ниваться моделями данных с другими PMML-инструментами. Раз-

– 119 –

Page 120: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

работка и внедрение PMML осуществляется IT-консорциумом Data Mining Group.

Язык моделирования бизнес-процессов (Business Process Mode-ling Language, сокр. BPML) и спецификация для графического представления моделирования бизнес-процессов (Business Process Modeling Notation, сокр. BPMN), стандарты на основе XML-языка для поддержки и развития систем BPM (Business Process Manage-ment — управлен

RSS (Rea ростое при-обретение информации) — семейство XML-форматов, предназна-чен

ии новостей на новостных и подобных им сайтах, начиная от

совмести-

ие бизнес-процессами) [65].

lly Simple Syndication (RSS 2.x) — очень п

ных для описания лент новостей, анонсов статей, изменений в блоках и т. п. Информация из различных источников, представлен-ная в формате RSS, может быть собрана, обработана и представле-на пользователю в удобном для него виде специальными програм-мами-агрегаторами. RSS — это формат, предназначенный для публикац

таких ведущих новостных сайтов, как Wired, Slashdot, и кончая личными сетевыми дневниками (weblog-ами).

RDF (Resource Description Framework) — это разработанная кон-сорциумом W3C модель для описания ресурсов, в особенности — метаданных о ресурсах. RDF предназначен для представления зна-ний в распределенном мире. Стандарты, основанные на RDF, опи-сывают логические выводы, связывающие факты, и указывают, ка-ким образом находятся сами факты в огромной базе данных всех знаний, представленных в RDF. RDF подходит для работы с рас-пределенными знаниями потому, что приложения могут собирать воедино RDF-файлы, размещенные в интернете различными поль-зователями, и легко узнавать из собранного документа даже те но-вые вещи, которых не было ни в одной из его частей. В RDF это осуществляется благодаря двум предусмотренным процессам:

• объединяются документы, использующие общие языки; • допускается использование любого языка в каждом документе. Стандарт SCORM (Sharable Content Object Reference Model)

разработан для систем дистанционного обучения. Он содержит требования к организации учебного материала и всей системе дис-танционного обучения. SCORM позволяет обеспечить

– 120 –

Page 121: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

мость компонентов и возможность их многократного использова-ния: учебный материал представлен отдельными небольшими бло-ками, которые могут включаться в разные учебные курсы и ис-пользоваться системой дистанционного обучения независимо от того, кем, где и с помощью каких средств были созданы.

§ 2. äãÄëëàîàäÄñàü ëàëíÖå èé íàèì èêéñÖëëÄ ÄÇíéåÄíàáÄñàà

Наиболее естественный способ классификации информацион-ных систем основан на определении того бизнес-процесса, который автоматизируется в данной информационной системе. Разобранные выше системы документооборота, или поисковые системы, назы-ваются по типу процесса, который они предназначены автоматизи-ровать.

Требуется снова обратить внимание на различие программных и информационных систем. Допустим, существует программный комплекс «Бухгалтерский учет». Данный программный комплексреа

лизован с целью автоматизации функций, выполняемых бухгал-

тером, по обработке данных первичных бухгалтерских документов и составлению налоговых и бухгалтерских отчетов (назовем его «Бух»). Сам по себе «Бух» ничего не может сделать, ведь это про-грамма, которая позволяет внести данные, их обработать и сфор-мировать выходные отчеты. Для того чтобы данный программный комплекс работал в бизнес-процессе «Бухгалтерский учет», необ-ходимо выполнить целый ряд организационно-технических меро-приятий. По крайне мере, некоторый бухгалтер должен внести данные первичных бухгалтерских документов в комплекс «Бух», выполнить проверку и в конце отчетного периода сгенерировать отчеты. После того как комплекс «Бух» был внедрен на данном предприятии, а под этим мы будем понимать то, что генерация от-четов производится данным комплексом, можно говорить о суще-ствовании информационной системы бухгалтерского учета на дан-ном предприятии. Информационная система включает:

– 121 –

Page 122: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

• людей, работающих с комплексом «Бух», в соответствии с порядком выполнения бизнес-процесса (бухгалтеры, формирую-щи

омпьютеры, серверы, сетевые устройства и

щие обязательное представ- на твердом носителе,

информацион-ную

информационной ы

и »

или, правильнее сказать, функциональной части инфор-

е первичные данные; бухгалтер, который генерирует с помощью «Бух» отчеты; проверяющий и, может быть, формирующий требо-вания на изменение первичных данных, главный бухгалтер, ис-пользующий «Бух» для контроля выполнения данного бизнес-про-цесса, и т. д.);

• техническую систему, на которой развернута работа с «Бух» (пользовательские кт. д.);

• данные, хранимые в различных хранилищах «Бух» (в инфор-мационную систему могут быть включены и данные, хранимые вбумажных документах, более того, в соответствие с Российским налоговым законодательством, требуюление первичных бухгалтерских документовт. е. в бумажном виде, будет правильно включать в

систему архивы бумажных документов); • программный комплекс «Бух», установленный и настроен-

ный для данной организации; • документация, специфицирующая информационную систе-

му, включая спецификацию «Бух», должностные инструкции лиц, работающих в данной информационной системе и т. д.

Более подробно о составе систем смотрите в следующей главе.

Обратите внимание, что состав информационной системы поч-ти полностью определен спецификой выполнения данного бизнес-процесса на конкретном предприятии. Даже программный ком-плекс «Бух» может быть видоизменен для конкретного предпри-ятия (например, определенным образом сконфигурирован). Следо-вательно, количество информационных систем, использующих данный программный комплекс, будет пропорционально количест-ву предпр ятий, на которых используется «Бух (в пределе равно количеству предприятий). Поэтому при описании информацион-ных систем основное внимание уделяют программно-техническому комплексу

– 122 –

Page 123: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

мац

ном параграфе используется классификация по типу биз-нес -ш опи

кация не лишена недостатков. Во-пе -мац , при это

ионных систем. Именно так будет построено описание инфор-мационных систем.

В дан-процессов, предложенная компанией «Институт типовых ре

ений — Производство» [63]. Как следует из вышеприведенногосания, будут рассмотрены программные комплексы, на основе

которых строятся информационные системы. В учебном пособии не ставится задача дать исчерпывающий обзор различных инфор-мационных систем.

По типу бизнес-процессов, информационные системы, участ-вующие в автоматизации управления, можно разделить на сле-дующие группы:

• ИС стратегического маркетинга и управления предприятием; • финансовые ИС; • ИС управления производством; • ИС управления запасами и сбытом; • ИС поддержки жизненного цикла продукции. Внутри каждой группы информационные системы подразделя-

ются, как правило, в зависимости от реализованной концепции или алгоритма. Многие информационные системы реализуют концеп-ции, закрепленные в стандартах (ISO, APICS и др.), или же реали-зуют алгоритмы, широко используемые в бизнес-процессах, или выделены аналитическими и консалтинговыми агентствами (Gartner, IDC и др.).

Используемая классифирвых, многие информационные системы входят в состав инфорионной системы, которая интегрирует несколько функцийм интегрирование может затронуть информационные системы,

позиционированные в различных разделах. Например, Business in-telligence (BI) включают Data mining (DM) и OLAP (online analytical processing). Во-вторых, некоторые информационные системы не имеют четко разделенных границ. Например, в литературе часто считают, что разделение информационных систем на ERP (Enterprise Resource Planning) системы и MRP II (Manufacturing Resource Planning) системы имеет явно выраженный рекламный характер.

– 123 –

Page 124: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

Далее будет рассмотрена только часть вышеперечисленных систем. Более полное описание многообразия систем приводится в [64, 71].

ИС стратегического маркетинга и управления предприятием

К данным информационным системам относятся автоматизиро-ванные системы управления предприятием (АСУП). Данные ин-фор -

от деятельности предприятия некоторые

ть исключены из него. Например, системы элек-ЭД или EDMS) для учреждений,

.

мя как для производственных предприятий сис-тема документооборота может рассматриваться на уровне опера-тивного учета. К данным системам могут быть отнесены системы электронного документооборота (рассмотрены выше), Business Intelligence (рассмотрены выше), планирование ресурсов произво-дителя (MRPII — Manufacturing Resource Planning), планирование ресурсов предприятия (ERP — Enterprise Resource Planning), систе-мы процессно-ориентированного управления и системы учета за-трат по видам деятельности (ABM/С — Activity-Based Management/ Activity-Based Costing).

Системы процессно-ориентированного управления ABM/С

Методология АВM/C концентрируется на вопросах: • Какие производственные процессы происходят в компании и

как они задействованы в производстве продукции и услуг? • Какие факторы влияют на структуру и объем потребляемых

бизнес-процессами ресурсов? • Какова достигнутая ресурсоемкость и прибыльность объек-

тов затрат, и почему она такая, а не ниже или выше? • Есть ли у пр циал повышения

производитель рсов?

мационные системы охватывают бизнес-процессы всего предприятия. В зависимостиинформационные системы могут как рассматриваться на этом уровне, так и бытронного документооборота (Сосновной деятельностью которых является работа с документамиТакая система может рассматриваться на уровне управления пред-приятием, в то вре

оизводственного процесса потенности (отдачи) при тех же затратах ресу

– 124 –

Page 125: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

• Обратная задач нного процесса по-тен

а: есть ли у производствециал снижения ресурсоемкости, и если есть, то как лучше реор-

ганизовать бизнес-процессы, чтобы уменьшить ресурсоемкость объектов затрат без потери их качества?

• Сколько и какие ресурсы нужно иметь, чтобы обеспечить плановый выпуск продукции и услуг с требуемыми экономически-ми характеристиками?

Базовыми элементами в АВC/М являются (рис. 3.18) [67]: • модель ресурсов; • модель организационно-производственных процессов (биз-

нес-процессов); • модель объектов затрат; • модель (правила) разнесения затрат ресурсов по процессам; • модель (правила) разнесения интенсивностей процессов по

объектам затрат.

Рис. 3.18. Основные компоненты

процессно-ориентированного управления

– 125 –

Page 126: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

MRPII — ERP-системы

В отличие от нормативной финансовой бухгалтерской отчетно-сти, которая регламентирует состав аналитических показателей при учете издержек производства и себестоимости произведенной про-дукции, выполненных работ и услуг, в подходе ABC/M моделиро-вание предметных областей, а также правила разнесения затрат, не регламентировано жестко. Не требуется, чтобы указанные модели и правила разнесения строго соответствовали учетной политике компании. Более того, в зависимости от целей анализа могут быть использованы разные по уровню детализации и принципам разне-сения затрат модели. Например, на этапе предплановых расчетов целесообразно отойти от стандартных принципов распределения, предусмотренных учетной политикой, и использовать альтерна-тивные варианты, допускающие реинжиниринг действующих биз-нес-процессов.

Широкое применение получили методы управления производ-ством и организации сбыта товара, объединенные в стандарт MRP II (Manufacturing Resourse Planning), который был разработан в США и поддерживается американским обществом по контролю за производством и запасами — American Production and Inventory Control Society (APICS). Данный стандарт представляет широкий спектр проверенных на практике принципов, моделей и процедур управления и контроля, применение которых дает возможность повысить показатели экономической деятельности предприятия (рис. 3.19). MRP II Standart System содержит описание 16 групп функций системы [65]:

1. Sales and Operation Planning (Планирование продаж и произ-водства).

2. Demand Management (Управление спросом). 3. Master Production Scheduling (Составление плана производ

ства). 4. M альных

-

aterial Requirement Planning (Планирование материпотребностей).

5. Bill of Materials (Спецификации продуктов). 6. Inventory Transaction Subsystem (Управление складом).

– 126 –

Page 127: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

Бизнес-план

Главный

график работ

Стратегия,

маркетинг,

разработка,

диверсификация

Бюджет, прогноз,

уровень запасов,

заказ клиента

Ресурсы

План

продукции

Потребность в

материаллах

Расчет

объема работ

Количество / дата независимых

требований на изделие

Ведомость материалов, фонды,

незавершенное производство,

правила обработки, время

выполнения

График, маршрутизация,

рабочие места, мощности,

эффективность

Ресурсы

Релиз заказа на

производство и покупку

Мониторинг

исполнения

Приоритетное

управление

Доступные материалы,

доступные мощности,

производительность

поставщиков

Темпы, брак, время

Внутренние и внешние

приоритеты цехов, календарное

планированиеУправление

Выполнение и

управление

Детальное

планирование

Генеральное

планирование

MRP1

MRP2

Рис. 3.19. Схема функционирования MRP II системы [4]

7. Scheduled Receipts Subsystem (Плановые поставки). 8. Shop Flow Control (Управление на уровне производственно-

го цеха).

– 127 –

Page 128: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

9. Capacity Requirement Planning (Планирование производст-венных мощностей).

urse Planning (Планирование ресурсов рас-

интеграция всех основных

о, продажа и дистрибьюция, планирование, контроль выпол-

ых системах класса MRP II, можно отнести: оптимальное формирование материалов (сырья), полуфабрикатов (в т. ч оизводстве) и готовых изд

выми ресурсами, финансового ме-неджмента и управл на непрерыв-ную балансировку и дприятия посредст-вом

системах операции в ERP на отдельные функциональные модули: пла

10. Input/output control (Контроль входа/выхода). 11. Purchasing (Материально-техническое снабжение). 12. Distribution Reso

пределения). 13. Tooling Planning and Control (Планирование и контроль про-

изводственных операций). 14. Financial Planning (Управление финансами). 15. Simulation (Моделирование). 16. Performance Measurement (Оценка результатов деятельно-

сти). Цель построения систем MRP II:

процессов, реализуемых предприятием (снабжение, запасы, произ-водствнения плана, затраты, финансы, основные средства и т. д.). К зада-чам, решаемым в информационн

потока. находящихся в пр

елий. Концепция ERP (Enterprise Resource Planning) была предложена

компанией GartnerGroup в начале 1990-х гг. и на сегодняшний день уже доказала свою эффективность.

ERP49 — организационная стратегия интеграции производства и операций управления трудо

ения активами, ориентированная оптимизацию ресурсов пре

специализированного интегрированного пакета прикладного программного обеспечения, обеспечивающего общую модель дан-ных и процессов для всех сфер деятельности. Так же, как и в MRP-

нирование ресурсов (финансовых, людских, материальных), оперативный контроль выполнения планов (снабжения, сбыта),

49 http://ru.wikipedia.org/wiki/ERP.

– 128 –

Page 129: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

контроль выполнения договоров, анализ результатов хозяйствен-ной деятельности.

Основные отличия ERP от MRP заключаются в следующем: • ERP-системы охватывают все процессы предприятии (MRP —

только производство). • ERP включают механизмы управления компаниями, функ-

ционирующими в различных часовых поясах, в различных странах, в различных системах бухгалтерского учета и отчетности.

• ERP строится как базисная платформа, на основе которой выполняется интеграция с другими приложениями.

50

ы финансово-экономи-

Бухгалтерского учета

• В ERP-системах большое внимание уделяется средствам ППР (поддержки принятия решений), а также средствам интегра-ции с хранилищами данных.

• В ERP больше внимания уделяется финансовым подсисте-мам.

• Системы ERP ориентированы на управление географически распределенным предприятием.

Финансовые ИС

К финансовым информационным системам относятся все сис-темы бухгалтерского учета. На сегодняшний день, наверное, это самые продаваемые (по числу продаж) в России информационные системы. Кроме того, к данному виду систем относятся информа-ционные системы бюджетирования и системческого анализа предприятий.

ИС

Бухгалтерский учет представляет собой упорядоченную систе-му сбора, регистрации и обобщения информации в денежном вы-ражении об имуществе, обязательствах организаций и их движении

50 Финансовый учет — процесс подготовки учетной информации, ко-

торая используется внутренними и внешними пользователями. Финансо-вый учет основывается на общепринятых международных стандартах и принципах. Правила ведения и порядок составления бухгалтерской (фи-нансовой) отчетности регламентируются государством [4].

– 129 –

Page 130: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

путем сплошного, непрерывного и документального учета всех хо-зяйственных операций.

Объектами бухгалтерского учета являются имущество органи-заций, их обязательства и хозяйственные операции, осуществляе-мые организациями в процессе их деятельности.

ся формирова-дприятия и, в ча-

внешней отчетности, в т. ч. алоговым кодексом Рос-

ых систем могут включаться кого учета, учет работы с

бан

риятия и различных его

ко инструменты корпоративного управления. На-личие каких-то бюджетов еще не означает, что ими можно эффек-тивно поль ре управ-лен

Основной задачей бухгалтерского учета являетние достоверной информации о деятельности престности, формирование внутренней ии в налоговые органы, в соответствии с Нсийской Федерации.

оннВ состав данных информацимодули расчета заработной платы, складс

ками и т. д., в которых проводится первичный учет имущества организаций, начислений и отчислений на заработную плату, дви-жения финансовых средств через банк и т. д. Современные бухгал-терские информационные системы предполагают интеграцию мо-дулей, автоматизирующие различные аспекты бухгалтерского учета, в то же время допускается их автономное использование.

ИС бюджетирования

Бюджеты — это планы деятельности предп структурных единиц, выраженные в финансовых показателях.

Основное назначение бюджетов — поддержка решения трех управленческих задач:

• прогноз финансового состояния; • сравнительный анализ запланированных и, фактически, по-

лученных результатов; • оценка и анализ выявленных отклонений. Бюджеты толь

зоваться, что они реально «работают» в контуия предприятием. Бюджетирование — это технология управления бизнесом на

всех уровнях компании, обеспечивающая достижение ее стратеги-ческих целей с помощью бюджетов, на основе сбалансированных финансовых показателей. Информационная система бюджетирова-

– 130 –

Page 131: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

ния обеспечивает данные технологии соответствующими прогно-зами, формируемыми в виде управленческих отчетов. Так, напри-мер, система «Бюджетирование 2.0» компании ЗАО «КИС» (http:// ww

ионного обмена. ю

Некоторые предприятия управление (ABM ent/Activity-Ba-sed

й, которые уже адаптировали процессное управление ор-ганизацией [70].

Систе ализа

Наиболее известные методы: функционально-стоимостный анализ (ФСА ng), метод экономической до-

w.cis2000.ru/) обеспечивает среднесрочное, краткосрочное и оперативное планирования:

• расчет бюджета по ограниченным ресурсам; • любой интервал и горизонт планирования; • бюджет группы предприятий; • территориально удаленная работа; • конфигуратор бизнес-модели; • редактор печатных форм; • шлюзы информацМожно было бы привести в качестве примера реализаци

бюджетирования в «1С: Предприятие 8.0», «Галактика» и т. д. В некоторых ERP-системах бюджетирование реализуется с помо-щью систем Business Intelligence.

внедряют процессно-ориентированное/ABC — Activity-Based Managem

Costing), а в связи с тем, что обычные методы бюджетирования плохо работают, применяется процессно-ориентированное бюдже-тирование (ABB — Activity-Based Budgeting).

Принципиальное отличие процессно-ориентированного бюдже-тирования от традиционного, заключается в планировании ресур-сов, исходя из перечня выполняемых работ и их объемов. Послед-ние определяются для каждой работы отдельно. Процессно-ориентированное бюджетирование — следующий логический шаг на пути внедрения нового управленческого инструментария для компани

мы финансово-экономического ан

Системы финансово-экономического анализа подразделяются в зависимости от алгоритмов, применяемых в данных системах.

, ABC — Activity Based Costi

– 131 –

Page 132: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

бавленной стоимости (EVA — economical value added) и концепция стратегического управления издержками (SCM — Strategic Cost Management).

Так, например, функционально-стоимостной анализ51 позволяет выполнить следующие виды работ:

• общий анализ себестоимости бизнес-процессов на предприятии (маркетинг, производство продукции и оказание услуг, сбыт, ме-неджмент качества, техническое и гарантийное обслуживание и др.);

• функциональный анализ деятельности предприятия, обосно-вание выполняемых структурными подразделениями предприятий функций с целью обеспечения выпуска высокого качества продук-ции и оказания услуг;

•• ия

затрат в прои порядочения фун

ляется в зави-форма-

(САПР), системы поддержки жки подготов-ых технологий

nagement), автома- технологическим процессом

рим только некоторые

— САПР

Системы ав САПР) — об-щи

определение и анализ основных и дополнительных затрат; сравнительный анализ альтернативных вариантов снижен

зводстве, сбыте и управлении за счет укций структурных подразделений предприятия.

ИС-управление производством

Выделение ИС в определенные группы осуществсимости от того, какой вид производства поддерживают инционные системы. Можно выделить, например, системы автомати-зированного проектирования выполнения программных проектов, системы поддерки производства, системы поддержки информационнна предприятии (системы ITSM — IT service maтизированные системы управления(АСУТП) и т. д. В данной главе мы рассмотиз них.

Системы автоматизированного проектирования(CAD — Computer-Aided Design)

томатизированного проектирования (й термин для обозначения всех аспектов проектирования с ис-

51 http://ru.wikipedia.org/wiki/.

– 132 –

Page 133: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

пользованием средств вычислительной техники. Обычно охватыва-ет создание геометрических моделей изделия (твердотельных, трехмерных, составных), а также генерацию чертежей изделия и их сопровождение. Следует отметить, что отечественный термин «САПР» по отношению к промышленным системам имеет более широкое толкование, чем CAD. Он включает в себя как CAD, так и

odesk,

информационных граммное обеспечение для архи-

ft).

С

аршрутов изготовления изделий;

CAM, а иногда и элементы CAE (см. ниже). К наиболее известным CAD-системам можно отнести AutoCAD (САПР фирмы Autреализующая решения для различных отраслей промышленности, начиная с машиностроительных проектов до геосистем — ГИС), ArchiCAD (протектурного проектирования от компании Graphiso

истемы автоматизированной подготовки производства (CAM — Computer Aided Manufacturing)

К системам автоматизированной подготовки производства (ав-томатизированные системы технологической подготовки произ-водства — АСТПП) относятся программные комплексы, позво-ляющие автоматизировать следующие мероприятия:

• обеспечение технологичности конструкции изделия; • планирование и управление процессом технологической под-

готовки производства изделия; • разработка м• проектирование технологических процессов; • проектирование оснастки и инструмента; • разработка ЧПУ-программ; • нормирование изготовления изделия; • выпуск технологической документации; • расчет производственных мощностей.

Системы автоматизированного инженерного анализа(CAE — Computer-Aided Engineering)

Общий термин для обозначения информационных технологий при поддержке инженерных задач анализа, моделирования, проек-тирования, изготовления, планирования, диагностики и ремонта.

– 133 –

Page 134: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

Например, CAE используется для анализа отказоустойчивости де-талей и агрегата. При этом охватываются вопросы моделирования, проверки и оптимизации изделий. В будущем, CAE-системы будут главными поставщиками информации, чтобы помочь в поддержке команде проекта в принятии решения. CAE охватывают следую-щие области:

• анализ напр ц (использу-ется анализ с исп ентов);

• анализ те ков (вычисли-тел

как правило, разную идеологию, разные операционные системы и форматы данных.

Концепция CIM отличается от концепции гибких производст-венных систем (ГПС), рассмотренных ранее. ГПС — управляемая средствами вычислительной техники совокупность технологиче-ского оборудования [47]. Следовательно, ГПС — автоматическое производство, в то время, как для CIM не требуется использования полной автоматизации. Тем не менее, модули, определенные в ГПС по функциональному составу, аналогичны модулям CIM.

ИС-управления снабжением, запасами и сбытом

Информационные системы, отнесенные к этой группе, класси-фицируются в зависимости от алгоритмов, используемых для ато

яжения деталей и сборочных единиользованием метода конечных элемпловых и гидродинамических пото

ьная гидродинамика и тепло-, массоперенос); • кинематические расчеты; • моделирование механических элементов.

Компьютеризированное интегрированное производство (CIM — Computer Integrated Manufacturing)

CIM — использование информационных технологий для пол-ного цикла производства предприятия, включая все филиалы и подразделения. Интегрирует в себя управление планированием, проектированием, производством, управление качеством, контроль и регулирование технологических процессов. В CIM-системе ин-тегрируются различные программные продукты, имеющие,

в-матизации данных бизнес-процессов. В качестве примера можно

– 134 –

Page 135: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

при Pond-Draining

мальный размер заказа (EOQ — Economic — Supply

anagement) и т. д.

t)

в нужное место, в нужное время, с наименьшими издержкам

SCM н , которые взаимод

о

вести: управление пополнением запасов (PDS —System), статистическое управление запасами (SIC — Statistical inventory control), оптиorder quantity), управление цепочками поставок (SCMChain Management), управление взаимоотношениями с клиентами (CRM — Customer Relationships M

Управление цепочками поставок(SCM — Supply Chain Managemen

SCM подразумевает новую стратегию компании, которая пред-полагает формирование оптимальной сети сбыта, обеспечивающую доставку товара

и. аправлен на создание оптимальных каналов

ействуют с дистрибуторами и конечными потребителями (рис. 3.20). SCM изучает спрос и предлагает на рынок товары, ко-торые оптимально отвечают потребностям покупателей; быстро обрабатывает заказы и запросы; планирует поставки таким обра-зом, чтобы товар «не залеживался» или, наоборот, не возникалнеудовлетворенного спроса на товар; создает долгосрочные отно-шения с дистрибьюторами и постоянно расширяет сеть сбыта.

Поставщик Предприятие Клиенты

Стратегическое планирование

Планирование цепочек поставок

Планирование производства

Совместное планирование

поставок

Совместное планирование

спроса

Диспетчеризация заданий

Рис. 3.20. Управление цепочками поставок (Supply Chain Management)

– 135 –

Page 136: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

Можно выделить 7 основных принципов SCM: 1) производить сегментирование потребителей на основе по-

требности в сервисах; 2) ори 52

3) вни изводить пла

ment)

ентировать логистическую сеть на клиента; мательно следить за рыночным спросом и про

нирование, опираясь на них; 4) изучать спрос потребителей; 5) стратегически планировать поставки; 6) разрабатывать стратегию цепи снабжения; 7) использовать методы привлечения (захвата) новых каналов

распределения.

Управление взаимоотношениями с клиентами (CRM — Customer Relationships Manage

CRM — это стратегия компании, касательно взаимодействия с клиентами во всех организационных аспектах — рекламе, продаже, доставке и обслуживании клиентов, дизайне и производстве новых продуктов, выставлении счетов и т. п. Это стратегия, основанная:

• на наличии единого хранилища информации и системы, в ко-торые мгновенно помещаются и из которых немедленно доступны все сведения о всех случаях взаимодействия с клиентами;

• синхронизированности управления множественными кана-лами взаимодействия, т. е. существуют организационные процеду-ры, которые регламентируют использование этой системы и ин-формации в каждом подразделении компании;

• постоянном анализе собранной информации о клиентах и принятии соответствующих организационных решений — напри-мер, приоритизации клиентов на основе их значимости для компа-нии, выработке индивидуального подхода к клиентам в соответст-вии с их специфическими потребностями и запросами.

52 Логистика — теория и практика управления материальными и ин-

формационными потоками в процессе товародвижения [4].

– 136 –

Page 137: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

CRM — концептуально новый подход к взаимодействию с кли-ентом. Данный модуль интегрирован, как правило, в системах ERP II53 (Enterprise Resource & Relationship Processing)

ИС-поддержки жизненного цикла продукции

В данную группу попало всего две концепции CALS (Continuous Acqusition and Life cycle Support — непрерывные по-ставки и информационная поддержка жизненного цикла продук-ции) и PLM (Product Lifecycle Management — управление жизнен-ным циклом изделия). В то же время эти концепции охватывают весь жизненный цикл продукции.

CALS инициирован в 1980-х гг. Министерством обороны США, которое стояло перед рядом проблем, связанных со снабжением, производством и поддержкой систем вооружения.

CALS-технологии — современный подход к проектированию и производству высокотехнологичной и наукоемкой продукции, за-ключающийся в использовании компьютерной техники и совре-менных информационных технологиях на всех стадиях жизненного цикла изделия. В соответствии с требованиями системы междуна-родных стандартов CALS обеспечивает единый подход управления процессами и взаимодействием всех участников жизненного цикла (заказчиков, поставщиков/производителей, эксплуатационного и ремонтного персонала) и регламентирует правила электронного обмена данными между ними.

Отражением концепции CALS-технологии являются стандарты, регламентирующие правила представления информации и инфор-мационного взаимодействия участников жизненного цикла изде-лия. К ним относится группа международных стандартов ISO 10303 (STEP) (отечественный аналог ГОСТ Р ИСО 10303), регла-ментирующая компьютерное представление и обмен данных о про-дукте. Цель данного стандарта — разработать механизм описания данны -кретной

х о продукте на всех стадиях его ЖЦ, не зависящий от кон системы.

53 ERP II — управление ресурсами и взаимоотношениями предпри

II, как и ERP, предложен Gartner Group-

ятия. Термин ERP .

– 137 –

Page 138: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

Предметом CALS являются методы и средства взаимодействия разных автоматизированных систем (АС) и их подсистем с учетом

омышленной

лии

всех видов их обеспечения, поэтому CALS — это методология соз-дания единого информационного пространства прпродукции, обеспечивающего взаимодействие всех промышленных АС. В литературе используется термин PLM (Product Lifecycle Management), который является синонимом CALS.

Под PLM понимают процесс управления информацией об изде- на протяжении всего его жизненного цикла (рис. 3.21).

Рис. 3.21. Этапы жизненного цикла промышленной продукции

и используемые автоматизированные системы [73]: PDM — Product Data Management система управления данными изделия;

MES — Manufacturing Execution Systems системы управления производст-вом; IETM — Interactive Electronic Technical Manual — интерактивные

электронные технические руководства

– 138 –

Page 139: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

Отметим, что чную интерпре-тацию:

RM/SCM (рис. 3.20);

оизводства изделий, что практически совпадает с оп-

других признаков.

Общепринятой классификации ИС до сих пор не существует, поэтому их можно классифицировать по разным признакам, что вызвало существование нескольких различных классификаций ИС. Задача классификации — создать некие удобные образы, позво-ляющие, например, при выборе систем ограничиться определен-ным классом или типом. В зависимости от признаков, положенных в основу классификации, могут быть выделены различные подходы к построению классификационных моделей.

Классификации всегда относительны. Цель любой классифика-ции — ограничить выбор подходов к отображению системы и дать рекомендации по выбору методов.

понятие PLM-систем имеет разли

• совокупность интегрированных автоматизированных систем CAE/CAD/CAM/PDM54 и ERP/C

• совокупность средств информационной поддержки проекти-рования и прределением понятия CALS.

Характерная особенность PLM — возможность поддержкивзаимодействия различных автоматизированных систем многих предприятий. Технологии PLM являются интегрирующим инфор-мационным пространством, в котором функционируют САПР, ERP, PDM, SCM, CRM и другие автоматизированные системы многих предприятий.

êÖáûåÖ

Информационные системы могут значительно различаться по типам объектов, характером и объемом решаемых задач и рядом

54 PDM (product data management) — управление данными об изделии.

– 139 –

Page 140: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

Çéèêéëõ Ñãü ëÄåéèêéÇÖêäà

1. Какие критерии вы могли бы предложить для классифика-ции информационных систем?

2. Как вы считаете, для чего требуется классифицировать ин-формацию?

3. Что может отличить документальные системы от фактогра-фических?

4. Какие функции требуются для поисковых машин? 5. Чем классические системы поиска информации отличаются

от поисковых систем интернета? 6. Наличие каких функций у информационных систем дает

возможность отнести ее к фактографическим системам? 7. Чем отличается фактографический поиск в ИПС от поиска

данных в фактографических системах? 8. Что отличает документы текстовые от XML-документов? 9. Что отличает web-сервисы от обычных функций системы? 10. Как вы считаете, правомерна ли классификация систем на до-

кументальные, фактографические и системы с XML-документами?

– 140 –

Page 141: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

É·‚‡ 4. ëéëíÄÇ à ëíêìäíìêÄ àë

Материал этой главы основан на едином комплексе стандартов автоматизированных систем (ЕКС АС) и ЕСПД (Единая система проектной документации) [19, 48, 74-92].

Стандартизация — это деятельность, направленная на разра-ботку и установление требований, норм, правил, характеристик как обязательных для выполнения, так и рекомендуемых, обеспечи-вающая право потребителя на приобретение товаров надлежащего качества, а также право на безопасность и комфортность труда. Цел

ультатами деятельности по

чше подго-тов

тре

и обеспечения совместимости с другими системами, а также для применения повторно используе-

ь стандартизации — достижение оптимальной степени упоря-дочения в той или иной области посредством широкого и много-кратного использования установленных положений, требований, норм для решения реально существующих, планируемых или по-тенциальных задач. Основными резстандартизации должны быть повышение степени соответствия продукта (услуги), процессов их функционального назначения, устранение технических барьеров в международном товарообмене, содействие научно-техническому прогрессу и сотрудничеству в различных областях.

Стандарты удешевляют совокупную стоимость владения сис-темами, облегчают возможность расширения, модификации и мас-штабирования систем. Следование стандартам позволяет произво-дителям техники наладить не мелкосерийное, а массовое производство продукции, повысить ее качество. Использование стандартов помогает снизить квалификационные требования к пер-соналу, сформировать четкие программы обучения, лу

ить персонал к решению практических задач. Итак, стандарты нужны: потребителям информационных сис-

тем (ИС) — для выбора техники, для упорядочения своей деятель-ности и взаимодействия с поставщиками; поставщикам продуктов и услуг — для снижения себестоимости продукции и следования

бованиям рынка; разработчикам и эксплуатационникам ИС — для повышения качества решений

– 141 –

Page 142: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

мы

культуры орг

ьной деятельности попадают под дей

продавца, испол-нит

х систем сертификации является, нап

Федеральное агентство по строительству и

вую

х решений, для снижения трудоемкости и себестоимости работ, повышения их качества.

Кроме того, стандарты — это знания и опыт профессионалов, которые помогают начинающим специалистам выбрать пути реше-ний насущных задач. С другой стороны, стандарты содержат пра-вила и рекомендации, исполнение которых возможно только тогда, когда по крайней мере эти правила и рекомендации знаешь и по-нимаешь. Выполнение стандартов требует определенной

анизации, а также дисциплины ее сотрудников. Дивиденды, кото-рые может принести применение стандартов, требует довольно кро-потливой работы, направленной на поддержание их использования.

Различные виды профессионалствия Федерального закона «О лицензировании отдельных ви-

дов деятельности» № 128-ФЗ. Кроме того, существуют системы сертификации. В нашей стране действует более 100 систем серти-фикации, 20 из них — обязательные.

Сертификация — процедура подтверждения соответствия, по-средством которой независимая от изготовителя (

еля) и потребителя (покупателя) организация удостоверяет в письменной форме, что продукция соответствует установленным требованиям. Лицензия — это право (разрешение) на осуществле-ние какой-либо деятельности. Сертификат на услуги — документ, подтверждающий, что качество услуг соответствует определенным требованиям. Одной из основны

ример, ГОСТ Р, поднадзорная ГосСтандарту и ГосСтрою, пере-именованных в Федеральное агентство по техническому регулиро-ванию и метрологии и в жилищно-коммунальному хозяйству, соответственно.

Теперь понятно, что строительство без соблюдения соответст-щих стандартов и нормативных актов невозможно, как и боль-

шинство видов инженерной деятельности в различных отраслях. В отличие от строительных норм и правил, все стандарты в области информационных технологий имеют рекомендательный характер.

Среди всего многообразия принято выделять следующие ос-новные типы стандартов:

– 142 –

Page 143: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

Корпоративные стандарты разрабатываются крупными фир-мами (корпорациями) с целью повышения качества своей продук-ции. Такие стандарты разрабатываются на основе собственного опыта и с учетом требований мировых стандартов. Корпоративные стандарты не сертифицируются, но являются обязательными для при

Разрабатываются, как правило, спе

дартов. Имеют сугубо ре-ком

чество стандартов в области инфор-мац

система) распространялись на АСУ (автоматизированные системы управления), АСУП (автоматизированные системы управления пре

менения внутри корпорации. В условиях рыночной конкурен-ции могут иметь закрытый характер. В ИТ-сфере известны стан-дарты, разработанные Microsoft, Intel, IBM.

Отраслевые стандарты действуют в пределах организаций некоторой отрасли. Например, строительные нормы и правила раз-рабатываются с учетом требований мирового опыта и специфики отрасли, подлежат сертификации.

Государственные стандарты (ГОСТы) принимаются государ-ственными органами, имеют силу закона. Разрабатываются с уче-том мирового опыта или на основе отраслевых стандартов. Могут иметь как рекомендательный, так и обязательный характер (стан-дарты безопасности). Для сертификации создаются государствен-ные или лицензированные органы сертификации.

Международные стандарты. циальными международными организациями на основе мирово-

го опыта и лучших корпоративных станендательный характер. Право сертификации получают органи-

зации (государственные и частные), прошедшие лицензирование в международных организациях.

Существует большое колиионных технологий, которые могут быть применимы для ин-

формационных систем. Выше говорилось о том, что в данной главе материал будет ос-

нован на двух видах стандартов ЕКС АС и ЕСПД. ЕКС АС представляет на сегодняшний день набор стандартов,

входящих в ГОСТ 24 и ГОСТ 34. Первые стандарты в области автоматизированных систем (24-я

дприятием), АСУ ТП (автоматизированные системы управления технологическими процессами) и другие организационно-экономи-

– 143 –

Page 144: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

ческие системы. Кро сы стандартов (система 23501); распространяющ ы автоматизирован-ног

14-й системы), распространяющиеся на автоматизированные

ения стандартов на АСУ, САПР, АСУ ТП,

ии, однако

бот, различия по обозначению,

азработки единого комплекса стандартов (34-я серия)

нные системы различного назначения:

, АСУТП, АСУГПС (авто-

ованные системы и комплексы),

дартов серии 24 (ГОСТ 24) была за-

ОСТ 19) носят название ЕСПД. Единая

ения и обращения программ и

ь внимание, что комплекс ГОСТ 34 рас-

ляются подмножеством АС), а комплекс ГОСТ 19 —

разработкой и внедрением ПО, как составной части ИС.

ме этого, существовали комплекиеся на систем

о проектирования (САПР) и системы стандартов (четвертая группасистемы технологической подготовки производства (АСУТПП).

Практика применАСТПП показала, что в них используется одинаковый понятийный аппарат, имеется много общих объектов стандартизацтребования стандартов не согласованы между собой, имеются раз-личия по составу и содержанию расоставу, содержанию и оформлению документов и пр. Было приня-то решение ри руководящих документов, которые должны были распростра-няться на автоматизироваАСНИ (автоматизированные системы научной информации), САПР, ОАСУ (отраслевые АСУ), АСУПматизированные системы управления гибких производственных систем), АСК (автоматизирАСТПП, включая их интеграцию.

В связи с этим, часть станменена стандартом серии 34 (ГОСТ 34).

Стандарты 19 группы (Гсистема программной документации устанавливает взаимоувязан-ные правила разработки, оформлпрограммной документации.

Необходимо обратитпространяется на автоматизированные системы (информационные системы явтолько на часть объектов автоматизированных систем (программы и их документации). То есть ГОСТ 34 регламентирует системный подход55 при создании ИС, а ГОСТ 19 определяет комплекс работ, связанных с

нентных систем, объектов, 55 Системный подход — совокупность методов и средств исследова-

ния сложных, многоуровневых и многокомпо

– 144 –

Page 145: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

§ 1. ëíÄçÑÄêíõ çÄ Äë

Ниже приведен неполный перечень стандартов в области АС и АСУ.

• ГОСТ 24.103-84 Автоматизированные системы управления. Общие положения.

• ГОСТ 24.104-85 Автоматизированные системы управления. Общие требования (раздел 3 заменен ГОСТ 34.603-92).

• ГОСТ 24.202-80 Требования к содержанию документа Тех-нико-экономическое обоснование.

• ГОСТ 24.203-80 Требования к содержанию общесистемных документов.

• ГОСТ 24.204-80 Требования к содержанию документа Опи-сание постановки задачи.

• ГОСТ 24.205-80 Требования к содержанию документов по информационному обес

печению. • ГОСТ 24.206-80 Требования к содержанию документов по

техническому обеспечению. • ГОСТ 24.207-80 Требования к содержанию документов по

программному обеспечению. • ГОСТ 24.208-80 Требования к содержанию документов ста-

дии Ввод в эксплуатацию. • ГОСТ 24.209-80 Требования к содержанию документов по

организационному обеспечению. • ГОСТ 24.210-82 Требования к содержанию документов по

функциональной части. ГОСТ 24.703-85 Типовые проектные решения. Осно• вные по-

ложения. • ГОСТ 34.003-90 Информационная технология. Комплекс

стандартов на автоматизированные системы. Автоматизированные системы. Термины и определения (взамен ГОСТ 24.003-84, ГОСТ 22487-77).

процессов, опирающихся на комплексный подход, учет взаимосвязей и взаимодействий между элементами системы.

– 145 –

Page 146: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

• ГОСТ 34.201-89 Информационная технология. Комплекс стандартов на автоматизированные системы. Виды, комплектность и обозначения документов при создании автоматизированных сис-тем

с-тем

ционных про-

(взамен ГОСТ 24.101-80, ГОСТ 24.102-80). • ГОСТ 34.601-90 Информационная технология. Комплекс стан-

дартов на автоматизированные системы. Автоматизированные сиы. Стадии создания (взамен ГОСТ 24.601-86, ГОСТ 24.602-86). • ГОСТ 34.602-89 Информационная технология. Комплекс стан-

дартов на автоматизированные системы. Техническое задание на создание автоматизированной системы (взамен ГОСТ 24.201-85).

• ГОСТ 34.603-92 Информационная технология. Виды испыта-ний автоматизированных систем (взамен ГОСТ 24.104-85 в части разд. 3).

Кроме того, на АС и АСУ распространяются различные руко-водящие документы (РД) и рекомендации (Р), некоторые из кото-рых приведены ниже.

• РД 50-34.698-90 «Методические указания. Информационная технология. Комплекс стандартов и руководящих документов на автоматизированные системы. Автоматизированные системы тре-бования к содержанию документов».

• РД 50-682-89 Информационная технология. Комплекс стан-дартов и руководящих документов на автоматизированные систе-мы. Общие положения.

• РД 50-680-88 Автоматизированные системы. Основные по-ложения.

• Р 50-34.126-92. Информационная технология. Правила про-ведения работ при создании автоматизированных систем.

В стандартах определено несколько важных положений, отра-жающих особенности АС как объекта стандартизации, например: «в общем А з случае С состоит и программно-технических (ПТК), программно-методических (ПМК) комплексов и отдельных компо-нентов организационного, технического, программного и инфор-мационного обеспечений». Разделение понятий ПТК и АС закреп-ляло принцип, по которому АС есть не «ИС с БД», но:

– «организационно-техническая система, обеспечивающая вы-работку решений на основе автоматизации информа

– 146 –

Page 147: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

цес-680-88),

что

о-гию

и вводе сис

раммные, эргоно-мические [91]. Данный перечень может быть расширен. Например, в ГОСТ 3 ие.

Организационное пность документов, уст

ировании АС.

сов в различных сферах деятельности (управление, проектиро-вание, производство и т. д.) или их сочетаниях» (по РД 50

особенно актуально в аспектах бизнес-реинжиниринга; – «система, состоящая из персонала и комплекса средств автома-

тизации его деятельности, реализующая информационную технол выполнения установленных функций» (по ГОСТ 34.003-90). Эти определения указывают на то, что АС — это, в первую

очередь, персонал, принимающий решения и выполняющий другие управляющие действия, поддержанный организационно-техниче-ски ми средствами. ГОСТ 34 выделяет в качестве компонента АС пользователя автоматизированной системой — «лицо, участвую-щее в функционировании АС или использующее результаты ее функционирования». Как основные компоненты можно выделить программно-технический комплекс автоматизированной системы иее обеспечение. ПТК представляет собой совокупность средств вы-числительной техники, программного обеспечения и средств соз-дания и заполнения машинной информационной базы пр

темы в действие достаточных для выполнения одной или более задач АС. В литературе часто определяют ПТК как набор компо-нентов, реализующий функциональную часть автоматизированной системы. Определены различные виды обеспечения системы: орга-низационные, методические, технические, математические, лин-гвистические, информационные, правовые, прог

4.602-89 определяется метрологическое обеспеченобеспечение АС: Совоку

анавливающих организационную структуру, права и обязанности пользователей и эксплуатационного персонала АС в условиях функ-ционирования, проверки и обеспечения работоспособности АС.

Методическое обеспечение АС: Совокупность документов, описывающих технологию функционирования АС, методы выбора и применения пользователями технологических приемов для полу-чения конкретных результатов при функционировании АС.

Техническое обеспечение АС: Совокупность всех технических средств, используемых при функцион

– 147 –

Page 148: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

Математическое обеспечение АС: Совокупность мских методов, моде х в АС.

Программное обеспечение АС: С программ на но-сителях ых и программных доку значенная для отладки, ункцион

Информационн --

м -мации, применяем

Лингвистическ еспечение АС: Совокупность средств и правил для форма языка, используемых при общении пользова ла АС с ком-

тв а онировании АС. бес

ламентирующих п ировании АС и юридический ст

ск -ений в А ованию психологических, психофи-

, аножнос акте-

ристиками компл рами рабочей среды на

Стадии с

андарте н сс создания АС опр к совокупность упорядоченных во времени, взаимосв т. Если принять во ается за-

комп о аск ель жизненного цикла. Выделяется во-

семь стадий выпол зированной приведен

атематиче-лей и алгоритмов, примененны

овокупностьментов, предна да

фнн

ирования и проверки работоспособности АС. ое обеспечение АС: Совокупность форм доку

ментов, классифишений по объема

каторов, нормативной базы и реализованных ре, размещению и формам существования инфорой в АС, при ее функционировании. ое облизации естественноготелей и эксплуатационного персонавтоматизации при функциплексом средс

Правовое о печение АС: Совокупность правовых норм, рег-равовые отношения при функционатус результатов ее функционирования.

Эргономиченых реш

ое обеспечение АС: Совокупность реализованС по соглас

зиологическихстик и возм

тропометрических, физиологических характери-тей пользователей АС с техническими харекса средств автоматизации АС и параметрабочих местах персонала АС.

оздания автоматизированных систем (ГОСТ 34.601-90) [86]

е указана модель жизненного цикла, но процееделяется ка

В ст

язанных, объединенных в стадии и этапы рабовнимание, что каждая стадия заканчив

вершающимпредставлена к

лектом документов, то становится понятно, чтадная моднения проекта по созданию автомати

системы, ных в табл. 4.1.

– 148 –

Page 149: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

Таблица 4.1 Стадии и этапы создан АС

Стадии абот

ия

Этапы р1 2

1. тФормирование ребований к АС

и-

ебований пользователя к АС. работе и за-

технического зада-

1.1. Обследование объекта и обоснование необходмости создания АС. 1.2. Формирование тр1.3. Оформление отчета о выполненнойявки на разработку АС (тактико-ния)

2. Разработка

пользователя. й работе

концепции АС

2.1. Изучение объекта. 2.2. Проведение необходимых научно-исследовательских работ. 2.3. Разработка вариантов концепции АС, удовлетво-ряющего требованиям2.4. Оформление отчета о выполненно

3. Техническое зад

Разработка и утверждение технического задания на ание создание АС

4. Эскизный проект

4.1. Разработка предварительных проектных решений по системе и ее частям. 4.2. Разработка документации на АС и ее части

5. Технический проект

частям. 5.2. Разработка документации на АС и ее части. 5.3. Разработка и оформление документации на по-ставку изделий для комплектования АС и (или) тех-нических требований (технических заданий) на их разработку. 5.4. Разработка заданий на проектирование в смеж-ных частях проекта объекта автоматизации

5.1. Разработка проектных решений по системе и ее

6. Рабочая документация

6.1. Разработка рабочей документации на систему и ее части. 6.2. Разработка или адаптация программ

7. Ввод в действие

7.1. Подготовка объекта автоматизации к вводу АС в действие.

– 149 –

Page 150: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

Окончание табл. 4.1 1 2

7.4. Строительно-монтажные работы. Пусконаладочные работы.

7.2. Подготовка персонала. 7.3. Комплектация АС поставляемыми изделиями (программными и техническими средствами, про-граммно-техническими комплексами, информацион-ными изделиями).

7.5. 7.6. Проведение предварительных испытаний. 7.7. Проведение опытной эксплуатации. 7.8. Проведение приемочных испытаний

8. Сопровождение АС

8.1. Выполнение работ в соответствии с гарантийны-ми обязательствами. 8.2. Послегарантийное обслуживание

Стандарт 34 не заменяет ЕСПД, более того, он ссылается на

ЕСПД в части разработки программного обеспечения и программ-ной документации, но в то же время создание и сопровождение программного обеспечения должны подчиняться задачам созда-ния АС.

Необходимо принимать во внимание, что в состав АС могут входить технические средства, требующие проектирования и строительства. В состав информационной системы обычно входят уже созданные технические средства (компьютеры, телекоммуни-кац

и программного обеспечения, следова-тел оприятий, связанных с этим. При создании инф компьютер-ная тации на нее (чер-теж здание серверной с соответствующим про вом, а так-же ости и т. д.

ионные устройства и т. д.), что не устраняет задачу развертыва-ния технических средств

ьно, и комплекс мерормационных систем, как правило, используются

сеть, что требует создания рабочей докумени и схемы соединения); соектом энергообеспечения и возможным строительстпроектом организации пожарной безопасн

– 150 –

Page 151: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

Содержание работ, определенное на каждом этапе, не конкре-тизирует детали реализации функциональной и обеспечивающей час

скать некоторые стадии или этапы, их кте, определенным дог

— техническое задание на создание АС.

дания АС. Такое построение раб вре ь исп

тей системы. Допускается объединять и опуперечень и задачи в каждом конкретном проеовором, а не стандартом. Ключевым документом взаимодейст-

вия сторон является ТЗ

Техническое задание на создание автоматизированной системы (ГОСТ 34.602-89) [87]

ТЗ на АС является основным документом, определяющим тре-бования и порядок создания (развития или модернизации) автома-тизированной системы, в соответствии с которым проводится раз-работка АС и ее приемка при вводе в действие. При этом, ТЗ разрабатывает организация-разработчик (по ГОСТ 34.602-89), но формально ТЗ выдает разработчику заказчик (по РД 50-680-88).

Стандарт определяет все работы, предшествующие ТЗ и на-правленные на создание ТЗ, как предпроектные работы. Это соот-ветствует первым трем стадиям соз

от соответствует каскадной модели жизненного цикла. В то жемя в стандарте определен инструмент, дающий возможностользовать другие модели жизненного цикла. Во-первых, есть

возможность изменять требования с помощью документов «До-полнения». Во-вторых, если конкретные значения требований не могут быть установлены в процессе разработки ТЗ на АС, в нем можно сделать запись о порядке установления и согласования дан-ных требований. При этом в текст ТЗ на АС изменений не вносят.

ТЗ на АС содержит следующие разделы, которые могут быть разделены на подразделы:

1) общие сведения; 2) назначение и цели создания (развития) системы;

3) характеристика объектов автоматизации; 4) требования к системе; 5) состав и содержание работ по созданию системы; 6) порядок контроля и приемки системы;

– 151 –

Page 152: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

7) требования к составу и содержанию работ по подготовке объекта автоматизации к вводу системы в действие;

8) требования к документированию; 9) источники разработки. В ТЗ на АС могут включаться приложения. Раздел «Назначение и цели создания (развития) системы» со-

стоит из подразделов: 1) назначение системы, где указывают вид автоматизируемой

дея

руемых органов (пунктов) управления и управ-ляемых объектов;

2) цели системы, где приводят наименования и тре-буемые зна дственно-эко

в стандарте

тельности (управление, проектирование и т. п.) и перечень объ-ектов автоматизации (объектов), на которых предполагается ее использовать, кроме того, для АСУ дополнительно указывают пе-речень автоматизи

созданиячения технических, технологических, произво

номических или других показателей объекта автоматизации, указывают критерии оценки достижения целей создания системы.

Раздел «Требования к системе» состоит из следующих подраз-делов:

1) требования к системе в целом; 2) требования к функциям (задачам), выполняемым системой; 3) требования к видам обеспечения. Требования к функциям, выполняемым системой: по каждой

подсистеме разрабатывают перечень функций, задач или их ком-плексов, подлежащих автоматизации; временной регламент реали-зации каждой функции, задачи; требования к качеству реализации каждо й функции, к форме представления выходной информации, достоверности выдачи результатов; перечень и критерии отказов для каждой функции, по которой задаются требования по надежности.

Требования к обеспечению системы определеныдля каждого вида.

«Требования к документированию» приводят согласованный разработчиком и заказчиком системы перечень подлежащих разра-ботке комплектов и видов документов. Требования к содержаниюдокументов, разрабатываемых при создании АС, установлены ука-заниями РД 50-34.698-90, а также соответствующими государст-

– 152 –

Page 153: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

венными стандартами Единой системы программной документации (ЕСПД), Единой системы конструкторской документации (ЕСКД), Системы проектной документации для строительства (СПДС) и ГОСТ 34.602. Перечень документов приведен ниже.

В разделе «Состав и содержание работ по созданию системы» определяются стадии и этапы создания АС, а также перечень доку-

тем с последующей чного производства и

наладочных и пусковых в действие комплекса средств авто-ормационной системы являются:

цо, участвующее в функционировании функционирования) и

ментация (может быть

), в кото-

ментов, предъявляемых по окончанию соответствующих стадий и этапов работ.

По согласованию между разработчиком и заказчиком системы в состав ТЗ на АС включают приложения, содержащие: расчет ожи-даемой эффективности системы; оценку научно-технического уровня системы.

§ 2. ëéëíÄÇ àçîéêåÄñàéççõï ëàëíÖå

Как отмечалось, состав, структура, стадии создания и докумен-тация информационной системы будут рассматриваться с точки зрения рекомендаций ЕКС АС (стандарты 34 и 24 группы, а также руководящие документы и рекомендации, посвященные АС). Ин-формационные системы (ИС) являются подмножеством АС, по-этому и используется нормативная база АС.

ИС, как правило, создают проектным пукомпл иниектацией изделий серийного и едпроведением строительных, монтажных, работ, необходимых для ввода матиз и инфации. Составляющим

• пользователь АС (лиАС или использующее результаты ееэксплуатационный персонал АС;

• программно-технический комплекс (ПТК); • компоненты обеспечения; • необходимая эксплуатационная доку

включена в состав компонентов обеспечения). По выполне-льзователи информационной системы участвуют в

нии бизнес-процесса (или в производственном процессе

– 153 –

Page 154: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

ром они обращаются с ПТК АС и используют результаты функ-ионной системы. Описание бизнес-

проны в документации организационного обеспечения.

ющие

и необходимое дополни-тел

анные на машинном носителе, принятые службой техниче-

ексы (ПТК), представляющие средств, реали-

набор потребительских функций и предназна-ции в АС или в отдельных ее частях.

видам услуг, которые могут быть представлены в именения АС, относят:

н

ционирования данной информаццесса и регламент работы пользователя с АС в нем должны

быть изложеПри создании АС в состав поставки могут входить следу

средства автоматизации [92]: • технические средства (в том числе приборы, контроллеры,

средства вычислительной техники и т. п.) ьное оборудование (щиты, пульты, операторские кресла и т. п.); • программные средства, представляющие собой программы на

машинном носителе, изготовленные в соответствии с утвержден-ной технологией и принятые службой технического контроля изго-товителя;

• информационные средства, представляющие собой данные, записского контроля изготовителя;

• программно-технические комплсобой совокупность технических и программныхзующие заданныйченные для реализа

К основным ходе создания или пр

• обследование объекта автоматизации; • научно-исследовательские работы; • проектные работы; • конструкторские работы; • монтажные работы; • наладочные работы; • обучение персонала пользователя; • экспертиза технической документации; • участие в проведении приемочных испытаний (опыт ой экс-

плуатации); • сопровождение готовой системы; • работы по модернизации и развитию действующей системы; • анализ функционирования действующей системы;

– 154 –

Page 155: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

• консультации заказчиков; • сервисное обслуживание. Состав информационных систем определяется несколькими

факторами: • стадией жизненного цикла информационной системы; • задачами, решаемыми при использовании ИС; • требованиями договоров, регламентирующих разработку и

внедрение ИС для данного предприятия. ГОСТ 34.201 регламентирует состав проекта информационной

системы на всех этапах ее жизненного цикла. В том случае, если данная ИС разрабатывается проектным путем, проектная докумен-тация на компоненты, выполненная в рамках этого проекта, являет-ся неотъемлемой составляющей ИС.

При выполнении проекта возможны следующие участники ра-бот:

• заказчик (пользователь); • генподрядчик (генпоставщик); • разработчик (проектировщик); • поставщик; • монтажник; • наладчик; • изготовитель. Данные участники могут рассматриваться в качестве ролей, ко-

торые допускается выполнять одному или нескольким юридиче-ским или физическим лицам. В некоторых проектах возможно как увеличение, так и уменьшение количества ролей.

Заказчик финансирует соз. п.)

дание (разработку, изготовление и т

отает по договорам с заказ-а-

бот

системы, формулирует требования к системе, обеспечива-ет оговоренные в договоре (контракте) условия деятельности ген-поставщика, разработчика, поставщиков и других участников наобъекте.

Генподрядчик (генпоставщик) рабчиком, разработчиками, поставщиками и другими участниками р

. Генподрядчик (генпоставщик) АС осуществляет предусмот-ренную договором между ним и заказчиком системы поставку

– 155 –

Page 156: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

необходимых для создания АС изделий, организует выполнение порученных ему работ, несет гарантийные обязательства по всей системе в целом. Генподрядчик выдает задания головному разра-

кретном предприятии «N» внедряется инф та. Для этого принято

и руководство, чтобы

интересовать, как они должны были бы льности использования рекомен-

простоты, что договор по вне-

«ООО», которая и осуществляет поставку ПО.

участвующих в проекте, — две, но ролей, выполняемых

продажи ПО «1С: Бухгалте-рия

Фирма ООО является: С: Бухгалте-

рия

ботчику или соисполнителям, заключает с ними договора на вы-полнение работ, принимает от них работу. В случае сдачи системы «под ключ» генподрядчик (генпоставщик) несет ответственность за своевременное выполнение всех работ, обеспечивающих ввод сис-темы в постоянную эксплуатацию в заданном объеме в установ-ленные сроки.

Разберем пример. На конормационная система бухгалтерского уче

решение купить ПО «1С. Бухгалтерия 7.0» для автоматизации «всех функций» бухгалтерии. Предприятие небольшое: на нем ра-ботают три бухгалтера и главный бухгалтер. Решение по автомати-зации (на то оно принято руководствомсмотреть вперед). Далее события могут развиваться самым различ-ным образом, но нас будетразвиваться с точки зрения правидаций ГОСТ 34. Будем считать длядрению «1С. Бухгалтерия 7.0» будет выполнять специализирован-ная фирма

Договор на внедрение это и есть проект, в рамках которого бу-дет создаваться информационная система. В данном примере орга-низаций, этими организациями, много.

Предприятие «N» является: покупателем, в договоре купли-•

»; • заказчиком, в договоре разработки и внедрения информаци-

онной системы бухгалтерского учета; • эксплуатирующей организацией ИС бухгалтерского учета.

• продавцом, в договоре купли-продажи ПО «1»;

– 156 –

Page 157: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

• подрядчиком (он же генеральный подрядчик) в договоре раз-работки и внедрения информационной системы бухгалтерского

данной информационной сис-

ку и внедрения ИС, фир-в соответствии с

системы; (объектом авто-тера по обработ-

е-мы

обеспе-втома-

и, по кото-

учета; • организацией сопровождения

темы (возможно, в дальнейшем, организацией сопровождения ИС станет Предприятие «N», а фирма ООО будет сопровождать только ПО «1С: Бухгалтерия»)56.

аботПри составлении договора на разрма ООО подготовила техническое задание (ТЗ) ГОСТ 57 34.602-89 [87] .

В ТЗ нашли отражение: • назначение и цели создания • краткие сведения об объекте автоматизации

матизации в данной ИС являются функции бухгалке информации и составлении отчетов);

• требования к системе; • требования к численности и квалификации персонала сист и режиму его работы; • требования к надежности; • требования безопасности; • требования к защите информации от несанкционированного

доступа; • перечень функций, задач или их комплексов (в т. ч.

чивающих взаимодействие частей системы), подлежащих атизации;

• перечень и критерии отказов для каждой функцирой задаются требования по надежности.

Требования к видам обеспечения: — информационное обеспечение: • к составу, структуре и способам организации данных в сис-

теме; • информационному обмену между компонентами системы;

56 Роли выделены по ГОСТ Р ИСО/МЭК 12207-99 [93]. 57 Техническое задание готовит подрядчик от лица заказчика.

– 157 –

Page 158: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

• информац и системами (совместимость с ой планового отдела);

• структуре дачи данных в сис

ическое обеспечение:

ОО

ионной совместимости со смежнымс истемпроцесса сбора, обработки, пере

теме и представлению данных; • контролю, хранению, обновлению и восстановлению данных; • процедуре придания юридической силы документам, проду-

цируемым техническими средствами АС; — лингвист• к средствам описания предметной области; • применению в системе языков программирования высокого

уровня; — программное обеспечение: • к перечню покупных программных средств; • техническому обеспечению: • видам технических средств (требование к персональным ком-

пьютерам, к серверу, к телекоммуникационному оборудованию); — организационное обеспечение: • к структуре и функциям подразделений, участвующих в

функционировании системы или обеспечивающих эксплуатацию; • организации функционирования системы и порядку взаимо-

действия персонала АС и персонала объекта автоматизации; • защите от ошибочных действий персонала системы; • перечню стадий и этапов работ по созданию системы; • видам, составу, объему и методам испытаний системы; • общим требованиям к приемке работ по стадиям; • перечню основных мероприятий и их исполнителей, которые

следует выполнить при подготовке объекта автоматизации к вводу ИС в действие;

• согласованному фирмой ООО (разработчик) и Предприятием «N» (заказчик) перечню подлежащих разработке комплектов и ви-дов документов.

Далее, согласно определенному перечню этапов работ, фирмаО выполняет проект создания ИС.

– 158 –

Page 159: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

§ 3. ëíêìäíìêÄ à ÄêïàíÖäíìêÄ àçîéêåÄñàéççéâ ëàëíÖåõ

Под архитектурой ИС понимается описание ее функций с точки зрения конечных пользователей и интерфейсов взаимодействия с внешней средой. Архитектура ИС — это внешний взгляд на опи-сываемый объект, безотносительно к его реализации, в частности, к структуре.

Декомпозиция заданных функций ИС, осуществляемая в про-цессе проектирования, дает структуру ИС в виде взаимодействую-щих между собой подсистем. Каждая из этих подсистем, в свою очередь, может быть подразделена на составные части, вплоть до неделимых модулей программ. Понятие структуры ИС является иерархическим, включающим в себя несколько уровней разбиени

тво расширяемости ИС по функциям. Структурные единицы на каждом уровне разбиения подлежат архитектурному описанию [94].

ГОСТ 34 не регламентирует структуру ИС и вид архитектурно-го описания системы.

Существуют два взаимодополняющих определения архитекту-ры: «архитектура как описание» и «архитектура как процесс». Пер-вое определение говорит о том, что архитектура — это описание некоторой системы в определенный момент времени. Второе опре-деление говорит, что архитектура — это процесс, т. е. набор правил и (или) стандартов, которые применяются в процессе построения новых систем.

В качестве примера можно привести модель описания архитек-туры системы, предложенной Gartner. Данная модель дает пред-ставление архитектуры в виде матрицы, где для каждой из основ-ных подсистем информационной системы, таких как данныприложения, интегра раструктура, после-довательно накладываю , отличающих-ся п

я, число которых зависит от того, каким образом предполагается реа-лизовать свойс

е, ция, общие сервисы инфтся несколько спецификаций

о уровню детализации [43]: Бизнес-потребности, определяющие ключевые требования к

конкретной технологии для данной индустрии и организации.

– 159 –

Page 160: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

Принципы, включающие в себя основные подходы, которых придерживается руководство (использование покупных изделий или самостоятельная разработка, использование стандартных под-ход

к описанию архитектуры использовал Крачтен [94

ов или заказных разработок и т. д.). Процессы управления во всех областях жизненного цикла

элементов архитектуры. Здесь могут определяться эталонные мо-дели для организации пользовательского интерфейса, организации данных и т. д.

Протоколы и стандарты. Описываются промышленные стан-дарты, которые должны поддерживаться в организации техноло-гии.

Используемые продукты и технологии. Утвержденный для организации список продуктов и технологий. Кроме того, в этом разделе определены доводы в пользу конкретных поставщиков.

Другой подход] (рис. 4.1).

Рис. 4.1. Архитектура 4 + 1

Логическое представление (logical view) основное внимание ак-центирует на концептуальной структуре системы. Это абстракция модели проектируемой системы, определяющая главные пакеты,

– 160 –

Page 161: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

подсистемы и классы модели и их отношения. Это системное пред-ставление, с точки зрения аналитиков и проектировщиков. Данный уровень не затрагивает вопросы реализации системы.

Представление реализации (implementation view) описывает структуру статических программных модулей в среде разработки в тер

т р н

шающих вопросы топ

кон

, характеристик как обя

минах организации пакетов и уровней, а также управления кон-фигурацией. Данное представление выполнено с точки зрения про-граммистов, реализующих основные модули системы.

Предс авление азвертыва ия (deployment view) показывает, каким образом различные исполняемые файлы и другие компонен-ты времени выполнения устанавливаются на используемых плат-формах или в узлах вычислительной сети. Данное представление выполнено с точки зрения системотехников, ре

ологии системы, ее развертывания и организации компьютер-ных сетей.

Процедурное представление (process view) акцентирует внима-ние на аспектах параллельного выполнения процессов системы: организация регламента решения задач, управления потоками или процессами, а также вопросами взаимодействия других элементов.

Прецедентное представление (use-case view), или представле-ние вариантов работы системы, включает множество ключевых сценариев, выполняемых системой. По сути дела, в данном пред-ставлении задается функционал системы с точки зрения ечногопользователя. Считается, что данное представление должно опре-делять реализацию всей системы, поэтому и выделено в особый вид представления, которое направляет и определяет остальные виды представления архитектуры.

êÖáûåÖ

Стандартизация — это деятельность, направленная на разра-ботку и установление требований, норм, правил

зательных для выполнения, так и рекомендуемых; обеспечи-вающая право потребителя на приобретение товаров надлежащего качества, а также право на безопасность и комфортность труда.

– 161 –

Page 162: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

Цель стандартизации — достижение оптимальной степени упоря-дочения в той или иной области посредством широкого и много-кра

спользование стандартов помогает снизить квалификационные требования к пер-соналу, сформировать , лучше подго-товить персонал

о знания и опыт профессионалов, ам выбрать пути реше-

ержат пра- тогда,

ешь и по-е стандартов требует определенной культуры

ожет принести применение стандартов, требует довольно ие их использо-

количество стандартов в области инфор-

ационных систем. Комплекс ГОСТ 34 распространяется на ормационные системы являются

часть объ-ектов автоматизированных систем (программы и их документа-ции). ГОСТ 34 регламентирует системный подход при создании ИС, а ГОСТ 19 определяет комплекс работ, связанных с разработ-кой и внедрением ПО, как составной части ИС.

Под архитектурой ИС понимается описание ее функций с точки зрения конечных пользователей и интерфейсов взаимодействия с внешней средой. Архитектура ИС — это внешний взгляд на опи-

тного использования установленных положений, требований, норм для решения реально существующих, планируемых или по-тенциальных задач.

Стандарты удешевляют совокупную стоимость владения сис-темами, облегчают возможность расширения, модификации и мас-штабирования систем. Следование стандартам позволяет произво-дителям техники наладить не мелкосерийное, а массовое производство продукции, повысить ее качество. И

четкие программы обученияк решению практических задач.

Кроме того, стандарты — эткоторые помогают начинающим специалистний насущных задач. С другой стороны, стандарты сод

возможно тольковила и рекомендации, исполнение которыхкогда по крайней мере эти правила и рекомендации знанимаешь. Выполнениорганизации, а также дисциплины ее сотрудников. Дивиденды, ко-торые мкропотливой работы, направленной на поддержанвания.

Существует большое мационных технологий, которые могут быть применимы для ин-формавтоматизированные системы (инфподмножеством АС), а комплекс ГОСТ 19 — только на

– 162 –

Page 163: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

сываемый о астности, к структ

Д ро-цессе ую-щих между собой подсистем. Каждая из этих подсистем, в свою очередь, может быть подразделена на составные части, вплоть до ниерархичес азбиения, число которых зависит от того, каким образом предполагается реа-лиз

бъект, безотносительно к его реализации, в чуре.

екомпозиция заданных функций ИС, осуществляемая в п проектирования, дает структуру ИС в виде взаимодейств

еделимых модулей программ. Понятие структуры ИС является ким, включающим в себя несколько уровней р

овать свойство расширяемости ИС по функциям.

Çéèêéëõ Ñãü ëÄåéèêéÇÖêäà

1. Что такое сертификация? 2. Для чего требуется стандартизация? 3. Как связаны стандартизация и лицензирование? 4. Что определяют стандарты на АС? 5. Чем отличаются стандарты ГОСТ 34 от ГОСТ 24? 6. Что такое ТЗ? 7. Что понимается под объектом автоматизации в ГОСТ

34.602? 8. Что такое АС и как она отличается от ИС? 9. Можно ли АСУ отнести к ИС? 10. Каков состав ИС? 11. Чем отличаются функциональные и обеспечивающие части

ИС? 12. Что такое архитектура ИС? 13. Чем отличается архитектура от структуры ИС?

– 163 –

Page 164: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

É·‚‡ 5. ÄÇíéåÄíàáàêéÇÄççõÖ

àçîéêåÄñàéççé-èéàëäéÇõÖ ëàëíÖåõ

à àçîéêåÄñàéççé-èéàëäéÇõÖ üáõäà

нформации предполагает сра мысловым содер-

ествует некоторый язык пред-

о-поискового языка (ИПЯ), процесс функционирования АИПС состоит в следующем:

• перевод содержания документа и (или с естествен-ного языка на И ов). В резуль-тат

уществляется в соответствии с неко-

§ 1. èéêüÑéä îìçäñàéçàêéÇÄçàü ÄÇíéåÄíàáàêéÇÄççéâ

àçîéêåÄñàéççé-èéàëäéÇéâ ëàëíÖåõ

Автоматизированная информационно-поисковая система (АИПС) предназначена для ввода, обработки, хранения и поиска семантиче-ской информации. Поиск семантической и

внение смыслового содержания запроса со сжанием хранящихся в АИПС документов. Такая операция возмож-на только в том случае, когда сущставления информации, позволяющий однозначно описывать смысловое содержание документов и запросов.

Естественный язык для этой цели не подходит в силу своей многозначности и высокой сложности. При наличии такого языка, который носит название информационн

) запросаПЯ (процесс индексирования текст

е индексирования полный текст документа (запроса) заменяется некоторой характеристикой, кратко отражающей его смысловое содержание. Эта характеристика носит название поискового об-раза документа (ПОД) и (или) поискового образа запроса (ПОЗ). Иногда ПОЗ называют поисковым предписанием (ПП);

• представление ПОДов и ПОЗов в машинных кодах (кодиро-вание). Часто этот этап выполняется совместно с предыдущим;

• организация массивов ПОДов и ПОЗов. Обработка эле-ментов этих массивов и представление их в виде, наиболее удоб-ном для поиска;

• поиск информации, т. е. выделение из поискового массива тех документов, содержание которых соответствует поисковому предписанию. Эта операция ос

– 164 –

Page 165: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

торым критерием смыслового соответствия (КСС) поискового образа документа поисковому образу запроса (критерий выдачи);

орен работой АИПС, и может производиться либо в п

виде

лы, копии документов

дставление которой линейным текстом весьма затрудни-тел

• выдача пользователю информации, соответствующей ото-бранным ПОДам;

• корректировка запросов или ПП и повторение предыду-щих этапов. Эта операция выполняется в том случае, если потреби-тель не удовлетв

акетном режиме, либо в режиме диалога. Выходной продукцией АИПС могут быть: оригиналы, копии

или адреса документов; данные и факты, содержащиеся в докумен-тах в явном виде; факты, данные, сведения, которые в явномне содержатся во введенных документах.

В связи с этим различают следующие АИПС: • документальные (выдают оригина

или адреса введенных документов); и т ф• фактографическ е (выдаю данные, акты, сведения, со-

держащиеся в явном виде во введенных документах); • информационно-логические (выдают данные, факты, све-

дения, которые в явном виде не вводились в АИПС, а получены в результате некоторого логического вывода).

§ 2. ëéëíÄÇ à ëíêìäíìêÄ Äàèë

АИПС так же, как и любая АИС является весьма сложной сис-темой, пре

ьно. Можно выделить несколько различных декомпозиций и, соответственно, представлений АИПС, каждая из которых описы-вает систему с определенной точки зрения и на различных уровнях детализации. Наиболее необходимы для изучения АИПС следую-щие пять декомпозиций:

• функциональная декомпозиция, т. е. разбиение АИПС на функциональные составляющие (подсистемы);

• покомпонентная декомпозиция, т. е. разбиение АИПС, по-зволяющее выделить ее информационные, программные, техниче-ские и трудовые компоненты;

– 165 –

Page 166: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

• декомпозиция на обеспечивающие составляющие, т. е. раз-биение АИПС на обеспечивающие подсистемы;

• организационная декомпозиция — декомпозиция АИПС на организационные составляющие;

• методологическая декомпозиция — декомпозиция логико-семантических средств, обеспечивающих создание и функциони-рование АИПС.

Рассмотрим каждую из предложенных АИПС. Функциональная декомпозиция — декомпозиция на функцио-

нальные подсистемы. При такой декомпозиции наиболее рациональ-но выделять следующие функциональные подсистемы АИПС:

• отбора информации из внешней среды; • предм• обраб

ие.

мостоятельного рассмотрения информацион-ы АИПС. С этих позиций в ить: информационную базу

ные средства АИПС); тех-

организационные средства (ри

ашинной обработки и ввода информации; отки и хранения информации;

• поиска и выдачи информации; • информационного обслуживания потребителей информации. Возможны и иные разбиения АИПС на функциональные со-

ставляющПокомпонентная декомпозиция. Такая декомпозиция вызвана

необходимостью саной, программной и технической средсоставе АИПС целесообразно выдел(базу данных, словари, справочники и т. д.), программ

граммы — software (СУБД/ПС, пользовательские пронические средства (hardware АИПС),

с. 5.1). Ясно, что большинство функций предыдущей (функциональ-

ной) декомпозиции реализуются соответствующими техническими программными и информационными средствами покомпонентной декомпозиции. Например, база данных используется всеми подсис-темами функциональной декомпозиции, но для реализации различ-ных функций: подсистема ввода и хранения обеспечивает ввод и ведение информации в БД; наоборот, подсистема поиска обеспечи-вает поиск в БД нужной информации. При этом почти все функ-циональные подсистемы (кроме подсистемы отбора) используют соответствующие программные и технические средства. Обе рас-

– 166 –

Page 167: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

смотренные декомпозиции описывают один и тот же объект — АИПС, но с различных точек зрения.

Рис. 5.1. Покомпонентная декомпозиция АИПС

ния включает совокуп-нос

ность методов, алгоритмов, и программ ввода, обработки, поиска и выдачи информации.

Декомпозиция на обеспечивающие составляющие. Обеспе-чивающими составляющими, или подсистемами АИПС, называют элементы, которые обеспечивают реализацию заданных функций АИПС.

В АИПС обычно выделяют следующие обеспечивающие под-системы (рис. 5.2):

• информационного обеспечения; • лингвистического обеспечения; • математического и программного обеспечения; • технического обеспечения; • организационного обеспечения. Подсистема информационного обеспечеть средств и методов сбора, обработки, хранения и выдачи ин-

формации (в т. ч. и информации о пользователе АИПС) и обеспе-чивает формирование, ведение (обновление, актуализацию) и использование информационной базы АИПС.

Подсистема лингвистического обеспечения включает совокуп-ность словарей, справочников, положений и инструкций предма-шинной и машинной обработки и поиска информации.

Подсистема математического и программного обеспечения включает совокуп

– 167 –

Page 168: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

Рис. 5.2. Декомпозиция АИПС на обеспечивающие подсистемы

Под плекс

ЭВМ, технических средств сбора, ввода, передачи, отображения, хране ачи информации.

. Логико-семантиче-ский комплекс (ЛС огических, и мате-мат

ляю

система технического обеспечения включает ком

ния, диспетчеризации, телекоммуникации, поиска и выд

Организационная декомпозиция АИПС. Такая декомпозиция соответствует организационной структуре информационного ин-ститута, центра или иной организации, в структуру которой входит АИПС. Среди элементов организационной декомпозиции могут быть: вычислительный центр, отделы или лаборатории. Декомпо-зиция на обеспечивающие подсистемы, в чем-то перекрываясь с покомпонентной декомпозицией, тем не менее представляет новую точку зрения на состав и структуру АИПС.

Логико-семантический комплекс АИПСК) — комплекс языковых, л

ических средств формализованного представления семантиче-ской информации с целью ее автоматизированной обработки и поиска (рис. 5.3). ЛСК представляет собой теоретическую и прак-тическую базу создания и функционирования как каждой состав-

щей всех ранее рассмотренных декомпозиций АИПС, так и АИПС в целом.

– 168 –

Page 169: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

Рис. 5.3. Состав логико-семантического комплекса АИПС

§ 3. àçîéêåÄñàéççé-èéàëäéÇõÖ üáõäà (àèü)

В последние годы создаются самые разнообразные искусствен-ные языки, ориентированные на определенный аспект решаемых задач. Это языки описания данных, информационно-поисковые языки, языки моделирования, управления заданиями, автоматиза-ции проектирования, языки манипулирования данными и т. д. Опи-сать все разнообразие существующих языков или тем более дать их исчерпывающую классификацию не представляется возможным. Среди множества классов искусственных языков нас интересуют только информационно-поисковые языки.

Основные элементы ИПЯ

Для определения роли и места ИПЯ рассмотрим основные по-нятия языков, которые тесно связанны с информационно-пои

это знаковая система любой физической природы, вы-пол

венный язык (ЕЯ) есть

сковыми языками и некоторые из них описаны в стандарте ГОСТ 7.74-96.

Язык — няющая познавательную и коммуникативную функции и про-

цессе человеческой деятельности. Естест

– 169 –

Page 170: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

осо

и интерпретации и предназначенная для описания, обр

й темы) и формальных характеристик до-кум

тов и, следовательно, в той или иной мере обладает смы

языка.

объектов позволяет отобразить их смы-

етных текстов.

бого рода преобразователь заданных смыслов в тексты, и на-оборот.

Информационный язык — формальная семантическая систе-ма, включающая алфавит, правила образования конструкций, их преобразования

аботки, логической переработки и поиска информации. Информационно-поисковый язык — специализированный

искусственный язык, предназначенный для описания основного содержания (центрально

ентов с целью информационного поиска. Алгоритмический язык — язык, предназначенный для записи

информации и алгоритмов ее обработки в форме, воспринимаемой ЭВМ. Каждый из названных языков предназначен для описания языковых объек

сло-выразительной способностью, т. е. способностью выражать смысловое содержание текстов. Указанная способность зависит от того, на каких уровнях представляются языковые объекты средст-вами данного

Различают следующие уровни представления языковых объ-ектов.

Семантика — основные закономерности строения внутренней (смысловой) стороны языковых объектов. Семантический уровень представления языковыхсловое содержание, выразить связь смыслов отдельных знаков со смыслом текста (связь смысла языковых объектов между собой и со смыслом образуемого ими более сложного языкового объекта).

Синтаксис — основные закономерности, определяющие отно-шения между единицами языка в пределах конкрСинта ксический уровень представления языковых объектов позво-ляет выразить их структуру, отношения знаков в тексте, законо-мерности построения текстов.

Морфология — основные закономерности построения слов языка, т. е. система грамматических категорий и способов их вы-ражения.

Правописание — система правил, устанавливающая единооб-разные способы передачи речи на письме.

– 170 –

Page 171: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

Фонетика — основные закономерности поведения речевого аппарата и способы их использования.

на

ми элементами ИПЯ являются [55]:

четаний и выражений, используемых для построения тек-стов ИПЯ. В качестве ИПЯ могут быть ис-пользованы:

ют различные способы задания словарного состава

ряде

Указанные уровни представления языковых объектов позволяют описать преобразование: звук — фонема — морфема — слово — текст — смысл.

ИПЯ представляют языковые объекты на 1, 2, 3, 4 уровнях. Од-нако арсенал средств ИПЯ для представления языковых объектов

семантическом уровне менее развит по сравнению с естествен-ным языком.

ОсновныАлфавит ИПЯ — система знаков, используемых для записи

слов и выражений ИПЯ. Это могут быть буквы русского и (или) английского языка, знаки препинания, арабские цифры, любые иные символы.

Лексика, или словарный состав ИПЯ, — совокупность слов, словосо

лексических единиц

• слова, фрагменты слов, словосочетания и выражения любого естественного языка;

• коды и шифры (цифровые, буквенные, буквенно-цифровые) словосочетаний, слов и выражений, выступающие в роли имен со-ответствующих классов;

• шифры и коды в сочетании со словами, словосочетаниями и выражениями.

СуществуИПЯ, в т. ч.:

• перечисление всех лексических единиц ИПЯ; • перечисление части лексических единиц и задание правил

формирования из них других лексических единиц; • задание правил построения лексических единиц, слов и вы-

ражений естественного языка. Первый способ задания лексики требует больших интеллекту-

альных усилий. Процесс построения лексики нельзя автоматизиро-вать й и в . Лексика ИПЯ оказывается жестко фиксированно

– 171 –

Page 172: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

случаев не п ысловое со-дер

. Синтаксис —

т быть предъявлены следующие требования: ими средст-

ие ИПЯ, его значение, смысл не

тмизации.

озволяет достаточно точно выразить смжание текстов. Третий способ поддается полной автоматизации, хотя и требует

больших интеллектуальных затрат на определение правил форми-рования лексики. Однако научный подход к формированию сло-варного состава делает его более совершенным, обеспечивает единообразие и уменьшает субъективизм при построении лексики.

Второй способ занимает промежуточное положение и в отно-шении интеллектуальных усилий, и в отношении автоматизации процессов.

Грамматика ИПЯ — совокупность средств и способов по-строения, изменения и сочетания лексических единиц. Грамматика включает морфологию и синтаксис. Морфология — совокупность средств и способов построения и изменения словсовокупность средств и способов соединения слов в выражения и фразы.

Требования к ИПЯ

К информационно-поисковым языкам, их конструкциям и эле-ментам могу

• ИПЯ должен располагать лексико-грамматическвами для точного выражения основного содержания (центральной темы или предмета) текста. Это связано с необходимостью пред-ставления текстов на семантическом уровне и является обязатель-ной предпосылкой обеспечения смысловыразительной способности ИПЯ.

• ИПЯ не должен быть двусмысленным. Любое выражение ИПЯ должно пониматься вполне однозначно, что связано с необ-ходимостью устранения многозначности, присущей естественномуязыку и недопустимой для ИПЯ в силу того, что приемником тек-стов ИПЯ является программно-техническая система, а не человек.

• ИПЯ не должен содержать элементы, отображающие волевое побуждение, эмоции и т. д. Выражен

должны зависеть от «настроения» приемника информации. • ИПЯ должен быть удобным для алгори

– 172 –

Page 173: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

Типы отношений между словами ИПЯ

Построение выражений ИПЯ требует решения, по крайней ме-ре, двух проблем.

Первая из них связана с выбором слов (лексических единиц) из множества лексических единиц ИПЯ, необходимых для построения выражений. Здесь решается вопрос, какие использовать слова по принципу «или-или» (или то слово — или иное слово). Выбор слов определяется их смысловыми значениями, обусловленными отно-шениями между предметами и явлениями, которые они определя-ют. Такие отношения называются парадигматическими.

Парадигматические отношения — это отношения, обуслов-ленные наличием не языковых, а логических связей между предме-тами и явлениями, обозначенными данными словами. Наиболее важны следующие парадигматические отношения:

• «вид-род», например «шкаф-мебель». В данном случае по-нятие «шкаф» является видовым по отношению к понятию «ме-бель» — понятие «мебель» является родовым по отношению к по-нятию «шкаф». Родовое понятие всегда включает в себя видовое;

• «часть-целое», например «лезвие-нож». Лезвие является ча-стью ножа;

• «причина-следствие», например «лампа-свет»; • «функциональное сходство», например «лопата-экскава-», «телега-автомобиль». Естественный язык обладает высокой многозначностью.

Это создает богатство его форм и содержания. При написании тек-стов (особенно художественных) стремятся использовать эту мно-гозначность для придания тексту элегантности, литературно

тор

сти. В И

-мы

ПЯ недопустима многозначность. Поэтому здесь необходимо учитывать отношения синонимии и омонимии слов ЕЯ, используе

х в ИПЯ. Омонимия слова, сочетания, выражения, текста (любого знака)

состоит в том, что они при одинаковом написании имеют различ-ный смысл. Например, понятие «соль» может обозначать вещество, ноту, главную часть, суть чего-либо.

Для пояснения многозначности удобно использовать семиоти-ческие понятия денотата, знака и концепта.

– 173 –

Page 174: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

Денотат — обозначаемое (объект, предмет и т. д.). Знак — обозначение данного денотата. Концепт — свойство денотата, его смысл, значение, информа-

ция, которую несет знак о денотате и о его месте в системе реалий. Зна

не животное. Лексические единицы (ЛЕ) языка — это зна-ки.

, знак «ключ» обо-значает дверной ключ шифру. Все три кон-цеп

ия выбранных слов (сл

ений, реал

си

и. Иногда говорят:

к обозначает денотат и выражает его концепт. Например: знак Ф. И. О.; денотат — конкретный человек; концепт — человек, а не дерево и

Омонимия знака состоит в том, что один и тот же знак выража-ет разные концепты.

Полисемия знака состоит в том, что один и тот же знак выра-жает пучок родственных концептов. Например

, нотный ключ, ключ к та близки между собой по смыслу. Синонимия знака состоит в том, что один и тот же денотат

имеет разные знаки. Например, знаки «коллега», «друг», «тезка» могут обозначать один и тот же денотат. Однако выражаемые эти-ми знаками концепты могут отличаться друг от друга. В данном примере смысл знака «коллега» существенно отличается от смысла знака «тезка», т. е. концепты знаков не совпадают. Знаки «колле-га», «тезка», «друг» — условные синонимы. Абсолютная синони-мия имеет место тогда, когда разные знаки обозначают один и тот же денотат и выражают одинаковый концепт.

Вторая проблема построения фраз ИПЯ связана с определением последовательности употребления или написан

овосочетаний), поскольку в каждый данный момент может быть использовано только одно слово (словосочетание), лексические единицы могут следовать одна за другой, но не одновременно.

Отношения, устанавливаемые при соединении слов в словосо-четания и фразы, носят название синтагматических отношений.

Синтагматические отношения — это совокупность всех от-нош изуемых синтаксисом ИПЯ. С этой точки зрения синтаксис представляет собой совокупность способов и средств выражения нтагматических отношений. Простейшим видом син-тагматических отношений является отношение вхождения не-скольких лексических единиц ИПЯ в один и тот же текст, фрагмент текста, фразу и т. д., т. е. отношение координаци

– 174 –

Page 175: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

ИПса, выражающего синтагматичи, информационно-поиско

тикоьзуемых

словыразительную спо-

ординированные ИПЯ.

огия, все парадигматические и синтагматические отноше-ния

Я без грамматики. Но поскольку ни один ИПЯ не может функ-ционировать без синтакси еские от-ношения между его словам вые языки без грамматики фактически не существуют.

Парадигматика и синтагматика — это два различных ас-пекта ИПЯ, первый связан с его лексикой, второй — с грамма-

й. Многообразие испол в ИПЯ парадигматических и син-

тагматических отношений определяет смысобность или семантическую силу ИПЯ.

Классификация ИПЯ

По характеру использования грамматических средств различа-ют прекоординированные и постко

Прекоординированные ИПЯ — это ИПЯ, словарный состав которых жестко связан грамматическими средствами в единую структуру. Лексика и грамматика такого языка, а также синтаксис, морфол

самостоятельно не существуют, а образуют единую жесткую связанную структуру. Индексирование текстов (перевод текстов на ИПЯ) выполняется только с использованием элементов такой же-сткой структуры. По сути дела, каждый ИПЯ этого типа представ-ляет р собой некото ую систему классификации.

Классификация — это группировка объектов по признакам (на-пример, тематическая классификация представляет собой группи-ровку по тематическим признакам, алфавитная — по алфавиту и т. д.). Классификация всегда проводится по единому основанию и определяет на множестве объектов М отношение эквивалентно-сти ,M Aϕ= с подмножествами классов эквивалентности. Если есть n признаков и по каждому из них строится отношение эквива-лентности iϕ , то получаем n классификаций. Использовать одно-временно n классификаций невозможно. Поэтому объединяют все n классификаций в одну одним из двух способов.

– 175 –

Page 176: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

1. В один класс включают только те объекты, у которых совпа-

даюn

т все признаки, т. е. 1 2 1... n ii=

ψ=ϕ ∩ϕ ∩ ∩ϕ =∩ϕ . Здесь ψ —

отношение эквивалентности, т. к. пересечение эквивалентностей есть эквивалентность.

2. В один класс включают объекты, у которых совпадает хотя n

бы один признак, т. е. 1 ii=

ψ=∪ϕ . Получаемое отношение является

отношением сходства (толерантности). Иерархическая классификация получается в том случае, если на

множестве объектов М определяется такое отношение древесного порядка (например, «род-вид»), когда каждый объект содержится в некотором минимальном (далее не членимом) таксоне, т. е. дерево непосредственных составляющих.

Обычно рассматривается несколько отношений порядка: род

два типа классификационных П

-

та в ель-

римерами таких классификаций явля-

–вид, часть–целое, причина–следствие, цель–средство и т. д. Каждому из них соответствует некоторая иерархическая классифи-кация.

Единую классификацию можно получить путем пересечения или объединения данных классификаций. Однако необходимо иметь в виду, что объединение отношений порядка, хотя и приво-дит к сокращению размерности классификации (числа таксонов), может дать в результате отношение, не являющееся порядком.

На практике используютсяЯИ . Первый тип — перечислительные классификации. В таких

классификациях жесткая структура понятий языка определена за-данием одного или нескольких отношений, устанавливающих

го объеквзаимосвязь понятий и обеспечивающих попадание любо один единственный класс. Различают два вида перечислит

ф аных класси икаций — иерархические и алф витно-предметные (рубрикационные) классификации.

е кИ рархичес ие классификации получают заданием отношений древесного порядка (или совокупности таких отношений, пересе-чение или объединение которых позволяет получить удовлетвори-тельную классификацию). П

– 176 –

Page 177: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

ются: десятичная классификация Дьюи, классификация Библиотеки конгресса США, универсальная десятичная классификация.

лексиче-ски ми классами понятий.

я структуры различного

аций — фасетные классифика-кациях существуют несколько жестких

стр аспект от- дела, фасетная классифи-

ческих классификаций, каж-дая

предшествует фасетный ана по-

е связан грамматикой заранее и такая связь осуществляется

ИПЯ; семантические коды (RX-коды, сем

Алфавитно-предметные классификации получают заданием отношений алфавитного порядка на семействе множеств

х единиц ИПЯ, определяемых предметныПримерами таких классификаций являютсрода каталогов и указателей.

Второй тип систем классификции. В этих классифи

уктур (фасетов), каждая из которых отображает одинношений между словами ИПЯ. По сутикация есть набор нескольких иерархи

из которых относится к одному аспекту рассмотрения объекта. Построению фасетных классификаций

лиз, в результате которого вся лексика ИПЯ разбивается нааспектные подмножества (фасеты).

Посткоординированные ИПЯ — ИПЯ, словарный состав ко-торых нв процессе индексирования и (или) поиска. Выделяют три типа та-ких ИПЯ: дескрипторные

антический код Перри-Кента) и синтагматические ИПЯ (на-пример, СИНТОЛ).

Фасетные ИПЯ можно рассматривать как препосткоординиро-ванные ИПЯ.

Иногда выделяют ИПЯ: • классификационные (к ним относят иерархические и фа-

сетные классификации); • рубрикационные (алфавитно-предметные классификации); • дескрипторные (все посткоординированные ИПЯ). По способу образования словарного состава различают: • ИПЯ с жестким словарем, задаваемым перечислением всех

лексических единиц языка; • ИПЯ со свободным словарем, задаваемым перечислением

определенной части лексических единиц и правилами образования новых лексических единиц;

– 177 –

Page 178: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

• ИПЯ без словаря, в котором лексические единицыфиксируются, а зада вания.

Две первых емой лексикой. И а Я р

авсо ;

ов ипто в; • езаур

ию п радигма ческих отношенибазисными отношенияз базисных отношени

ч П з адигматичес -ш «

у и• слабой синтагматикой (вхож л )• й синтагматикой ( ются указат

сой синтагматикой (указатели роли и связи, позици-тика и т. д.).

е о ведена в табл. 5.1. Как т ующие ИПЯ:

1В, р И -р тагматикой (2Д) с жест в 1 ск -ров (ЗС) и с базисными отношениям

2. <3А, 2В, 1C, 1Д, 2аЕ — это дескрипторный с синтагм ой, с отсутствием баз шений, словарь клю-ч оторого строится из сл ным правилам.

бинации индексов и столбцам, можно р разнообразные , что омби ж ои , не может быть ИПЯ « р ными отношениями» (<3А, В>), поскольку введение баз ношений предполагает налич словаря, в то же время мог ествовать ИПЯ с жест-ким словарем, но без базисных отнош

заранее не ются лишь правила их образо

группы ИПЯ — ИПЯ с контролируПЯ без словПо харак• со слов• со слов• со сл

ря — ИПтеру словаарем ключеарем словоарем дескрусо

с неконтря различых слов; чет ний

олируемойют ИПЯ:

лексикой.

аро

с т м. аПо налич

• ИПЯ с • ИПЯ баНаиболее

ения типовПо ет

ти й: ми; й. уются парелое». ношенийдение сучитыва

асто в Ивид–род»

синтагмат

Я испольи «часть–цческих от

кие отно

ПЯ: ; ели роли и

уч различают Иова в текстсо

с неразвитовязи);

• с развитонная грамма

Типологиявидно из табл

1. <1А, азвитой син

рассмотрицы, могу

3С, 2Д, 2

нных вид быть постаЕ> — это

в ИПЯ сроены след дескриптоким слои (1В).

ный арем (

И

ПЯ (2аЕА) де

ПЯ со

) с нерипто

лабойатик

евых слов кМеняя ком

ассмотреть самые не по каждой

исных отноов ЕЯ по заданпо строкам ИПЯ. Однано постря с базисисных отут сущений.

ко следует помнитьть ИПЯ. Например

2

к нации мобез слова

ие

– 178 –

Page 179: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

Таблица 5.1

средств

E

Классификация (типология) информационно-поисковых языков

По способу образования словарного

По нали-чию пара-дигматиче-

По харак-теру

словаря

По учету синтагма-тических

По характеру использо-вания грамматических

состава А

ских отношений

В

С

отношений

D

Предкоординирован-ные

С

лексики)

- тикой (вхождение

в

Иерархи- но--

к

жестким словарем (пе-речисление всех единиц С базис-

ными от-Со слова-рем ключе

Со слабой синтагма-

Алфавит-

1

текст) сификации ные лас-сификации

ношениями вых слов слова ческие клас- предмет

Посткоординированные

Со свобод- слованым рем

(перечисле-ние части ЛЕ, образование из

Без базис-ных отно-

Со слова-рем слово-

С неразви-той син-

тагматикой

них ос-тальных ЛЕ)

2

шений сочетаний роли и)

Дес-крип-торные

Семан-тиче-ские

Син-тагма-тиче-

(указатели

и связкоды ские

Без словаря (правила об-

С развитой тагма-

раз

сина

ванные

ования ЛЕ из слов ЕЯ)

Со слова-рем деск-и

тикой (ук -затели роли и связи, Препосткоординиро-

3

р пторов позицион-ная грам-матика и т. д.)

– 179 –

Page 180: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

Дескрипторные ИПЯ

В основе построения дескрипторных ИПЯ лежит принцип ко-ординатного индексирования [14], который предполагает, что основное смысловое содержание документа может быть выражено списком ключевых слов, т. е. списком наиболее существенных для понимания текста назывных полнозначных слов.

Полнозначные слова — существительные, прилагательные, глаголы, наречия, числительные, местоимения. Неполнозначные слова — предлоги, союзы, связки, частицы.

Принцип чистого координатного индексирования и поиска состоит в индексировании документов и запросов списками ключе-вых слов, являющихся ПОДами и ПОЗами, и в последующем срав-нении получен

о ключевых слов

ных списков.

Метод координатного индексирования и поиска

Пусть задано универсальное множествT = {d1,...,dm} и некоторое множество документов А = {a1,...,an}.

Пу сть далее }{ 1,..., ( )i i i i ia d d T P aα= = = есть поисковый образ

документа ia , т T. е. существует такое отображение P: A→2 множе-

Дом, равным Ti,

ства документов А в множество 2T, что ∀ai∈A, P(ai) = {di1, …, diα} = Ti.

Пусть A(Ti) — подмножество документов с ПОт. е. [ ( )] { , , } , ( )1i i i i iP A T d d T A T Aα= … = ⊂ ачим подмноже-ство документов, содержащих di, через А(di).

Если задано 1{ , , }i i iT d d

. Обозн

α= … , то каждому dik соответствует А(dik). Тогда ( ) ( ), ( )i ik iA T А d А d A=∩ ⊂ (рис. 5.4).

Рассмотрим запрос Q, поисковый образ которого есть

|P(Q) P(a )| K. |P(Q) ∩

чистой коор-

P(Q) = {di1, …, diβ}, di∈Ti. Документ ai отвечает на запрос Q (ai ре-левантен Q), если ∩ i ≥

Подмножество A(T ) релевантно запросу Q, если i

P[A(T )]| K (рис. 5.4). В соответствии с принципом i ≥

– 180 –

Page 181: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

динации документ ai выдается на запрос Q в том случае, если их поисковые образы имеют не менее К общих ключевых слов.

Рис. 5.4. Схема пересечения ПОД и ПОЗ

При использовании чистой координации при поиске могут воз-никнуть следующие нежелательные ситуации:

• ложная координации (в массиве, выданном на запрос, может быть документ, которые не отвечает запросу);

• неполная координация (выдача документа, несоответствую-щего запросу);

• синонимия ключевых слов (выдача отсутствует, хотя необхо-димо было выдать документ, содержащий синоним искомого тер-мина);

• полисемия (выдача ненужных документов); • необозначенность родо-видовых (парадигматических) связей

(выдача отсутствует, хотя необходимо было выдать документ, со-держащие родо-видовую связь с искомым термином);

• ложные синтагматические связи (выдача документа, не отве-чающего запросу);

• невыдача документов, близких по смыслу запросу (большое значение К).

Для ликвидации указанных недостатков необходимы:

– 181 –

Page 182: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

• устранение синонимии, полисемии, омонимии; • учет парадигматических связей; • учет синтагматических связей. Первое достигается введением в ИПЯ лексикографического

кон

рения запросов. Синтагматические свя-зи у

ово-соч

го языка на ИПЯ. роения и ведения ИПЯ, определяющие про-

шенствования ИПЯ, т. е. его словаря и

е группы: основ-яющие лексику ИПЯ, и морфоло-

гич и

естве лексических единиц основных словарей использу-пторы. Соответст-

евых слов»,

ее в

троля. Парадигматические связи учитываются использованием специальных словарей-тезаурусов, логических операций «И», «ИЛИ», «НЕ» и весовых коэффициентов, а также других методов и приемов уточнения и расши

читываются с помощью указателей роли и связи.

Состав и структура дескрипторных ИПЯ [55]

Основными элементами ДИПЯ являются [14]: 1. Словарь лексических единиц (ЛЕ), обеспечивающий вы-

деление определенных частей текста и их замену на коды лексиче-ских единиц.

2. Правила применения ИПЯ (грамматика), определяющие процедуру перевода текстов документов и запросов (слов и сл

етаний — морфология; фраз, текстов в целом — синтаксис) с естественно

3. Правила постцедуру изменения и соверправил применения.

Словари лексических единиц делятся на двные лексические словари, составл

еские словари, обеспечивающие морфологический анализ нормализацию слов.

В качются ключевые слова, словосочетания и дескривующие им словари носят названия: «Словарь ключ

ов».«Словарь словосочетаний» и «Словарь дескрипторПод ключевым словом (КС) понимается полнозначное слово

естественного языка, выражающ смысло ое содержание фраг-мента документа или запроса самостоятельно или в наборе с дру-гими КС.

– 182 –

Page 183: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

Словосочетание — последовательность нескольких слов

мо О

по

п ошен

Т можно представить как мультиграф, узлы которого

(обычно 2-5) естественного языка, выражающая основное смысло-вое содержание фрагмента документа или запроса. Словосочетание жет использоваться и в роли ключевого слова. бычно словарь

КС включает и отдельные слова и словосочетания. Однако число словосочетаний в словаре КС мало сравнению с числом отдель-ных слов. И наоборот, словарь словосочетаний в основном состоит из словосочетаний.

Дескриптор — понятие, обозначающее группу эквивалентных или близких по смыслу ключевых слов, т. е. это имя класса сино-нимов. В качестве дескрипторов могут быть использованы код, слово или словосочетание.

Словарь дескри тор в с заданными парадигматическими отно-иями между его элементами носит название тезауруса. Тезау-

рус является основным типом словарей современных ИПС. Информационно-поисковый тезаурус (ИПТ) по сути пред-

ставляет собой нормативный словарь-справочник, в котором зафик-сирована часть знаний человечества, относящихся к данной пред-метной области. ИП

соответствуют понятиям предметной области, а дуги — существующим парадигматическим отношениям между ними.

Наиболее важными парадигматическими отношениями ИПТ являются:

• соподчинение; • вид–род (род–вид); • часть–целое (целое–часть); • причина–следствие (следствие–причина); • функциональное сходство. Данные отношения выражаются в ИПТ четырьмя способами: • лексикографически, т. е. с помощью указательных помет,

ссылок; • таблично (с помощью таблиц связи слов); • аналитически, т. е. с помощью шифров и кодов; • графически (с помощью деревьев, графов).

– 183 –

Page 184: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

Обобщенная структура ИПТ включает как минимум три со-ставляющих:

1. Словарная часть — алфавитный список дескрипторов с их словарными статьями и ключевых слов. Словарная статья дескрип-тора di строится по схеме:

1 2 3 4 8, , , , , i i i i i id T T T T T< … >,

где di — дескриптор; Ti1 — множество ключевых слов-синонимов id ; Ti2 — множество родовых по отношению к d дескрипторов,

т. еi

. дескрипторов, связанных с di отношением род–вид; Ti3 — мно-жество видовых по отношению к id дескрипторов; Ti4,…, Ti8 — множества дескрипторов, связанных с di одним из отношений: целое–часть, часть–целое, причина–следствие, следствие–причина, функциональное сходство.

Все указанные множества упорядочены по алфавиту. В кон-кретных тезаурусах некоторые из множеств Ti4-Ti8 или все они мо-гут отсутствовать. Все множества могут быть одноэлементными или пустыми.

2. Семантическая карта — система тематических классов деск-рипторов, представленная в виде графической схемы или таблицы.

3. Руководство по использованию ИПТ содержит правила пе-рев с

дактирования ПОД и ПОЗ, а также пра-вил .

льзования основные лексические словари пре а представле-

о использования. Наиболее рас-про

ода ключевых слов и ловосочетаний на ИПЯ, правила лексико-графического контроля и ре

а ведения ИПТДля удобства исподставляют различными способами. Каждая форм

ния словарей порождает соответствующий вид словаря, ориентиро-ванный на определенные задачи ег

страненными видами основных лексических словарей являются: Алфавитный словарь — словарь дескрипторов или ключевых

слов, упорядоченных по алфавиту. Кодовый словарь — перечень лексических единиц, системати-

зированный по убыванию или возрастанию их кодов.

– 184 –

Page 185: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

Частотный словарь — словарь лексических единиц, упорядо-ченный по убыванию или возрастанию частоты их употребления в поисковом массиве.

Пермутационный словарь — словарь словосочетаний, упоря-доченный по алфавиту каждого слова словосочетания. Каждое сло-восочетание встречается в таком словаре столько раз, сколько слов оно включает.

Словарь отрицаний — перечень лексических единиц, не ре-комендуемых

Гнездо семанти-чес

ции, т. е. приведения к единому написанию и морфоло-гич

ализация слов является необ-ход

у в терминах ИПЯ.

для индексирования и поиска. вой словарь — совокупность классов (гнезд)

ки связанных между собой дескрипторов или ключевых слов, упорядоченных по алфавиту дескрипторов, отображающих верши-ны классов.

Иерархический словарь — совокупность имен классов услов-ной эквивалентности лексических единиц, упорядоченная в соот-ветствии с заданным на ней отношением порядка (род–вид, часть–целое и т. д.).

Основное назначение морфологических словарей состоит в отождествлении различных форм одного и того же слова и выявле-нии соответствующей грамматической информации, которую несет данное слово независимо от его окружения в тексте. Отождествле-ние различных форм одного и того же слова проводится с целью их нормализа

еской форме (нормальному виду). Именно в таком виде слова после соответствующего кодирования используются при индекси-ровании и поиске документов. Норм

имым процессом их индексирования. Грамматическая инфор-мация к слову необходима для его восстановления (декодирования) по его коду, представленном

Наиболее широкое распространение получили следующие морфологические словари:

1) основ слов; 2) окончаний слов; 3) суффиксов, префиксов, приставок, предлогов; 4) словоформ (словоформа — это последовательность букв ме-

жду двумя соседними пробелами).

– 185 –

Page 186: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

Процедура нормализации слов и выявления соответствующей им грамматической информации может выполняться как с исполь-зов

зуемые им морфологические словари. Следует отметить, что

ей минимальной сложности или вообще без них. Одна-ко невозможность получения гра дность.

з представительной

анием морфологического анализа и синтеза, так и без них. В любом случае используются морфологические словари. В по-следнем случае необходимо иметь большое количество словарей, включающих все формы возможных словоупотреблений. Исполь-зование методов морфологического анализа позволяет сократить число используемых словарей, но за счет усложнения процедуры нормализации и выявления грамматической информации. Чем ме-нее сложен алгоритм морфологического анализа, тем более сложны испольнормализацию слов можно выполнить с помощью морфологиче-ских словар

платой за такую простоту являетсямматической информации или ее бе

Анализ информации и построение словарей

Задача построения словарей состоит в следующем: по заданно-му классу текстов необходимо выбрать попарно-различимые лек-сические единицы (словоформы, основы слов, КС, дескрипторы и т. д.), определить их морфологические, синтаксические и семан-тические характеристики и расположить в заранее обусловленном порядке.

Существуют три способа построения словарей: Априорный. Лексические единицы выделяются из различных

терминологических источников (справочников, энциклопедий, словарей, классификаторов и т. д.) по заданной тематике. После отбора лексики проводят ее семантическую обработку и строят словари.

пА остериорный. Лексика формируется и выборки будущего фонда документов. Далее проводят ее семанти-

ческую обработку и строят словари.

– 186 –

Page 187: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

Динамический способ. Процессы накопления лексики, ее се-

у

на учете си-

мантическая обработка и построение словарей совмещены с про-цессом эксплуатации ИПС.

Первый способ принципиально невозможно автоматизировать. Он требует больших интеллект альных затрат. Второй поддаетсяавтоматизации, однако требует много затрат на сбор представи-тельной выборки документов. Третий способ является наиболее перспективным. Одно из его больших достоинств состоит в том, что все процессы построения словарей можно организовать в ре-жиме диалоговой обратной связи с пользователями системы, по-выш яа тем самым качество словарей.

Принципы отбора лексических единиц. В настоящее время не существует методов построения оптимальных словарей. Наука и практика располагают лишь определенными принципами построе-ния более или менее хороших словарей. Эти принципы базируютсяна свойствах слов и текстов естественного языка, таких как инфор-мативность слов, омонимия, синонимия и полисемия слов и фраз; синтаксическая эквивалентность фраз; отношения между словами; изменение со временем значений слов; ненормализованность слов и т. д.

При построении словарей приходится решать три основные проблемы:

1. Какие слова включать в словарь? 2. Какие учесть типы отношений? 3. Какова должна быть детальность словаря? Решение первой проблемы в основном базируется

нонимии, омонимии, полисемии, а также информативности слов, косвенным показателем которой является частота их встречаемости в текстах. Лингвистические исследования показывают, что распре-деление слов по их частоте вхождения в текст для достаточно больших текстов заданного тематического профиля подчиняется закону, близкому к гиперболическому. Высокочастотной части этого распределения соответствуют «общие» слова, не несущие существенной смысловой нагрузки в текстах данной совокупности. Низкочастотной части распределения соответствуют новые специ-

– 187 –

Page 188: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

фические термины, не нашедшие распространения в текстах сово-купности.

С учетом сказанного принципы отбора слов при решении пер-вой проблемы состоят в следующем:

• не включать в словари редких терминов; • исключ аемо-

сти;

ч

ровав; менять в том значении, которое

еских и синтагматических отношений, ис-спо-

числа и усложнением

тво-

рей не дол

ка — конкретное решение.

Степень детализации словаря определяе полноту и точность поиска. Широко употребляемые термины дают большую полноту, но низку

ии словарей необходимо учиты-вать заданные ограничения на желаемую полноту и точность поис-ка, а также иметь иерархию словарей и исп ьзовать их различные уровни при поиске информации по разным запросам.

ать общие понятия с высокой частотой встреч

• в каждый класс понятий вводить слова только с одинаковой частотой встре аемости;

• использовать только устойчивые слова и словосочетания; • исключать незначащие (в пределах данных текстов) слова,

тщательно их проанализи• неоднозначные термины при

они имеют в данном массиве. Типы парадигматич

пользуемых в ИПЯ, определяют его смысловыразительную собность, которая возрастает с увеличением типов учитываемых отношений.

Основные принципы, которыми необходимо руководсваться при выборе таких отношений:

• затраты на разработку, ведение и использование словаекта от их применения; жны превышать эфф

• выбор типов отношений зависит от предполагаемых целей и областей использования ИПЯ и определяется необходимой полно-той и точностью поиска информации;

• перед переходом к учету синтагматических отношений необ-ходимо исчерпать возможности парадигматики.

Это связано с тем, что парадигматика позволяет найти областьрешений, а синтагмати

т

ю точность поиска. При выборе степени детализац

ол

– 188 –

Page 189: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

Одной из актуальных задач информационно-поисковых систем является поиск аналогов. Сложность этой проблемы заключается в том, что по поисковому образу запроса, выраженному в терминах одной области знаний или отрасли техники, необходимо найти до-кум

асти знаний. Возникает межязыковой барьер совмести-мос

нципе организации словарей, т. е. в построении одноименных фасет в словарях всех областей знаний и метафасет или трансляторов перевода терминов од-ной области знаний в термины другой области знаний в пределах

проблемы состоит в

ис-пользуются следующие:

• количество типов словарей;

; мики роста словаря;

• средняя длина лексической единицы словаря; • среднее число символов в лексической единице словаря; • коэффициент динамики роста словаря; • ранговое распределение лексических единиц словаря. Полнота словаря Рассмотрим ИПЯ конкретной АИПС, обслуживающей задан-

ную ий данной пред-мет

ИПЯ

ент-аналог, поисковый образ которого выражен в терминах другой обл

ти профессиональных языков. Один из путей преодоления та-кого барьера состоит в фасетном при

для

заданного фасета. Другой путь решения той жепостроении иерархического комплекса словарей, охватывающего все области знаний.

Количественные характеристики словарей

Эффективность информационного поиска в значительной мере определяется уровнем качества словарей информационно-поискового языка ЛИПС. Качество словарей можно характеризо-вать различными показателями. Наиболее часто для этой цели

• число лексических единиц словарей; • полнота словаря; • коэффициент отображения лексики поискового массива• коэффициент дина

предметную область. NI — общее число понятной области, которые могут быть построены из лексических

единиц ИПЯ (N ) по правилам их образования в данном ИПЯ.

– 189 –

Page 190: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

Тогда коэффициент полноты словаря можно определить отноше-нием N к N . ИПЯ I

,0 1IС С

ИПЯNN

П = П≤ ≤ .

На практике используют:

1 1,0 1CС С

ONN

П П= ≤ ≤ ,

где NO — количество лек ниц словаря, по которым должен проводиться поиск я по общему количеству

еских единиц в словаре. при динамическом построении

сло

сических еди (определяетс

несовпадающих лексических единиц массива запросов); NC — ко-личество лексич

Эти показатели особенно важныварей. Коэффициент отображения лексики поискового массива.

Данный коэффициент определяется:

DM

C

NK

N= ,

где длине словосочета-

ний Средняя длина словосочетаний, используемых в ИПЯ в качест-

а-о-

выразитсльной способности ИПЯ. Для характеристики ИПЯ с этой точки зрения ис четаний

ND — количество дескрипторов в словаре. Распределение лексических единиц по

ве лексических единиц (ЛЕ), характеризует степень прекоординции ИПЯ, и, тем самым, является важной характеристикой смысл

пользуют распределение длин словосо

1 2( , ,..., ), lg m l

KF F g g g g

m= = ,

где Kl — количество лексических единиц, содержащих l слов; m — максимальная длина словосочетания в ИПЯ (в числе слов).

Средняя длина ЛЕ

– 190 –

Page 191: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

1

1 1

1

g

m

lm ml

ср l l ml l

ll

lKg l g

K

=

= =

=

= =

∑∑ ∑

∑.

Распределение ЛЕ по количеству символов Длину лексических единиц ИПЯ можно характеризовать рас-

пределением

( )1 2, , , , , , /C i n iF F C C C C C B= … … = i n ,

где Bi — количес n — максималь-ное

иче

тво ЛЕ, содержащих i символов; число символов в ЛЕ. Среднее число символов в лекс ской единице

1ср

i=∑ ∑C C

C =1i=

i iiB B .

коэффициентом

где

е слов ИПС. Обозначим F(x) — частоту

вствар

мера, т. е. если , , ,V x x x= … , тоием слов

Ф(n

Динамика роста словаря характеризуется

K = S / D, d d

Sd — количество ЛЕ, введенных в словарь в процессе обработки D документов.

Ранговое распределениПусть V = {x} — словарь речаемости слова х во всех текстах массива. Перенумеруем сло-ь так, чтобы частота слова F(x) была невозрастающей функцией

его но { } ( ) ( ) ( )1 2 mF x F x F x≥ ≥ . 1 2 m

Назовем функцию Ф(n)=F(xn) ранговым распределенF x F x f f) = { ( 1), …, ( n)} = { 1,… n}.

Показано, что частота слова n-го ранга fn связана с частотой слова 1-го ранга следующей зависимостью:

1n

ff

nγ= ,

– 191 –

Page 192: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

где

естественного язы

ия сильно отл общий состав и структуру не признаков поз

по пяти наи-бол

руемости различают СИ:

n — ранг слова; γ — число, определяемое экспериментально.

§ 4. ëàëíÖåõ àçÑÖäëàêéÇÄçàü

Индексирование — процесс перевода текстов ка на ИПЯ. Индексирование базируется на совокупности инст-

рукций, детально описывающих процесс индексирования и пред-ставляющих собой комплекс правил, включающих и правила при-менения ИПЯ.

Система индексирования (СИ) — совокупность методов и средств перевода текстов с ЕЯ на ИПЯ в соответствии с заданным набором словарей лексических единиц и с правилами применения ИПЯ. Помимо правил применения ИПЯ, система индексирования может включать большое разнообразие инструкций, положений, методов и т. д., регламентирующих те или иные этапы процесса индексирования. Существующие системы индексирован

ичаются друг от друга, и описать ихпредставляется возможным. Однако наличие общихволяет дать системное представление о классах систем индек-

сирования.

Типы систем индексирования

Рассмотрим технологию систем индексированияее важным основаниям [122]. 1. По степени автоматизации процесса индексирования

можно различать системы: а) ручного индексирования; б) автоматического индексирования; в) автоматизированного индексирования. Наиболее широко распространены автоматизированные СИ. 2. По степени контролиа) без словаря (может быть факультативное использование сло-

варей); б) с жестким словарем; в) со свободным словарем.

– 192 –

Page 193: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

Данное разбиение СИ определяется типом используемого ИПЯ. 3. По характеру алгоритма отбора слов текста могут быть

СИ: а) с последовательным просмотром текста; б) эвристическими процедурами выбора слов текста;

а отбираются интуитивно или

роля существу-ют си

.

в) статистическими процедурами выбора слов. В случае (а) отбираются все полнозначные слова, в случае (в) —

только информативные слова в соответствии с распределением частот их употребления, в случае (б) слов

по заданной процедуре. 4. По характеру лексикографического контстемы:

а) без лексикографического контроля; б) с полным контролем; в) с промежуточным контролем. Лексикографический контроль предусматривает: • устранение синонимии, полисемии и омонимии на основе

нормативных словарей лексических единиц с парадигматическими отношениями между ними;

• приведение всех слов к нормальному виду на основе морфо-логических нормативных словарей.

В системах с полным контролем реализуются обе функции лек-сикографического контроля. В СИ с промежуточным контролем эти функции реализуются частично

5. По характеру морфологического анализа слов различают СИ с морфологическим анализом с использованием:

а) морфологических словарей; б) основных лексических словарей; в) морфологического анализа с усечением слов. Возможны системы индексирования без морфологического

анализа.

Примеры систем индексирования

Системы свободного индексирования [122]. Процесс индек-сирования состоит в следующем. Индексатор выписывает слова

– 193 –

Page 194: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

или

тся только те слова, кото-рые

стическое кодирование путем усечения слов по

за, лекси-гра

словосочетания, которые, по его мнению, отражают содержа-ние текста. Он может брать слова, отсутствующие в тексте, но важные, с его точки зрения, для выражения смысла текста. Такие слова он может брать из своей памяти, любых словарей, энцикло-педий, вообще любых текстов. Отобранный список слов является поисковым образом текста.

Системы полусвободного индексирования. В данном случае процесс индексирования аналогичен вышеописанному, но слова сформированного списка сравниваются со словарем, несовпадаю-щие слова отбрасываются и в ПОД не включаются.

Системы жесткого индексирования. При этом слова выписы-ваются только из текста. В ПОД включаю

есть в словаре. Перед включением термина в словарь прово-дится его морфологическая нормализация на основе основных лексических словарей.

Системы статистического автокодирования. Слова выбира-ются из текста по заданным статистическим процедурам, после че-го проводится их стати

алгоритмам позиционной статистики. Существует большое разнообразие других СИ.

Морфологический анализ и нормализация понятий

Основные этапы процесса индексирования состоят в выборе понятий текста, отражающих его основное смысловое содержание, в морфологическом анализе и лексиграфическом контроле ото-бранных понятий и их кодировании.

Процедура отбора информативных понятий текста аналогична процессам выбора понятий при построении словарей основных лексических единиц.

Рассмотрим суть процедур морфологического аналифичсского контроля и кодирования понятий при использовании

различных видов словарей. Процедура морфологического анализа по морфологическим

словарям состоит:

– 194 –

Page 195: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

1) в определении обобщенного грамматического класса слова и его членении на основу и окончание (по словарям основ и оконча-ний

ределении номера набора грамматической информации к сл

мматической информации. тем их

заме каждой буквы слова соответствующим кодом

дансловарю лексических единиц и замене их но-

мер

ствление слов словосочетания с элементами словаря сло

ния). 3. Поиск по словарю номера словосочетания, соответствующего

данному сочетанию слов и грамматической ктуре ко-дируемого сло

); 2) в идентификации рода существительных (по основам слов); 3) в выявлении номера флексивного класса слов (по обобщен-

ному грамматическому классу, признаку рода, окончанию, конеч-ным буквосочетаниям основы);

4) в опову. Результатом такого анализа является нормализованное слово

и номер набора его граКодирование нормализованных слов осуществляется пуены буквенными кодами или кодами слов. В мерном случае оно

состоит в заменной буквы (по словарю кодов букв). Во втором случае — в ото-

ждествлении слов по ами или кодами словаря. Декодирование слов, осуществляемое при выдаче результатов

поиска, состоит в формировании буквенного кода слова (а затем и самого слова) по номеру или коду eго нормализованной части и по номеру соответствующей грамматической информации.

При использовании словосочетаний процедура морфологиче-ского анализа существенно усложняется:

1. Отождев. Замена их номерами по словарю. Сопровождение граммати-

ческой информацией. 2. Выявление грамматической структуры словосочетания в це-

лом — синтаксический анализ (по грамматической информации слов словосочета

номеров струвосочетания.

4. Выбор из словаря по номеру словосочетания соответствую-щего ему номера грамматической структуры и самой структуры. Сравнение выбранной грамматической структуры с грамматиче-

– 195 –

Page 196: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

ской структурой кодируемого словосочетания, полученной на вто-ром этапе.

Если структуры совпадают, то понятия тождественны. Анали-зируемое словосочетание заменяется соответствующим ему номе-

тся этапами семантиче-

словаря по номеру словосочетания соответствующе-

(по грамматической стр

буквенного кода словосочетания и самого

анализ по словарям основных лексических

впадающего понятия), выявление ном

ятий (по

з путем усечения слов. При этом используются различные про

ания и д

усе-чен

ром или кодом. Два последних этапа являюского анализа.

Декодирование словосочетаний представляет собой: 1. Выбор из

го ему набора номеров слов и номера грамматической структуры. 2. Извлечение информации о формах слов и их связях, восста-

новление порядка слов в словосочетанииуктуре). 3. Формирование

словосочетания. Морфологический

единиц включает два этапа: сравнение слова со словарем (иденти-фикация и определение номера со

ера набора грамматической информации понятия. Кодирование понятий осуществляется буквенным кодом или кодами понсловарю).

В современных ИПС широко применяется морфологический анали

цедуры усечения: а) с использованием словарей (основ, окончаний и т. д.); б) без использования словарей (по простейшим априори задан-

ным правилам); в) статическое усечение слов с использованием аппарата пози-

ционной статистики. В случае а) процедуры морфологического анализа, кодировекодирования те же, что и при использовании морфологических

словарей. В случае б) начала и (или) окончания слов усекаются по определенным правилам. Усеченные части слов кодируются бук-венными кодами. Декодирование отсутствует. В случае в) при

ии слов используется аппарат и словари позиционной статисти-

– 196 –

Page 197: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

ки. и, а декодирование тоже

в проводится только их нормализация и не-

ксирования и здесь целесообразно говорить о морфологи-нь

оответствующих подзапро-сам

Слова кодируются буквенными кодамотсутствует.

При усечении сломорфологический анализ. Однако в целях единства описания сис-тем индеческом анализе, имея в виду самую низшую (нулевую) степетакого анализа.

§ 5. èéàëäéÇõâ ÄèèÄêÄí Äàèë

Технология функционирования АИПС состоит в переводе со-общений (документов, текстов) и информационных запросов на ИПЯ (формировании поисковых образов документов и запросов), сравнении ПОЗов и ПОДов и выдаче пользователям АИПС сооб-щений, отвечающих их информационным потребностям.

При переводе сообщений на ИПЯ возможны различные под-ходы:

Я; • полный перевод сообщения на ИП• частичный перевод сообщения на ИПЯ (перевод на ИПЯ

только отдельного элемента сообщения, например, его названия или реферата);

• полный отказ от перевода на ИПЯ и использование в процес-се поиска оригинального сообщения или его составляющих (текста, аннотации, заглавия, реферата и т. д.).

Перевод запросов на ИПЯ тоже может быть выполнен в раз-личных вариантах:

• перевод всего информационного запроса на ИПЯ и формиро-вание единого ПОЗа;

• перевод отдельных составляющих на ИПЯ и формирование поисковых образов подзапросов.

Поисковое предписание (ПП), т. е. задание АИПС на поиск ин-формации тоже может быть сформулировано по-разному:

• формулировка единого ПП, соответствующего единому ПОЗу; • формулировка нескольких ПП, с.

– 197 –

Page 198: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

Причем в несколько ПП может быть развернуто и единое ПП. Процедура сравнения ПОЗов (или ПП) и ПОДов и принятия

решений о выдаче или невыдаче пользователям АИПС тех или иных сообщений тоже характеризуются большим многообразием. Такое многообразие определятся многими факторами и, прежде всего, возможностями использования при формировании ПП логи-ческ НЕих операций И, ИЛИ, и различных критериев выдачи.

Организация и используемые методы и средства реализации процессов индексирования документов и запросов и проведения собственно поиска оказывают основополагающее влияние на эф-фек

сть методов и средств реализации процесса поиска инф

я и поиска информации;

• методы и средства структурирования информационных за-про

Математический аппарат формализованного представления и поиска информации

иска в соче-тан арата теории нечетких множеств.

лагается, что:

анным» набором лексических единиц

тивность поиска и, соответственно, эффективность АИПС. Совокупноормации в автоматизированных ИПС назовем аппаратом поис-

ка, или поисковым аппаратом. Поисковый аппарат АИПС включает: • математический аппарат формализованного представлени

сов; • критерии выдачи (смыслового соответствия) информации; • стратегии поиска и организации массивов.

Функционирование АИПС предполагает наличие аппарата фор-мализованного представления и сравнения информационных со-общений и запросов, т. е. средств описания как сообщений и запро-сов, так и самого процесса поиска. Существующие в настоящее время средства представления и обработки информации базируют-ся на принципах координатного индексирования и по

ии с использованием аппТем самым предпо1) основное смысловое содержание документов и запросов мо-

жет быть выражено «взвеш

– 198 –

Page 199: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

(де

потоков, массивов, баз данных и т. д., могут быт

ана степень принадлежности данному мно

Обычно полагают, что μa(t) лежит в интер е [0, 1].

. С э

ое множество а — нормально, в про

ество a , для которого

скрипторов, ключевых слов, словосочетаний, рубрик, атомар-ных понятий и т. д.) ИПЯ, т. е. нечетким множеством;

2) операции поиска информации, так же, как и любые иные опе-рации преобразования

ь представлены в терминах нечетких отношений. Рассмотрим основные элементы теории нечетких множеств

и отношений. Пусть Т — совокупность элементов (объектов, признаков,

точек). Нечеткое множество а — совокупность элементов из Т, для каждого из которых зад

жеству а. Более строго, нечеткое множество а есть совокуп-ность упорядоченных пар < t, μa(t) >, т. е. a = {< t, μa(t) >}, t ∈ T, где μa(t) — мера принадлежности t к а.

валПричем, если μa(t) = 0, то t не принадлежит а, если μa(t) = 1, то t

полностью принадлежит а. Если μa(t) принимает только два значе-ния — 0 или 1, то а — обычное (четкое) множество a = {t|μa(t) = 1}

той точки зрения понятие «множество» является частным слу-чаем понятия «нечеткого множества». Рассмотрим основные опе-рации над нечеткими множествами.

Если Suptμa(t) = 1, то нечетктивном случае а субнормально. Любое субнормальное множе-

ство а можно нормализовать делением всех μa(t) на Suptμa(t). Дополнением к a является нечеткое множ ′

μa′ = 1 — μa. Пересечение нечетких множеств a и b (a∩b) определяется как

нечеткое множество с, состоящее из элементов, содержащихся как в a, так и в b одновременно с функцией принадлежности

( ) ( ) ( )

( ){ }min , , ,

, .a b a b

a b

m t t t t T

c t t a b∩

⎡ ⎤= μ μ ∈⎣ ⎦

= < μ > = ∩

– 199 –

Page 200: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

Объединение нечетких множеств a и b (a∪b) определяется как нечеткое множество, состоящее из элементов, содержащихся в b или в а, или в b и в а одновременно с функцией принадлежности

( ) ( ) ( )

( ){ } max , , ,

, .a b a b

a b

m t t t t T

c t t a b∪

⎡ ⎤= μ μ ∈⎣ ⎦

= < μ > = ∪

Очевидно, что если μa(t) и μb(t) принимают только два значения (0 или 1), то рассмотренные операции являются операциями обыч-ных (четких) множеств.

Алгебраическое произведение нечет их множеств а и b (ab) есть нечеткое множество с функцией принадлежности

(t) = (t) (t), t

к

фун

ния ассоциа-тив

Системами нече с системами чет-ких множеств, будем ожества, элемен-ты являются нечеткими множествами:

μab μa μb ∈ T, c = {< t, (t) >}. μab

Алгебраическая сумма a и b (a⊕b) есть нечеткое множество с ци й принадлежности к еμa⊕b(t) = μa(t) + μb(t) – μa(t) μb(t), t ∈ T. Приведенные операции объединения и пересечены и дистрибутивны по отношению друг к другу. Операция ал-

гебраического произведения и суммы ассоциативны, но не дистри-бутивны друг к другу.

Два нечетких множества а и b равны между собой (а = b), если μa(t) = μb(t) для всех t∈T. Если для всех t∈T μa(t) ≤ μb(t), то а со-держится в b.

В частном случае, если μR(a, b) принимает только два значе-ния — 0 или 1 для всех пар (a, b), то R — отношение с упорядочен-ными парами <a, b> ∈ R.

тких множеств А, по аналогии называть такие нечеткие мн

которых сами{ } { }, ( ) , , , 1,..., .a iA a a a a a a i M= μ ∈ = =

Декартовым (прямым) произведением систем нечетких мно-же в А и В A = {<a, μa(a)>}, B = {<b, μ , будем называть мно-жество пар исходных множеств C = {<a, μa(a)>,<b, μb(b)>} = A×B. ст b(b)>}

– 200 –

Page 201: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

Нечеткое множество R на прямом произведении множеств A×B есть нечеткое множество R с функцией принадлежности μR(a,b), явл

ti}, i = 1, … N, достаточное для описания всех

информацион

Используя аппа информационное сообщение мно

иль информационной потребности и т.

ости) Lδ к а, ости Lδ информаци-

яющейся характеристикой меры принадлежности пары (a, b) к R, т. е. R = {<(a, b), μR(a, b)>}.

Приведенный аппарат нечетких множеств является основой формализованного представления документов, запросов, баз дан-ных и процессов информационного поиска.

Словарем информационной среды назовем множество лекси-ческих единиц T = {информационных объектов (документов, сообщений, запросов, баз данных и т. д.) и процессов (поиска, распределения БД и т. д.) ин-формационной среды.

Словарь Т, так же, как и тезаурус, является моделью коллектив-ных знаний и может быть использован для описания различных

ных объектов. рат нечетких множеств, любое

(документ, запрос) может быть представлено нечеткимжеством, т. е. множеством лексических единиц с мерами их при-

надлежности данному сообщению: сообщение Lδ — нечеткое мно-жество Lδ = {<t, μLδ(t)>}, t∈T, μLδ(t) — мера принадлежности t к Lδ.

Элементарным информационным профилем будем называть некоторое нечеткое множество a = {<t, μa(t)>}, t∈T, где μa(t) — мера принадлежности t к А. Профилю а могут быть поставлены в соответствие такие объекты, как профиль издательства, библиоте-ки, поисковый образ документа или запроса, тематическая рубрика некоего рубрикатора, проф

д. Будем говорить, что сообщение Lδ релевантно профилю а и

обозначать этот факт: Lδ Rα a, если выполняется условие μ(a, Lδ) ≥ α,

где Lδ = {<t, μLδ(t)>}, t ∈ T, μ(a, L ) — мера релевантности (семантической близδ

rα = r [μ(a, L ) ≥ α] — критерий релевантнα δ

онному профилю а,

– 201 –

Page 202: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

α — пороговое значение критерия релевантности. Будем говорить, что на прямом произведении нечетких мно-

жеств A×L, A = {<a, μA(a)>} L = {<Lδ, μL(Lδ)>} установлено отно-шение нечеткой релевантности, если оно порождает систему не-чет

шение нечеткой релевантности R в

ких множеств R с элементами c = <(a, Lδ), μR(a, Lδ)>, т. е. R = <(a, Lδ), μR(a, Lδ)>, где μR(a, Lδ) — мера релевантности А и Lδ.

Отношение Rα, заданное на прямом произведении систем не-четк × их множеств L А мерой релевантности μR(a, Lδ) и пороговым значением α = {αi}, i = 1, … M, назовем отношением релевантности:

Rα = {<(Lδ, ai)|μδ(Lδ,ai)≥αi>}.

Выражение ( , ) , 1, ...,i i R i ir r L a i Mα α δ⎡ ⎤= μ ≥α =⎣ ⎦ представляет

собой критерий релевантности сообщений Lδ информационному профилю αi и разбивает совокупность сообщений L по отношению к ia на подмножество релевантных (

i iL R aδ α ) и нерелевантных со-общений, переводя тем самым отно

отношение релевантности (отношение Rα можно рассматривать как α — уровень отношения R).

Отношения релевантности и нечеткой релевантности лежат в основе поискового аппарата АИПС. Именно на них базируются всепроцессы индексирования и поиска информации. Однако АИПС, построенные только на основе введенных формальных отношений релевантности не могут обладать высокой эффективностью в силу того, что их ИПЯ не учитывает парадигматических и синтагмати-ческих отношений.

В связи с этим в реальных АИПС существует большое много-образие средств и методов формализованного представления (в общем случае структурирования) информационных запросов, критериев релевантности, методов и стратегий поиска информации.

Методы и средства структурирования информационных запросов

– 202 –

Page 203: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

В основе формирования поисковых образов документов и а-просов, предписаний на пои

зск информации лежат базисные (пара-

дигительно существующие и независимые от контек-

ста

проса.

ват

матические) отношения между понятиями. Такие отношения, отображая действ

взаимоотношения между предметами и явлениями, позволяют на основе содержательного анализа сообщений и запросов допол-нять их поисковые образы терминами, отсутствующими в индекси-руемых текстах и более точно отображающих смысловое содержа-ние индексируемых текстов.

Информация о базисных отношениях понятий содержится в информационно-поисковом тезаурусе (ИПТ) АИПС, который и яв-ляется основой формирования поисковых образов запросов.

Процесс формирования ПОЗа включает следующие этапы: • выявление информационной потребности и формулировка

информационного запроса на естественном языке; • выявление значимых терминов запроса; • перевод значимых терминов на ИПЯ; • формирование поискового образа заПри выявлении значимых терминов запроса могут использо-ься как основная, так и внешняя информация, которую можно

извлечь из аналогичных запросов, релевантных документов, тезау-русов, специальной литературы.

Перевод значимых терминов на ИПЯ заключается в замене ключевых слов и словосочетаний (значимых терминов) дескрипто-рами информационно-поискового тезауруса. При этом могут ис-пользоваться любые парадигматические отношения в ИПТ.

Использование базисных отношений позволяет уточнить или, наоборот, расширить запрос. Для расширения запросов используют дескрипторы более высоких уровней иерархии отношений род–вид и целое–часть (иерархических отношений). Для уточнения запроса, наоборот, используют дескрипторы низших иерархических уров-ней тезауруса.

АИПС без словарей (с неконтролируемой лексикой) не требуют перевода значимых терминов в дескрипторы ИПЯ. Здесь лексиче-

– 203 –

Page 204: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

скими единицами ПОЗа являются сами значащие термины, т. е. ключевые слова и словосочетания.

Формирование ПОЗа. Задача состоит в том, чтобы сформиро-вать ПОЗ в такой логико-семантической записи, смысловое содер-жание которой как можно ближе соответствует смысловому со-держанию запроса.

просы, каждому из которых

Простейшая форма такой записи, в соответствии с рассмотрен-ным ранее аппаратом нечетких множеств, — представление ПОЗа четким или нечетким множеством, выявленным на предыдущем этапе лексических единиц (дескрипторов, ключевых слов или слово-сочетаний): ПОЗ = {<t, μa(t)>} или ПОЗ = {<t|μa(t) = 1>}, t ∈ T, где {t}… — упорядоченные по алфавиту дескрипторы, ключевые слова (словосочетания), выражающие смысловое содержание запроса. Парадигматические отношения в такой записи ПОЗа в явном виде отсутствуют. Синтагматические отношения выражаются лишь на-личием или отсутствием в ПОЗе тех или иных лексических единиц.

Для более полного учета парадигматики и сингматики инфор-мационного запроса при формировании ПОЗа используют аппаратбулевой логики. В этом случае ПОЗ представляется некоторым ло-гическим выражением, например:

ПОЗ = [(t1∧…∧tk)∨… ∨ (tj∧…∧tl)] ∧…∧ [(tm∧…∧tn) ∨ (tp∧…∧tr) ∨¬(tα∧…∧tβ)].

Здесь ∧, ∨,¬ — операторы булевой логики И (AND), ИЛИ (OR), НЕ (NOT).

Такая форма записи ПОЗа повышает степень адекватности смыслового содержания ПОЗа информационному запросу, но су-щественно усложняет как процесс формирования ПОЗа, так и про-цесс диалогового поиска. Для упрощения этих процессов информа-ционный запрос расчленяет на подзапросы, а ПОЗ, соответственно, на поисковые образы подзапросов (ПОПЗ). При этом подзапросы формулируют таким образом, чтобы соответствующие им поиско-вые образы имели простую логическую структуру и могли быть сформированы с использованием только одного или двух логиче-ских операторов И, ИЛИ, НЕ. Например, если в предыдущем при-мере расчленить запрос на такие подза

– 204 –

Page 205: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

соответствует одно представленных в кру

с

из логических выражений, глых скобках приведенного ранее ПОЗа, то поисковый образ

запроса будет представлен выражением:

ПОЗ = [ПОПЗk∨…∨ПОПЗl)]∧…∧[ПОПЗn) ∨ПОПЗr∨¬ПОПЗβ].

Поиск по сложным булевым выражениям требует много време-ни. Для ускорения процесса поиска сложное логическое выражение путем разбивки па подзапросы можно существенно упростить. Более того, можно показать, что поиск по определенным группам логических выражений можно свести к поиску по простому множе-ству лексических единиц, если каждой из ЛЕ присвоить определен-ный вес и проводить поиск с учетом весов ЛЕ, т. е. проводить поиск в соответствии с моделью нечетких множеств. Такой поиск носит назв оание весов го поиска, или поиска по весовой логике. Сущест-вуют таблицы перехода от булевых форм ПОЗов к простым ПОЗам, выраженным в терминах нечетких множеств, когда ПОЗ представля-ется набором лексических единиц с их весовыми коэффициентами (весами), указывающими вес данной ЛЕ в данном ПОЗе.

В качестве ЛЕ ПОЗа могут выступать и поисковые образы под-запросов. Это позволяет любое сложное логическое выражение свести к совокупности ПОЗов, выраженных в терминах нечетких множеств: сложное выражение ПОЗа разбивается на поисковые образы подзапросов, каждый из которых переводится в нечеткое множество с элементами — поисковыми образами подзапросов. Сформированное нечеткое множество является поисковым образом запроса в целом.

Мощным сред твом повышения семантической силы ИПЯ засчет учета синтагматики информационного запроса является ис-пользование отношения непосредственного следования лексиче-ской единицы А за лексической единицей В. Указание в ПОЗе по-рядка следования ЛЕ в искомых текстах позволяет повысить точность поиска за счет усиления предкоординации ИПЯ. Отноше-ние непосредственного следования отражается в ПОЗах соответст-вующим оператором. В англоязычных ИПС обычно используют оператор ADJ или adj. Запись ПОЗа в виде BadjA означает, что в ответ на запрос будут выданы только документы, тексты или ПОДы

– 205 –

Page 206: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

которых содержат термин А, следующий непосредственно за тер-мином В.

Не менее важным средством повышения качества поиска явля-етс

) лекси-чес

С обычно используют оператор AD

сечение» лексических единиц ПОЗа, т. е. отбрасывание за-дан

терий релевантности

анным поисковым образом запроса (или выборки докумен-тов

ерия смыслового соответствия (КСС), или кри

ную релевантность.

я «усечение» лексических единиц ПОЗа, т. е. отбрасывание за-данного числа первых и (или) последних символов (знаков

кой единицы ПОЗа. Такое усечение позволяет игнорировать при поиске многообразие приставок и (или) окончаний слов и тем са-мым повысить эффективность поиска искомых текстов, точность поиска за счет усиления предкоординации ИПЯ. Отношение непо-средственного следования отражается в ПОЗах соответствующим оператором. В англоязычных ИП

J или adj. Запись ПОЗа в виде BadjA означает, что в ответ на за-прос будут выданы только документы, тексты или ПОДы которых содержат термин А, непосредственно следующий за термином В.

Не менее важным средством повышения качества поиска явля-ется «у

ного числа первых и (или) последних символов (знаков) лекси-ческой единицы ПОЗа. Такое усечение позволяет игнорировать при поиске многообразие приставок и (или) окончаний слов и тем са-мым повысить эффективность поиска.

Кри

Формированием поискового образа запроса и переводом его в машиночитаемую форму заканчивается один из важнейших этапов процесса поиска информации — этап предмашинной обработки запроса. Следующий этап — непосредственно процесс автоматизи-рованного поиска информации, состоящий в сравнении ПОДов со-общений (документов) базы данных АИПС с зад

их совокупности) с целью (сообщений), релевантных информационному запросу. Крите-

рий, позволяющий принять решение о релевантности сообщения информационному запросу, носит название критерия релевантно-сти (КР), или крит

терия выдачи (KB). Различают два понятия релевантности — релевантность и

формаль

– 206 –

Page 207: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

Понятие релевантности связано со смысловым соответствием сообщения (документа) тексту информационного запроса на есте-ственном языке. Релевантность сообщения запросу в таком пони-мании может оценить только человек. Критерий, которым он при этом пользуется при принятии решения о релевантности, сформу-лировать невозможно.

Формальная релевантность — соответствие ПОДа ПОЗу. По-ско

вантности может дать компьютер. Однако для ходимо задать ему формальное выражение критерия рел

н-ный ПОД, воз

я потребителя. Однако альтернативы нет, АИПС может пользоваться только понятием формальной релевантности. Задача в том, чтобы сфо ерий формальной релевантности, кото-рый бы как можно лучше различал релевантные сообщения от не-релевантных. В дальнейшем под терминами КР, КВ и КСС мы бу-дем понимать критерии формальной релевантности.

Критерий релевантности [14] — совокупность процедур (пра-вил) определения смыслового соответствия ПОДа ПОЗу.

Для задания критерия релевантности в простейшем случае дос-таточно задать процедуру вычисления меры семантической близо-сти ПОДа ПОЗу и некоторое пороговое значение этой меры, такое, что если эта мера, вычисленная для конкретных ПОДа и ПОЗа пре-вышает заданное пороговое значение, документ признается ре-левантным запросу (и наоборот).

Исходя из того, что в большинстве реальных АИПС поисковые обр кументов представляются чет-

х единиц, мера реле- близости нечетких мно-

жеств.

льку ПОД и ПОЗ представляют собой формализованные струк-туры, оценку такой реле

этого необевантности. При переводе информационной потребности в информацио запрос, а запрос в ПОЗ, как при переводе сообщения в никают определенные семантические искажения. В связи с этим

формальная релевантность весьма существенно отличается от дей-ствительной релевантности. Документ, признанный системой фор-мально релевантным, может не оказаться таковым с точки зрени

рмулировать такой крит

то

азы запросов (подзапросов) и докими или нечеткими множествами лексическивантности может быть задана как мера

– 207 –

Page 208: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

Мерой релевантности μR(a, b) (соответствия или нечеткого ра-венства) двух нечетких множеств a и b будем считать неотрица-тел

2) μR(a, b) = μR(b, a); 3) μR(a, b) = 0 зависит от нормы семантических векторов мно-

жеств a и b нормы семантического вектора их пересечения или про т использоваться любые нормы векторов, удов-летворяющие предъявленным к нормам требованиям). Под семан-тическим вектором μa нечеткого множества a = {<t, μa(t)>} здесь понимается вектор

μa = [μa(t1), μa(t2),…, μa(tN)].

Следовательно μa(a, b) есть функция от |μa|, |μb|, |μa∩b|, |μab|, т. е. μR( мож

a = (1, 1, 1, 0, 1, 0, 1 , 1, 0, 0), μ R(a, b) = 3. a = (0,3; 0,4; 1,0; 0,8 ,4), μ1 (a, b) = 0,86.

ьную вещественную функцию такую, что: 1) μR(a, b) = 0, если а и b не пересекаются;

изведения (могу

a, b) = f(|μa|, |μb|, |μa∩b|, |μab|). Под множеством а здесь и далеено понимать ПОД, под множеством b — ПОЗ, или наоборот.

Мера симметрична. Сформулируем некоторые меры релевантности нечетких мно-

жеств, используя различные виды норм и функциональных зависи-мостей.

1. В качестве скалярной свертки вектора μR(a, b) используем октаэдрическую норму, а функциональную зависимость зададим в виде f = |μab|. Тогда имеем меру:

( ) ( ) ( )1

1

,N

R a bi

a b t t=

μ = μ μ∑ .

Если a и b — четкие множества, то μ1R(a,b) — векторное произ-

ведение векторов a и b. Пример:

1, 1), b = (1, 1, 1, 1, 0), b = (0,8; 0,0; 0,3; 0 R

Неудобство данной меры в том, что она не нормирована.

– 208 –

Page 209: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

2. В качестве скалярной свертки векторов μa и μb используем евклидову норму, скалярной свертки векторов μa∩b μab — октаэд-рическу ю

и ю норму, а функциональну зависимость зададим в виде:

| || || |

ab

a bf

μ=μ μ

, | |

| || |a b

a bf ∩μ=

μ μ.

Тогда имеем две меры:

( )2 1

( ) ( ),

N

a i b ii

R

t ta b =

μ μ

μ =

∑,

2 2[ ( )] [ ( )]N N

a t tμ μ∑ ∑1 1i i= =

i b i

( )3 1

min[ ( ) ( )]a i b ii

R

t t=

μ μ

μ

∑N

2 2

1 1

[ ( )] [ ( )]N N

a i b ii i

t t= =

μ μ∑ ∑

В предыдущем примере имеем: 2

,a b = .

3. В качестве используем ок-таэ

• для случая четких а и b μ R(a, b) = 0,54, • для нечетких a и b μ2

R(a, b) = 0,66, где μ2

R(a,b) — нормировочная мера, 0≤μR(a,b)≤1. В теории ИПС эта мера релевантности получила название косинусной меры.

скалярной свертки всех векторовдричсскую норму, а функцию зададим в виде:

| || | | | | |

ab

a b abf

μ=μ + μ − μ

.

В этом случае:

( )4 1

1 1 1

( ) ( ),

( ) ( ) ( ) ( )

N

a i b ii

R N N N

a i b i a i b ii i i

t ta b

t t t t

=

= = =

μ μ

μ =

μ + μ − μ μ

∑ ∑ ∑.

– 209 –

Page 210: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

Для случая четких а и b предыдущего примера μ4R(a, b) = 0,37.

Для нечетких а и b μ4R(a, b) = 0,27. Для четких множеств μ4

R(a, b) является нормированной мерой (0 ≤ μ4

R(a, b) ≤ 1) и носит название меры Танимото. Для случая нечетких а и b указать диапазон изме-нения данной меры затруднительно.

В соответствии с определением меры релевантности можно по-строить достаточно большое число различных мер. Все они опре-дел

ваинимум, равный нулю, соответ-

сечения множеств (четких или нечетких), (идентичности). Максимум некоторых н единице, что является весьма важ-

ированными, в отличие от ненор-нице.

м пару:

ет я запросу.

Че ловия на-лагаются на смысловую близость документа запросу. В нормиро-ванных мер х при α = 1 для выдачи доку ента требуется полное совпадение ПОДа соответствующем Зу.

В практике информационного поис спользуют другие критерии. В астности:

1. На полное вхождение ПОЗа в ПО , т. е. если во a = ПОЗ, b = ПОД, то до ент считаетс елевантным, ли а ⊆ b.

ены в многомерном пространстве при любых координатах век-торов нечетких множеств и обладают свойст ми непрерывности, одн ченности. Мозначности и ограниствует отсутствию перемаксимум — их совпадению из рассматриваемых мер равеным. Такие меры называют норммированных мер, максимум которых не равен еди

Критерием смыслового соответствия назове

rα = < μR(a, b), α >,

где μR(a, b) — функция вычисления меры релевантности или про-сто мера релевантности, α — пороговое значение релевантности такое, что

( )( )

1, , ,0, , , .

R

R

при a b документ выдаетсяr

при a b документ не выдаетсяα

⎧ μ ≥α⎨=

μ <α⎩

Изменяя пороговое значение α, можно организовать эшелони-рованную выдачу. Каждый эшелон такой выдачи соответствуопределенной мере семантической близости сообщеним больше пороговое значение α, тем более жесткие ус

а м его у ПО

ка и ся и ч

Д множесткум я р ес

– 210 –

Page 211: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

2. На полное вхождение ПОДа в ПОЗ. Документ выдается, если b ⊆ а.

3. На полное вхождение ПОДа в ПОЗ (или наоборот) с учетом базисных отношений. Документ выдается, если каждому термину

ческими отношениями.

Оценка эффективности поиска

Оценка эффективности АИПС связана анализом как затрат еятельности,

воем не может быть выражена количественно, в особенности, если такие результаты носят социально-политический ический, мораль-ный, психологический и т. д. характер. Еще большие сложности воз

ктической невозможности оценки экономической эффективности АИПС при анализе АИПС приходится ограничи-ваться оценкой лишь функциональной эффективности. Под функ-циональной эффективностью системы понимают меру соответствия сисАИПС состоит в информационном обеспечении ее пользователей, т. е. в оперативном поиске необходимой им информаци

В связи с этим основными показателями функциональной эф-фективности

ПОЗа (ПОДа) соответствует либо тот же термин ПОДа (ПОЗа), ли-бо термин, связанный с ним парадигмати

4. На полное вхождение с учетом текстуальных и базисных от-ношений. То же, что и ранее, но сравнение проводится с точностью до совпадения текстуальных отношений терминов в ПОЗе и ПОДе.

сАИПС на информационное обеспечение основной дтак и эффекта, получаемого в основной деятельности в результате использования предоставляемой АИС информации. Однако «по-лезность» результатов основной деятельности в большинстве с

, юрид

никают при оценке той доли эффекта основной деятельности, которая получена в результате использования информации.

В силу пра

темы своему целевому назначению. Цель функционирования

и.

АИПС являются [14]: полнота поиска; • точность поиска; •

• оперативность поиска; • специфичность поиска;

– 211 –

Page 212: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

• коэффициент корреляции; • интегральный энтропийный показатель. Оценка любого показателя функциональной эффективности

ых док бщений) запросу может оценить либо сам потре-бит

документов — M1; ество нерелевант х документов — M2.

связана с определением неформальной релевантности выданной информации информационному запросу. Релевантность выданн

ументов (сооель информации, либо группа экспертов. Будем считать, что

такая оценка проведена и базе данных АИПС известны все сооб-щения, релевантные каждому запросу, т. е. множество документов БД по отношению к заданному запросу разделено на два подмно-жества:

• подмножество релевантных• подмнож ны

R R

M1 M2

B N1 a b

N2 c d B

Суть работы АИПС состоит в разбиении множествБД тоже на два подмножества:

а документов

• подмножество формально релевантных запросу документов (выдаваемых документов) — N1;

росу окумен-тов

Полнота поиска определяется отношением числа выданных рел доку-ментов массива (a + c):

• подмножество формально нерелевантных зап д (невыдаваемых документов) — N2.

евантных документов (а) к общему числу релевантных

, 0 1a

n na c

= ≤+

, ≤

где с — число невыданных релевантных документов.

– 212 –

Page 213: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

Точность поиска — отношение числа выданных релевантных документов (а) к общему числу выданных документов (a + b):

, 0 1a

T Ta b

= ≤+

≤ .

ецифичность поиска — отношение числа невыданных не-рел

Спевантных документов (d) к общему числу нерелевантных доку-

ментов (d + b):

, 0 1d

C Cd b

= ≤ ≤+

.

Коэффициент корреляции поиска определяется выражением:

, 1 1ad bc

r r−

= − ≤ ≤ . ( )( )( )( )a c b d d c a b+ + + +

В идеальной АИПС b = 0, с = 0 и r = 1. Интегральный энтропийный показатель АИПС можно р , способный изме-

нять энтропию поискового массива. Если допоисковую энтропию БД обозначить H0, а послепоисковую — Hn, то величина

ассматривать как инструмент

0 nH HW

H−

= 0

будет характеризовать меру упорядоченности состояния БД, яв-ляющуюся результатом процесса поиска по заданному запросу.

Обозначим: P0 — концентра в в исходном мас-

сиве документов М0; P1 — концентрация релевантных документов в массиве выдан-

ных документов;

ция релевантных документо

P2 — концентрация релевантных документов в массиве невы-

данных документов.

– 213 –

Page 214: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

Очевидно: 0a c

Pa b c d

+=+ + +

, 1 ,a c

P Pa

= = . 2b c d

)ln 1 ln 1H P P P P⎡ ⎤= + − − ,

+ +Согласно определению энтропии, неопределенность исходного

массива (до поиска) характеризуется величиной:

( ) (0 0 0 0 0⎣ ⎦

неопределенность массива выданных документов:

( ) ( )1 1 1 1ln 1 ln 1bH P P P P⎡ ⎤= + − −⎣ ⎦,

неопределенность массива невыданных документов:

( ) ( )2 2 2 2nb= + −⎣ ⎦

Мощность массива выданных документов равна

ln 1 ln 1H P P P P⎡ ⎤− .

0

a bM+

.

Мощность массива невыданных документов равна c dM+

. 0

Послепоисковая неопределенность базы данных:

00 0

b nba b c d

H H HM M+ +

= + .

Подставив полученные значения H0 и Hn в формулу для W, получим:

1 1 1 1 1 1 1 1

0 0 0 1 1

1 ( )( ln ln ) ( )( ln ln )( ln ln )

a b P P q q d c P P q qW

M P P q q− + + + + +

=+

,

где q P= −Энт до 1.

При

0 0 1 1 2 21 , 1 , 1q P q P= − = − . ропийный показатель изменяется в диапазоне от 0

веденные формальные выражения позволяют определить те или иные показатели технической эффективности АИПС по отно-шению к конкретному запросу. Чтобы получить аналогичные пока-затели как характеристики АИПС в целом, необходимо провести

– 214 –

Page 215: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

серию экспериментов по массиву запросов и усреднить получен-ные результаты.

При этом могут использоваться следующие формулы:

1

1 mi

i ii

m a c=

=+

∑ — средняя макрополнота;

1

1 mi

i ii

m a c=

=+

∑ — средняя макроточность;

1

1

( )

m

ii

m

i ii

a c

=

=

′=

+

∑ — средняя микрополнота;

1i

im

aТ =′=

∑m

1i i

i=

( )a b+∑ — средняя микроточность.

тально показано, что показатели пол дятся в обратно пропорциональ-ной ие полноты поиска в рамках данной ИП

точности поиска. И наоборот. сходной базе

дан

до-

Теоретически и эксперименноты и точности поиска нахо зависимости, т. е. повышенС всегда сопровождается снижением (по крайней мере неповы-

шением) Для определения релевантности документов в иных используются различные методы, позволяющие оценить

число релевантных (a + c) документов в БД не прибегая к анализу всей БД.

1. Случайная выборка некоторой части документов. Определе-ние доли релевантных документов в выборке и аппроксимация по-лученных данных на всю БД.

2. Использование запросов, ориентированных на поиск заранее заданных документов и определение в выдаче доли заданных

– 215 –

Page 216: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

кума.

ифици-

запроса релевантных документов выдачи.

ации поиска информации

вов в сущест-вен поиска информации. Это

свою очередь, оказывает большое влияние на объемы за-

ваны различные информационно-поисковые опе-рац

стоящее время разработаны и реализованы в действующих АИ ационно-поисковые операции.

адывает в эти операции что-то свое.

ельной величины. В то же время анализ показывает, что екоторой вполне ограниченной

цию, характеризующую-

ентов. Этим методом можно непосредственно оценить полноту поиск

3. Проведение серии поисков по последовательно модруемому запросу и определение накапливаемых в процессе моди-фикации

Организация массивов и опер

Организация информационно-поисковых массиной мере определяется механизмами

естественно, поскольку любой поисковый алгоритм может быть эффективен с точки зрения полноты, точности и оперативности только при определенной организации массивов. Организация мас-сивов, внимаемой памяти ЭВМ, оперативность поиска, сложность его реа-лизации, полноту и точность поиска.

В зависимости от поставленных поисковых задач в АИПС мо-гут быть реализо

ии.

Типология информационно-поисковых операций

В наПС самые разнообразные информ

Каждый разработчик заклВ результате число таких операций может достигнуть в ближайшие годы внушит

каждая ИПО характеризуется нсовокупностью признаков, определяющих ее содержание, структу-ру и условия реализации в конкретных АИПС. Следовательно, лю-бую ИПО можно рассматривать как операся некоторой единой для всех ИПО совокупностью существенных признаков. Конечно, многие нюансы и тонкости индивидуальных ИПО при таком подходе могут быть утеряны, но в то же время по-является возможность проведения сравнительного анализа различ-ных ИПО по тем или иным основаниям, анализа их достоинств,

– 216 –

Page 217: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

недостатков и, самое главное, условий реализации в конкретных

и

поисковых запросов.

ировки поисковых предписаний в процессе

ий по совокупности предложен-ных

й в систему;

АИПС и, соответственно, требований, предъявляемых к организа-ции массивов, методам доступа и т. д. Анализ показывает, что всю совокупность реальных ИПО можно характеризовать следующимнаиболее существенными признаками:

1. Временной интервал накопленного массива, в котором про-водится поиск.

2. Число одновременно обрабатываемых запросов. 3. Тип поисковых запросов. 4. Характер5. Характер обратной связи. 6. Число используемых ИПЯ. 7. Тип используемых ИПЯ. 8. Способ коррект

поиска. 9. Характер семантической организации массива. С учетом сказанного можно дать следующую типологию ин-

формационно-поисковых операц признаков: 1. По временному интервалу накопленного поискового массива: • ретроспективный поиск — поиск в массиве, накопленном за

некоторый период времени, превышающем интервал времени об-работки последних поступлени

• текущий поиск — поиск в массиве поступлений в АИПС. 2. По числу одновременно обрабатываемых поисковых запро-

сов: • индивидуальный поиск — поиск по одному запросу; • групповой поиск — поиск по нескольким запросам одновре-

менно. 3. По типу поисковых запросов: • поиск по разовым запросам; • поиск по постоянно действующим запросам; 4. По характеру поисковых запросов:

– 217 –

Page 218: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

• фактографический поиск — поиск, а точнее — выборка по заранее заданным признакам фактических данных, полностью -ответствующих поисковому предписанию (100%-я полнота и точ-нос

с обратной связью — интерактивный или диалоговый поиск.

6. По ч• одноязычный поиск;

лючевых слов, словосочетаний, деск-

оварем;

со

ть); • текстовый поиск (семантический или документальный по-

иск) — поиск текстов (сообщений, документов), релевантных в со-ответствии с заданным критерием смыслового соответствия поис-ковому запросу.

5. По характеру обратной связи: • поиск без обратной связи АИПС с пользователем; • поиск

ислу используемых ИПЯ:

• многоязычный поиск — поиск с использованием нескольких типов ИПЯ.

7. По типу используемых ИПЯ: • жесткоконтролируемый поиск — поиск с использованием

ИПЯ с жестким словарем (крипторов или иных лексических единиц);

• слабоконтролируемый поиск — поиск с использованием ИПЯ со свободным сл

• неконтролируемый поиск — поиск с использованием ИПЯ без словаря.

8. По способу корректировки поисковых предписаний в про-цессе поиска (способу реализации обратной связи):

• поиск без корректировки ПП; • поиск с ручной корректировкой ПП, выполняемый лицом,

проводящим поиск на основе анализа промежуточных результатов поиска, использования тезауруса, словарей, справочников и т. д.;

• поиск с автоматизированной корректировкой ПП, выполняе-мый лицом, проводящим поиск на основе анализа промежуточных результатов поиска и информации, выдаваемой для этой цели АИПС по заранее заложенным в нее алгоритмам реализации ИПО;

– 218 –

Page 219: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

• поиск с автоматической корректировкой ПП средствами ИПО.

9. По характеру семантической организации поискового массива: • поиск в семантически неорганизованных массивах — одно-

уровневый поиск — поиск в массиве, рассматриваемом как семан-тически однородный;

• поиск в семантически организованном массиве — много-уровневый поиск — поиск в массиве, семантически организован-ном в некоторую иерархическую, сетевую, реляционную, гипер-текстовую или иную структуру.

Приведенная типология видов информационного поиска позво-ляет детализировать реальные поис овые операции, вычленяя те из них, которые представляют интерес с точки зрения исследуемой проблемы, поскольку по сути дела проведенные виды поиска яв-ляются составляющими ИПО.

Например, текстовый (2а) диалоговый (5б) ретроспективный (2а) индивидуальный (2а) одноязычный (6а), поиск по разовым (3а) запросам в семантически неорганизованном массиве (9а) с исполь-зова

к

анной кор-рек

нием неконтролируемого ИПЯ (7б) с автоматизировйтировко поисковых предписаний (8б) включает в себя девять

составляющих [1а, 2а, 3а, 4б, 5б, 6а, 7б, 8б, 9а], каждая из которых характеризует один из аспектов ИПО.

Поскольку любая информационно-поисковая операция харак-теризуется хотя бы одним значением каждого признака, общее число ИПО не превышает мощности множества прямого произве-дения всех девяти подмножеств приведенных признаков, т. е.

{ }| 1 ,2 {2 ,2N а а а б { } { } { } { }{ } { } { }

}7 ,7 8 ,8 ,8 ,8 9 ,9 | .

а б а б а б а ба б а б в г а б≤ × × × × × ×

× × ×

В действительности число ИПО меньше, поскольку реализация ИПО с заданной характеристикой предъявляет определенные тре-бования к типу ИПЯ, структуре массивов и т. д., а сами требования могут оказаться противоречивыми для различных характеристик.

3 ,3 4 ,4 5 ,5 6 ,6

– 219 –

Page 220: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

Нап

-ра

от массив хранится на машиночитаемых нос его контура использует-ся

Процедура поиска информа-

ример, фактографический поиск (4а) не может проводиться с использованием ИПЯ без словаря (7в) или ИПЯ со свободным сло-варем (7б).

§ 6. éêÉÄçàáÄñàü èéàëäéÇõï åÄëëàÇéÇ

В современных ИПС могут использоваться три принципиально разных типа информационных массивов:

• пассивный массив, или массив третьего контура АИПС. Это массив оригиналов документов или сообщений, отображающих предметную область АИПС;

• слабоактивный массив — массив второго контура АИПС — упорядоченная машиночитаемая копия документов (сообщений) пассивного массива;

• активный массив — массив первого контура АИПС или ин-формационно-поисковый массив (ИПМ), структурированный мас-сив машиночитаемых поисковых образов документов и (или) их библиографических описаний и (или) рефератов и (или) самих до-кументов (сообщений) и т. д. Иными словами — это база данных ИПС — структурированная в соответствии с заданными ИПЯ со-вокупность элементов фотографической и (или) документальной информации, представленных на машиночитаемых носителях. Собственно информационный поиск проводится только в активном массиве. Однако результатами этого поиска могут быть только ко-ды документов, отдельные фрагменты документов, их рефераты, аннотации, заголовки и т. д., но не полнозначные копии докумен-тов и, тем более, не оригиналы документов. Массив второго конту

необходим для получения копий документов в целом или их фрагментов. Обычно эт

ителях большой емкости. Массив третьтолько при необходимости обращения к оригиналу документа

(сообщения). Такая необходимость возникает в библиотечных, архивных, банковских и т. д. системах, где важен юридический ста-тус получаемой в ИПС информации.

– 220 –

Page 221: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

ции ении собственно ин-фор

тельное представление информационных массивов в со-отв

документов. ЗАПИСЬ — поименованная совокупность полей данных. На-

пример, запись «документ» ючать поля: N документа, название документа, год издания, издательство, авторы и т. д.

в трехконтурной ИПС состоит в проведмационного поиска в активном массиве (базе данных) АИПС,

анализе релевантности результатов поиска и обращении (при необ-ходимости) по найденным поисковым ключам к документам второ-го или первого контуров АИПС.

Реализация информационного поиска в АИПС предполагает предвари

етствии с некоторой формальной структурой данных. Сущест-вует несколько различных структур данных (подробно структуры данных будут рассмотрены далее). В документальных АИПС ис-пользуется простейшая структура данных, включающая четыре типа элементов:

ПОЛЕ — ЗАПИСЬ — ФАЙЛ — НАБОР ФАЙЛОВ. ПОЛЕ — наименьшая поименованная единица данных (ин-

формации). Ими могут быть: автор документа, название документа, реферат документа, часть документа или реферата документа, на-звание дескриптора или иной лексической единицы и т. д. Иными словами, ПОЛЕ — любая поименованная единица информации (данных), которая может представлять интерес в процессе инфор-мационного поиска. Различают фиксированные и свободные (гибкие) поля данных.

Фиксированное поле данных — поле с заранее заданным (фиксированным) числом символов (байт), используемых при его заполнении. Например, поля «фамилия автора документа», «год издания документа». Свободные (гибкие) поля не предполагают явных ограничений на длину значений данных. Например, поля «реферат», «название документа» могут иметь разное число симво-лов для различных

может вкл

ФАЙЛ — поименованная совокупность экземпляров записей одного типа.

НАБОР ФАЙЛОВ — поименованная совокупность файлов.

– 221 –

Page 222: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

СХЕМА ЗАПИСИ — совокупность имени записи и имен со-ставляющих ее ПОЛЕЙ. Например ДОКУМЕНТ (N документа, на-звание документа, год издания, авторы, дескрипторы, реферат). Схема записи определяет тип записи: задает порядок композиции схе

н

для сбора и ввода информации. Так

организации информационно-поисковых мас-сив

сей с фиксированными поля-ми.

м типов полей и приписывает имя типу записи. Схема файла — совокупность имени файла, имени типа записи и имен составляю-щих ее полей. Схема базы данных — совокупность имени набора файлов и схем составляющих ее файлов. База да ных — совокуп-ность состояний составляющих ее файлов. При предмашинном представлении информации схему базы данных отображают на бу-мажном носителе в виде, удобном

ое представление носит название РАБОЧЕГО ЛИСТА АИПС или ФОРМАТА ВВОДА ДАННЫХ АИПС. Обратное отображение РАБОЧЕГО ЛИСТА в схему базы данных выполняется компью-терной программой в процессе ввода информации в АИПС. Схема базы данных (схема

ов) оказывает существенное влияние на эффективность поиско-вых операций. Существуют самые разнообразные схемы организа-ции поисковых массивов, отличающиеся между собой как набо-рами файлов, так и их схемами. Однако в основе любых схем БД лежат схемы файлов, а в более узком смысле, — схемы записей, по-скольку именно они определяют структуру организации массивов.

Рассмотрим наиболее важные в документальном поиске схемы организации массивов.

Прямая схема организации массива Схема записи представляет собой совокупность имен интере-

сующих пользователя полей, одним из которых обязательно явля-ется номер документа. Файл формируется как массив записей, упо-рядоченных по номерам документов.

Инверсная схема организации массива Схема приемлема только для запиСхема записи включает имя ключевого поля (поля, по которо-

му предполагается проводить поиск) и поля «номера документов». Файл формируется как массив упорядоченных по значениям клю-

– 222 –

Page 223: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

чевого поля записей (например, по алфавиту, по цифровым кодам и т. д.).

Прямая схема организации массива требует минимальных объ-емо

организации массива требует создания ин-версных файлов по каждому из полей, по которым производится поиск. Это существенно увеличивает объемы зан маемой памяти. Однако время п ьно, поскольку обе версной орг записей и сло х отношений в процессе поиска.

давать массивы с прямой и ин-вер бинированную схему орг ом случае состоит в томлеввае ой прием повышает опе ктивной логике за-про

сковая система — сис тельной тех я, а также выдачи ее пользователям необходимой информации по заданным критериям. АИПС представляет собой совокупность информационно-поиско-вого языка, (программных) средств и правил перевода текстов на этот язык (индексирования), обеспечения их поиска и критериев со-ответствия.

в памяти для записи и хранения информации, позволяет легко вносить изменения и дополнения, учитывать синтагматические от-ношения в процессе поиска. Однако поиск требует много времени, т. к. каждый запрос предполагает просмотр всего файла. При груп-повом поиске этот недостаток частично снимается.

Инверсная схема

иоиска при такой схеме минимал

спечивается прямой поиск по ключам. Недостатком инность корректировки анизации массива является слож

ижность учета синтагматическтся созНа практике приходи

сной организацией, т. е. использовать комцесс поиска в этанизации массивов. Про

, что в инверсном массиве выбираются номера возможно ре-а затем просматри-антных в силу логики запроса документов,

. Тактся выделенная часть прямого массиваративность поиска, особенно при конъюнсов.

êÖáûåÖ

Автоматизированная информационно-поитема, реализованная на средствах электронной вычислиники и предназначенная для нахождени

– 223 –

Page 224: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

Автом ма есть совокупность структу , предназна-ченных для сбора, о выдачи и распро-странения информации на базе развитых информационно-пои

удо

степени

ее соответствия запросу; отбор из массива отысканной информа-ции; егии использования р поставленных целей.

чес

атизированная информационно-поисковая систерно взаимосвязанных подсистем

бработки, хранения, поиска и

сковых массивов с широким применением средств автоматиза-ции подготовки, ввода и вывода информации результатов поиска в

бной для работы с ней форме. Информационный поиск (процесс нахождения и выбора (выда-

чи) требуемой, т. е. определенной заранее заданными признаками, информации из отдельного текста документа, совокупности доку-ментов или вообще из запоминающего устройства любой физиче-ской природы.

Элементами процесса информационного поиска являются со-ставление и формулирование запроса, обеспечение доступа к ин-формационным массивам в целях их изучения и сравнения запросас имеющейся в массиве информацией с целью определения

оценка выданной информации, а также разработка стратесурсов системы для достижения

Процесс нахождения, отбора и выдачи определенной заранее заданными признаками информации (в т. ч. — документов, их час-тей и (или) данных) из массивов и записей любого вида и на любых носителях. Побудительной причиной осуществления информаци-онного поиска является информационная потребность, выраженная в форме информационного запроса.

В автоматизированных информационно-поисковых системах информационный поиск обеспечивается и осуществляется с при-влечением лингвистических, информационных, программно-техни-

ких, технологических, организационных средств и составлен-ных из них). Основными критериями качества результатов информационного поиска являются полнота, точность и оператив-ность поиска.

– 224 –

Page 225: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

Существует много сп хорошо доку-мен

1. Количественные характеристики словарей. 12. Системы индекс13. Типы систем индексирования.

. ПОЗа

ел релевантности.

особов оценить, насколькоты, найденные АИПС, соответствуют запросу. К сожалению,

понятие степени соответствия запроса, или другими словами реле-вантности, является субъективным понятием, а степень соответст-вия зависит от конкретного человека, оценивающего результаты выполнения запроса.

Çéèêéëõ Ñãü ëÄåéèêéÇÖêäà

1. В чем состоит процесс функционирования АИПС? 2. Состав и структура АИПС. 3. Основные элементы ИПЯ. 4. Требования к ИПЯ. 5. Типы отношений между словами ИПЯ. 6. Классификация ИПЯ. 7. В чем состоит метод координатного индексирования и поиска? 8. Состав и структура дескрипторных ИПЯ. 9. Способы построения словарей. 10. Принципы отбора лексических единиц. 1

ирования.

14. Поисковый аппарат АИПС15. Этапы процесса16. Понятие р

формированияевантности и критерий

.

17. Оценка эффективности поиска.

– 225 –

Page 226: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

É·‚‡ 6. èéÑïéÑõ, àëèéãúáìÖåõÖ èêà êÄáêÄÅéíäÖ àë

В данной главе рассматривается несколько подходов, исполь-зуемых на различных стадиях разработки информационной системы:

• планирования разработки ИС — подходы, используемые при определении стратегии развития ИТ и ИС на предприятии;

• выбора методологии разработки программного обеспече-ния — структурный и объектно-ориентированный подход;

• выбора распределенной архитектуры ИС — архитектурные решения при реализации ИС.

В данной главе не преследуется цель дать всеобъемлющее опи-сание различных подходов при разработке информационных сис-тем. Скорее здесь рассматривается только небольшая часть практи-ческих вопросов и возможные подходы решения.

§ 1. èãÄçàêéÇÄçàÖ êÄáÇàíàü àçîéêåÄñàéççõï

íÖïçéãéÉàâ çÄ èêÖÑèêàüíàà

Всем понятно, что использование дорогостоящих информаци-онных технологий может быть оправдано только выгодами, полу-ченными в бизнесе. Развитие информационных систем лжно вестись на п потребно-стями бизнеса.

Бизнес-стратегия може ована: анализом бизнес-мод

доредприятии не спонтанно, а обосновываться

т быть обоснелей, SWOT-анализом, реинжинирингом бизнес-процессов,

реализации процессного подхода управления предприятием, анали-зом информационных ресурсов предприятия, построением архи-тектуры предприятия и т. д.

Существует много способов планирования развития ИТ на предприятии. При проектировании ИС требуется привести эконо-мическое обоснование применениия или разработки ИС. Можно воспользоваться известными в экономике подходами, приведенны-ми ниже [108].

– 226 –

Page 227: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

Подход SWOT

SWOT — метод анализа в стратегическом планировании, за-ключающийся в разделении факторов и явлений на четыре катего-рии: Strengths (Cильные стороны), Weaknesses (Слабые стороны), Opportunities (Возможности) и Threats (Угрозы).

Акроним SWOT был впервые введен в 1963 г. в Гарварде на конференции по проблемам бизнес-политики профессором K. And-rews. Первоначально SWOT-анализ был основан на озвучивании и структурировании знаний о текущей ситуации и тенденциях [109].

Преимущества и недостатки — внутренние факторы, которые создают или разрушают ценность. Они могут включать активы, навыки или ресурсы, которые имеет компания в своем распоряже-нии, в сравнении со своими конкурентами. Их можно измерить, используя внутренние оценки или внешний анализ (бенчмаркинг).

Возможности и угрозы — внешние факторы, которые создают или разрушают ценность. Компания не может их контролировать. Они происходят от конкурентной динамики отрасли (рынка) или от демографических, экономических, политических, технических, со-циальных, правовых или культурных факторов (PEST).

Положительное влияние

Отрицательное влияние

Внутренняя среда Strengths Weaknesses

Внешняя среда Opportunities Threats

Можно представить следующий алгоритм процесса стратегиче-ского управления:

• Формирование миссии. • Разработка целей (стратегические цели — это основные на-

правления деятельности организации, ведущие к выполнению еемиссии).

• Страт

егический анализ, который должен дать реальную

среды, в которой работает оценку собственных ресурсов и возможностей применительно к состоянию (и потребностям) внешнейфирма.

– 227 –

Page 228: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

• Выбор с нтов. тратегий из возможного множества вариа• Реализация стратегии. SWOT предоставляет инструмент качественного стратегическо-

го анализа, при этом не требуется мощных и дорогостоящих средств. Выбор эффективных стратегий, соответствующих внут-ренним параметрам предприятия и его положению на рынке и, в целом, во внешней среде, производится путем построения матриц корреляционного SWOT-анализа. На рис. 6.1 приводится пример матрицы SWOT-анализа.

Рис. 6.1. Пример матрицы SWOT-анализа [110]

Подход BPR

В 1990 г. Майкл Хаммер, профессор информатики в Массачу-сетском техноло атью в Harvard Business Revie бычные мето-ды повышения я и автомати-зац

-фор результа-

бы вести дела.

гическом институте, опубликовал стw [111], в котором он утверждал, что о производительности — рационализаци

ия процессов — не привели к серьезным улучшениям, которые требуются компаниям. В частности, серьезные инвестиции в ин

мационные технологии принесли разочаровывающиеты, во многом из-за того, что компании используют технологию только для того, чтобы механизировать старые спосо

– 228 –

Page 229: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

Они оставляют в неприкосновенности существующие процессы и используют компьютеры, чтобы просто их ускорить [112].

Основная идея Хаммера [113] состоит в том, что при проведе-нии реинжиниринга необходимо освободиться от устаревших биз-

осс-функциональной

ровании IDEF0, DFD, ARIS

лжна видеть в ИТ не метод автоматизации производства, а технологическое средство его изменения. Само по себе использование компьютеров не является реинжинирингом. Более того, неправильное использование компьютеров может за-блокировать усилия по коренному изменению бизнес-процессов, закрепить старые взгляды и схемы поведения.

Хаммер сформулировал принципы [112], которые могут быть полезны при создании информационных систем:

• организовывайте достижение результата, а не выполнение задачи;

• поручите исполнение процесса тем, кто использует его ре-зультат;

• включайте обработку информации в реальную работу, кото-рая генерирует эту информацию;

• считайте географически распыленные ресурсы централизо-ванными;

• свя и их ре-зультатов;

-

один раз — у источника.

нес-процессов и принципов их разработки и создать новые. Для этого необходимо рассмотреть основополагающие процессы с кросс-функциональной точки зрения. Под крточкой зрения понимается обзор бизнес-процесса в целом без деле-ния его на части, выполняемые различными функциональными группами. Фактически рассматривается процессный подход, при-меняемый в функциональном моделии т. д. Бизнес-процесс не привязывается к структурным подразде-лениям, выполняющим его.

Решающее место в реинжиниринге отводится ИТ. По мнению Хаммера, компания до

зывайте параллельные работы вместо интеграци

• помещайте точку принятия решения туда, где делается работа, и встраивайте контроль в процесс;

• фиксируйте информацию

– 229 –

Page 230: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

Подход VCF (Value Chain Framework)

Концепция Value Chain (Цепочка приращения стоимости) Пор-тера (Michael Porter) — это модель, которая помогает проанализи-ровать конкретные действия фирмы по созданию ценности и кон-курентного преимущества [114].

VCF включает (рис. 6.2) последовательность функций струк-турных подразделений предприятия (центров ответственности) в том порядке, как они выполняются при создании конкретного вида потребительной стоимости (стоимостного объекта). Отдельные функции выполняются структурными подразделениями, которые

мир к создаваемому стоимо-

их ценность для потребителя.

имею статус центра затрат [115]. Выполнение каждой функции связано с одной стороны, с фор-ованием затрат (издержек), с другой стороны, — с добавлением

дополнительных потребительских качествстному объекту, представляющ

Рис. 6.2. Последовательность функций

структурных подразделений предприятия

Функции VCF подразделяют на основные (Primary activities) и вспомогательные (Техническая поддержка) элементы (рис. 6.3).

анспортных перевозок;

К основным элементам относятся: • входящая логистика, включающая получение, хранение, кон-

троль ТМЗ, планирование тр

– 230 –

Page 231: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

• операции, включающие обработку, упаковку, сборку, обслу-жи гие действия, соз-даю

дукта клиентам: хранение на складах, выполнение зак

продажи — действия, связанные с побуждением покупателей к совершен включая: выбор ка-нала сбыта, рекламу, нообразование, ме-недж

вание оборудования, тестирование и все друщие ценность, которые преобразовывают вклады в окончатель-

ный продукт; • исходящая логистика — действия, необходимые для достав-

ки конечного проаза, перевозки, управление дистрибуцией; • маркетинг и

ию покупки продукта, продвижение, продажи, це

мент розничных продаж и т. д.; • сервисные услуги — действия, которые поддерживают и по-

вышают ценность продукта, включая: клиентскую поддержку, ре-монтные услуги, установку, тренинг, управление запасных частей, модернизацию и т. д.

Рис. 6.3. Фреймворк цепочек приращения стоимости

К технической поддержке относятся следующие функции: • закупки (закупки сырья, сервис, запасные части, здания, ма-

шинное оборудование и т. д.);

– 231 –

Page 232: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

• развитие технологии (развитие технологий для поддержки дей

зработки, автоматизация процессов, дизайн, изме-нен

ние людскими ресурсами (действия, связанные с рек-

енных мощностей;

теграции;

ерен-цирования;

• географическое положе

цепочки создания стоимости [116].

ствий в цепочке приращения стоимости, таких как научные ис-следования и ра

ие дизайна); • управле

рутингом, развитием (образованием), удерживанием и компенсаци-ей сотрудникам и менеджерам);

инфраструктура фирмы (общее руководство, менедж• мент планирования, правовой, финансовый аспект, бухгалтерский учет, общественные дела, управление качеством и т. д.).

Фирма может создавать преимущество по уменьшению издер-жек элементов цепочки или за счет изменения конфигурации ее.

Портер определил 10 факторов затрат [114], относящихся к дей-ствиям цепочки приращения стоимости:

а; • экономия от масштаб• обучение; • использование производств• связи между действиями; • взаимоотношения между бизнес-группами; • степень вертикальной ин• время входа на рынок; • корпоративная политика в отношении затрат или дифф

ние; • институционные факторы (регулирование, профсоюзная дея-

тельность, налоги и т. д.). Для того чтобы определить влияние информационных техноло-

гий на деятельность предприятия, с точки зрения VCF, необходимо проанализировать ее цепочку создания стоимости. Поскольку каж-дая операция связана с появлением, обработкой и передачей ин-формации, информационные технологии играют решающую роль в формировании

Портер и Миллар [108] выделяют пять шагов, которые должна предпринять организация, чтобы воспользоваться преимущества-ми, предоставляемыми ИТ:

– 232 –

Page 233: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

1. Оценить информационную емкость продуктов и процессов. 2. Оценить роль ИТ в отраслевой структуре. 3. Выявить и ранжировать способы, с помощью которых ИТ

создает конкурентное преимущество.

Подход построения EA (Enterprise Architecture — архитектуры предприятия)

Создание архитектуры предприятия обосновывается принци-пом стратегического развития технологий и ИТ-процессов с целью обеспечения поддержки бизнеса. Это, в свою очередь, делает ИТ динамично организованной структурой предприятия, реализующей успешную бизнес-стратегию [117].

Архитектура обеспечивает стратегический контекст развития ИТ-системы в ответ на постоянно изменяющиеся потребности ок-ружающей бизнес-среды. Хорошая (эффективная) архитектура предприятия позволит достигнуть правильного баланса между эф-фективностью ИТ и новшествами в бизнесе.

Технические преимущества, которые следуют из хорошей ар-хитектуры предприятия, приносят значимые практические резуль-таты:

• более эффективные действия IT: – низкая стоимость разработки программного обеспечения, под-

держки и обслуживания; – увеличенная мобильность приложений; – улучшенная интероперабильность и удобство управления

системой и сетью; – совершенствование возможности решать проблемы масштаба

предприятия, подобно безопасности; – более легкая модернизация и обмен компонентами системы; • лучшую отдачу существующих инвестиций, у

риска будущих инвестиц

4. Рассмотреть, каким образом ИТ может создать новое направ-ление в бизнесе.

5. Разработать план, направленный на извлечение выгод от ис-пользования ИТ.

меньшениеий:

– 233 –

Page 234: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

– уменьшенная сложность ИТ-инфраструктуры;

простое и более дешевое приобретение:

ся четыре вида «архитектуры», которые принимаются как подмножества полной архитектуры предприятия:

• бизнес-архитектура; • архитектура данных; • архитектура приложений; • технологическая архитектура. Комбинация архитектуры данных и архитектуры приложений

называется архитектурой ИС. В качестве примеров архитектурных фреймворков можно при-

вести TOGAF и методологию Захмана (Zachman Framework).

TOGAF

TOGAF (The Open Group Architecture Framework) — является методологией разработки и построения архитектуры предприятия, состоящей из совокупности детальных методов и ряда инструмен-тов поддержки. Данная методология разработана консорциумом OMG (Object Management Group), которая владеет всеми правами на продукт свободно любой организацией, желающей разработать архитектуру своего пре

м

– максимальный возврат инвестиций в существующую ИТ-ин-фраструктуру;

– гибкость в выборе решения в ИТ: покупка, выполнение или аутсорсинг;

– полное устранение риска в новых инвестициях и издержек использования ИТ;

• более быстрое, – более простые решения по закупкам, т. к. информация,

влияющая на приобретение, доступна в последовательном плане; – процесс приобретения осуществляется быстрее, т. к. максими-

зирована скорость и гибкость в приобретении, без увеличения из-держек в архитектуре.

бычно рассматриваютО

. В силу этого, TOGAF может использоваться

дприятия. Методология предоставляет цикл разработки архитектуры

ADM (Architecture Development Method — Метод построения архи-тектуры) и «виртуального репозитория» (Континуу а предпри-

– 234 –

Page 235: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

яти

рые мо-гут быть включены м пред-приятия: undation Arc

я) всех активов архитектуры, как предприятия, так и в целом ИТ-индустрии, куда входят модели, шаблоны, описание архитекту-ры и другие артефакты, которые требуются при построении архи-тектуры предприятия.

Сам TOGAF предоставляет две эталонные модели, кото конкретной организацией в Континуу

базовая архитектура TOGAF (TOGAF Fohitecture) и эталонная модель объединенной информационной

инфраструктуры (Integrated Information Infrastructure Reference Model — III-RM).

Рис. 6.4. Цикл ADM

– 235 –

Page 236: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

Базовая архитектура TOGAF включает: • TRM (Technical Reference Model) — техническая эталонная

модель универсальных служб и функций, которая предоставляет основу для построения более специализированных архитектур и архитектурных компонентов;

• информационная база стандартов (Standards Information Base — SIB) — информационное ядро соответствующих специфи-каций и стандартов.

В общем виде TRM можно представить (рис. 6.5) в виде трех главных уровней (приложения, платформа приложений и комму-никационная инфраструктура), соединенных двумя интерфейсами (интерфейс платформы приложений и интерфейс коммуникацион-ной инфраструктуры).

Рис. 6.5. TRM — представление высокого уровня

TOGAF TRM идентифицирует универсальный набор сервисов платформы и обеспечивает классификацию (таксономию), которая объединяет эти сервисы по категориям, основываясь на схо ести функциональны

жх возможностей.

– 236 –

Page 237: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

Эталонная модель интегрированной информационной инфра-структуры (III-RM) фокусируется на области программного обес-печения приложений. Это дает возможность решить одну из клю-чевых задач, стоящих при построении архитектуры предприятия: создание интегрированной информационной архитектуры.

Framework Zachman Enterprise Architecture

Фреймворк архитектуры предприятия, разработанный Дж. Зах-маном (John A. Zachman) (иногда просто называют «Модель Зах-мана»), стал фактическим стандартом классификации и разработки артефактов архитектуры уровня предприятия [118-120]. Он постро-ен на основе таких дисциплин, как классическая архитектура, кон-струирование, инженерия и производство.

В организации модели определяется два измерения (рис. 6.6): • ролевая точка зрения участников проекта создания архитек-

туры: планировщик, владелец, дизайнер, конструктор, разработ-чик;

• абстракции архитектуры: Что? Как? Где? Кто? Когда? Почему?

Рис. 6.6. Организация модели Захмана

– 237 –

Page 238: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

На рис. 6.7 и 6.8 дана реализация модели Захмана. Конкретные модели и атрибуты представления показаны в качестве примера. В каждом конкретном случае представление, отвечающее вопросу столбца, может быть иным.

Рис. 6.7. Левая часть матрицы Захмана

– 238 –

Page 239: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

Рис. 6.8. Правая часть матрицы Захмана

– 239 –

Page 240: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

Комбинация точек зрения и описаний, представленных в три-дцати ячейках таблицы Захмана, представляет собой мощную сис-тематизацию, на основе которой можно выстроить полную архи-тек

ются по существу и используют различные представления

али описания подготовле-

данной предмет-ной

туру для разработки ИС. Расположенные по вертикали ракурсы могут отличаться степенью детализации, но, что более важно, они отличамодели. Различные модели отражают разные взгляды участников. Аналогично расположенные по горизонтны, исходя из различных соображений. Каждое из этих описаний призвано ответить на один из шести вопросов [108].

Подход, основанный на знании предметной области

Требования, основанные на знании предметной области, выяв-ляются посредством изучения стандартов профессиональной и учебной литературы, относящейся к этой области. Изучение суще-ствующих ИТ-решений и существующих ИС для

области также может стать богатым источником знаний. Для того чтобы определиться с видом используемого решения,

можно воспользоваться классификацией ИС по типу бизнес-про-цессов, предложенная компания «Институт типовых решений — Производство» [66]. По типу бизнес-процессов информационные системы, участвующие в автоматизации управления, можно разде-лить на следующие группы:

• ИС стратегического маркетинга и управления предприятием; • финансовые ИС; • ИС управления производством; • ИС управления запасами и сбытом; • ИС поддержки жизненного цикла продукции. Внутри каждой группы информационные системы подразделя-

ются, как правило, в зависимости от реализованной концепции илиалгоритма. Многие информационные системы реализуют концеп-ции, закрепленные в стандартах (ISO, APICS и др.), или же алго-ритмы, широко используемые в бизнес-процессах, или выделены аналитическими и консалтинговыми агентствами (Gartner, IDC и др.).

– 240 –

Page 241: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

Используемая классификация не лишена недостатков. Во-пер-вых, многие информационные системы входят в состав информа-

может затронуть информационные системы,

tical

систем на ERP и MRP II (Manufacturing

Resource Plann характер.

кон

го интерфейса и мно

гут воз-

дым событием стоит программный объект, который ге-

ционной системы, которая интегрирует несколько функций, при этом интегрирование позиционированные в различных разделах. Например, Business in-telligence (BI) включают Data mining (DM) и OLAP (online analyprocessing). Во-вторых, некоторые информационные системы не имеют четко разделенных границ. Например, в литературе часто счи онных тают, что разделение информаци(Enterprise Resource Planning) системы

ing) имеет явно выраженный рекламный

§ 2. èéÑïéÑõ ä êÄáêÄÅéíäÖ èêéÉêÄååçéÉé éÅÖëèÖóÖçàü

Структурный подход

В среде DOS преобладала процедурная логика программного обеспечения, разработанная на языках типа Pascal и Basic. После запуска программа выполняется до завершения в жестко заданной последовательности шагов. На некоторых этапах программа затре-бовала ввод исходных данных, которые могли вводиться в интер-активном режиме, что не изменяло детерминированный характер,

тролируемый программой. Для этого стиля программирования хорошо зарекомендовал себя структурный подход в разработке ПО.

При появлении графического пользовательскогозадачной среды выполнения программы все кардинально из-

менилось. Программа управляется событиями, которые моникать случайным образом, например, действиями пользователя (клик мышью, нажатие клавиатуры и т. д.). В среде графического интерфейса скорее пользователь контролирует выполнение про-граммы, а не программа контролирует действия пользователя.

За кажнерирует или обрабатывает это событие. Современные системы на основе графического интерфейса требуют применение объектно-

– 241 –

Page 242: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

ориентированных языков программирования, что в свою очередь привело к развитию объектно-ориентированного подхода к разра-ботке программного обеспечения.

В то же время применение структурного подхода может быть

и разработке ПО; • предполагается разработка с «чистого листа» без поддержки

повторноСтрук систем

пол

ей силы раз

модель, которая обы

нении объ-ект

ональной модели AS-IS), выявление докумен-

оправдано при разработке современных систем в следующих слу-чаях:

• разработчик не имеет опыт использования объектно-ориенти-рованных парадигм пр

го использования существующих компонент. турный подход (structured approach) к разработке

учил широкое распространение (и был признан стандартом де-факто) в 1980-х гг. Этот подход основан на двух методах: диаграм-мах потоков данных (data flow diagrams — DFD) для моделирова-ния процессов и диаграммах сущность–связь (entity relationship diagrams — ERD) для моделирования данных.

Структурный подход является функционально-ориентирован-ным и рассматривает DFD-диаграммы в качестве движущ

работки ПО [108]. Для описания бизнес-процессов можно ис-пользовать IDEF0 модели. Сочетание DFD- и ERD-диаграмм дает относительно полные модели анализа, которые фиксируют все функции и данные системы на требуемом уровне абстракции неза-висимо от особенностей аппаратного и программного обеспечения. Затем модель анализа преобразуется в проектную

чно выражается в понятиях реляционных баз данных. После этого следует этап реализации [108].

Не смотря на существенные недостатки структурно подхода, рекомендуется использовать его в особенности тем студентам, ко-торые испытывают значительные затруднения в приме

но-ориентированного подхода. Можно предложить следующую последовательность реализа-

ции структурного подхода. 1. Изучение предметной области и выявление требований к

информационной системе. Описание бизнес-процесса (возможно построение функци

– 242 –

Page 243: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

тов

пользовательского интерфейса (клиентская часть системы) и интеграц

6. Верификация

псуляция, повторное использование, наследо-ван

щью четко опреде-

бизнес-процесса, определение проблем, определение функций ИС и выявление ограничений, обоснование разработки.

2. Построение концепции ее реализации и технического зада-ния на ее разработку.

3. Построение функциональной модели (TO-BE) выявление требований к обеспечивающим частям ИС.

4. Разработка базы данных (серверная часть системы). 5. Разработка

ия его с серверной частью. и тестирование ПО.

Объектно-ориентированный подход

Объектно-ориентированный подход к разработке систем полу-чил распространение в 1990-х гг. Ассоциация производителей ПО Object Management Group утвердила в качестве стандартного сред-ства моделирования для этого подхода язык UML (Unified Modeling Language — Унифицированный язык моделирования), который на сегодняшний день поддержан всеми ведущими разработчиками ПО.

По сравнению со структурным подходом объектно-ориентиро-ванный подход в большей степени направлен на данные, т. к. он развивается вокруг моделей классов. Использование разработки, основанной на применении прецедентов, смещает акценты от дан-ных к функциям.

Объектный подход реализует технические преимущества, такие как абстракция, инка

ие, передача сообщений, полиморфизм и т. д. В то же время можно выделить существенные проблемы ис-

пользования объектно-ориентированной парадигмы [108]. • Этап анализа проводится на еще более высоком уровне абст-

ракции, и — если серверная часть решения по реализации предпо-лагает использование реляционной базы данных — семантический разрыв между концепцией и ее реализацией может быть значи-тельным.

• Управление проектом сложно осуществлять. Менеджеры из-меряют степень продвижения разработки с помо

– 243 –

Page 244: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

лен

ждению и мас

модульной структуры системы. Страте-гия

ешения.

терах, но вполне возможно реализа-ция

базой данных, из которой дан

ной декомпозиции работ, элементов комплекта поставки и клю-чевых этапов. При объектной разработке с помощью «детализа-ции» не существует четких границ между этапами, а проектная до-кументация непрерывно развивается.

• Применение объектного подхода связано с возрастающей сложностью решений, что, в свою очередь, сказывается на таких характеристиках ПО, как приспособленность к сопрово

штабируемостью.

§ 3. ÇõÅéê êÄëèêÖÑÖãÖççéâ ÄêïàíÖäíìêõ

Архитектурное проектирование связано с выбором стратегии решений и представлением

решения призвана разрешить проблемы, связанные с построе-нием клиентской и серверной частей системы, а ПО промежуточ-ного слоя (middleware) необходимо для «склеивания» клиента и сервера. Решение по основным строительным блокам (модулям) только отчасти зависит от выбранной стратегии р

Клиент и сервер — логические понятия. Клиент — это вычис-лительный процесс, который осуществляет запросы к процессу сервера. Сервер — это вычислительный процесс, который обслу-живает запросы сервера. Обычно процессы клиента и сервера вы-полняются на разных компью

системы «клиент–сервер» на одной машине. В типичном сценарии клиентский процесс отвечает за управле-

ние отображением информации на экране пользователя и за обра-ботку событий, инициированных пользователями. Процесс серве-ра — это любой компьютерный узел с

ные могут быть запрошены клиентским процессом. Архитектуру клиент–сервер можно расширить для представ-

ления произвольной распределенной системы. Любой компью-терный узел с базой данных может играть роль клиента в одних операциях, а сервера — в других. Соединение подобных узлов с помощью сети связи дает начало архитектуре системы распреде-ленной обработки.

– 244 –

Page 245: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

В системе распределенной обработки клиент может осуществ-лять доступ к любому количеству серверов. Однако клиенту может быть разрешен доступ одновременно только к одному серверу. Это значит, что он может быть не в состоянии объединить данные от двух или более серверов баз данных в одном запросе. Если воз-можно, то архитектура поддерживает систему распределенных баз данных.

Трехзвенная архитектура

Трехзвенная архитектура хорошо укладывается в концепцию подхода MVC и BCE.

MVC (Model-view-controller «Модель-представление-поведе-ние», «Модель-представление-контроллер») — архитектура про-граммного обеспечения, в которой модель данных приложения, пользовательский интерфейс и управляющая логика разделены на три отдельных компонента, так, что модификация одного из -поненто -ненты [109].

Шаблон MVC позволяет разделить данные, представление и обработку действий пользователя на три отдельных компонента.

Модель (Model). Модель предоставляет данные (обычно для View), а также реагирует на запросы (обычно от контролера), изме-няя свое состояние.

Представление (View). Отвечает за отображение информации (пользовательский интерфейс).

Поведение (Controller). Интерпретирует данные, введенные пользователем, и информирует модель и представление о необхо-димости соответствующей реакции.

Подход BCE (Boundary-Control-Entity — граница-управление-сущность) представляет собой подход к объектному моделирова-нию, основанный на трехфакторном представлении классов. В языке UML на класса а: boundary (гра-ница), control (уп

ком

в оказывает минимальное воздействие на другие компо

-х предопределены три стереотиправление) и entity (сущность).

– 245 –

Page 246: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

Пограничные классы (boundary class) описывают объекты, ко-торые представляют интерфейс между актором и системой. Они выделяют часть состояния системы и представляют ее пользовате-лю в форме визуального отображения или звукового эффекта. Пограничные классы соответствуют классам, представленным в разработанном GUI-интерфейсе. Пограничные объекты часто со-храняются после однократного выполнения программы.

Управляющие классы (control class) описывают объекты, которые перехватывают входные события, инициированные поль-зователем, и контролируют выполнение бизнес-процесса. Управ-ляющий класс представляет действия и виды деятельности преце-дентов. Управляющие объекты зачастую не сохраняются после выполнения программы.

Классы-сущности (entity class) описывают объекты, которые представляют семантику сущностей, принадлежащих проблемной области. Они соотносятся со структурами данных системной базы данных. Объекты-сущности всегда сохраняются после выполнения программы и участвуют во многих прецедентах.

В верно спроектированной иерархии классов актор может взаимодействовать только с пограничными объектами, объекты-сущности могут взаимодействовать только с управляющими объ-ектами и управляющие объекты могут взаимодействовать с объек-тами любого типа (рис. 6.9).

Каждому пограничному объекту, который допускает взаимо-действие, должен быть поставлен в соответствие связанный с ним управляющий объект. Поэтому некоторые типы архитектуры ПО объединяют две функции в одном классе. В качестве примера мож-но привести библиотеку VCL (Delphi).

Дополнительным преимуществом подхода BCE является его увязка с трехзвенной моделью клиент–сервер, которая отделяет управление данными (объекты–сущности) от представления (по-граничные объекты) посредством промежуточного слоя логики приложения (управляющие объекты). Сервер баз данных может даже быть реализован не на объектно-ориентированной, а на реля-ционной СУБД (рис. 6.10).

– 246 –

Page 247: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

Управляющий элемент

атрибут

Управляющий элементатрибут

метод()

<<control>>

Сущностьатрибут

метод()

<<entity>>

Сущность

атрибут

Интерфейсный элементатрибут

метод()

<<boundary>>

Интерфейсный элемент

атрибут

Рис. 6.9. Классы boundary (граница), control (управление) и entity (сущность) в нотации UML

Интерфейсный класс

атрибут1

Сущность1

Атрибут

Сущность

Интерфейсный класс1

Управляющий класс

Операция1

n

1

1..n 11..n 1

Управляющий класс1

11

<<communicate>>

Сущность2

1..n1 <<subscribe>> 1..n1<<subscribe>>

1 1

n

11..n

Рис. 6.10. Пример реализации BCE в диаграмме классов уровня анализа

– 247 –

Page 248: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

Необходимо подчеркнуть, что классы-сущности располагаются в памяти клиентской программы, а не на сервере базы данных. Чтобы осуществить отображение классов-сущностей в реляцион-ную память СУБД и для хранения другой релевантной информации о структурах баз данных, требуется отдельный уровень (слой) кла

ечение данных из базы данных и их сохранение. К этому уровню классов можно отнести классы Delphi: TADOConnection, использовании тех

amic Link Library

ссов, которые могут быть организованы в виде пакета, предна-значенного для работы с базой данных. Существует расширение подхода BCE, названное Boundary-Control-Entity-Database (BCED — граница-управление-сущность-база данных). Классы уровня D (Da-tabase) ответственны за извл

TADOTable, TADOQuery (принологии ADO). Аналогично клиентскому и серверному процессу прикладной

процесс представляет собой логическое понятие, которое может поддерживаться или не поддерживаться специально выделенным для этой цели аппаратным обеспечением. Логика приложения мо-жет с равным успехом выполняться на клиентском или серверном узле, т. е. может быть встроена в клиентский или серверный про-цесс и реализована в виде библиотек: DLL (Dyn —динамически компонуемая библиотека), АРI-интсрфейса (Applica-tion Programming Interface — интерфейс прикладного программи-рования), RPC вызовов (Remote Procedure Calls — удаленный вы-зов процедуры) и т. д.

Если логика приложения скомпилирована с клиентом, говорятоб архитектуре толстого клиента. Если она скомпилирована с сер-вером, говорят об архитектуре тонкого клиента. Возможны также промежуточные архитектуры, в которых логика приложения час-тично скомпилирована с клиентом, а частично — с сервером.

Логику приложения можно также развернуть на отдельных вы-числительных узлах, как показано на рис. 6.11.

При реализации приложения необходимо решить вопросы реали-зации: пользовательского интерфейса, логики, ответственной за обра-ботку GUI-интерфейса (презентационная логика), прикладные функ-ции, логики, ответственной за бизнес-правила масштаба предприятия (интегральной логики), функции доступа к базе данных (рис. 6.12).

– 248 –

Page 249: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

Рис. 6.11. Пример развертывания трехзвенной архитектуры [108]

Рис. 6.12. Взаимодействие приложение–база данных [108]

– 249 –

Page 250: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

Программы баз данных называются хранимыми процедурами. Хранимые процедуры хранятся в самой базе данных (они являются постоянными или персистентными). Их можно вызвать из клиент-ской программы (или из другой хранимой процедуры) с помощью обычного оператора вызова процедуры (функции).

уществуют хранимые процедуры специального вида — триг-геры, которые нельзя вызвать явно. Триггер срабатывает автомати-чески при попытке изменить содержимое базы данных. Триггеры используются для реализации бизнес-правил масштаба предпри-яти

С

жен

куков (cookie — коротких символьных строк, представ-ляю

) представляет собой программу, выполняемую браузе-ром

я (интегральная логика).

Реализация web-приложений

Web-приложение — разновидность системы клиент–сервер с web-узлом. Браузер Internet-клиента отображает web-страницы на экране компьютера. Web-сервер доставляет web-страницы браузе-ру. Web-страницы могут быть статическими (неизменяемыми) или динамическими. Web-страница может представлять форму, запол-няемую пользователем. Чтобы пользователь мог одновременно просматривать несколько web-страниц, экран разделяется прило-

ием на фреймы. Чтобы управлять логикой приложения и отслеживать состояние

приложения, web-приложение может включать сервер приложений. Обычный метод отслеживания состояния реализуется хранением в браузере

щих состояние интерактивного пользователя). Чтобы придать страницам, отображаемым на клиентской ма-

шине, динамичность, используются сценарии или апплеты. Сцена-рий или скрипты (script — может быть написан, например, на языке JavaScript

в режиме интерпретации. Апплет (applet) — это скомпилиро-ванная компонента, которая выполняется в контексте браузера, од-нако, имеет лишь ограниченный доступ к другим ресурсам клиентской машины (из соображений безопасности).

Web-страница может также включать сценарии, выполняемые сервером. Подобная страница называется серверной страницей

– 250 –

Page 251: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

(server page). Серверная стра т доступ ко всем ресурсам сервера баз данных. Серверные управляют клиентскими сеа

ница имее страницы

нсами, размещают cookies в среде браузера и строят клиентские страницы, т. е. строят страничные документы из серверных бизнес-объектов и отправляют их назад клиенту.

Чтобы обеспечить доступ сценариев, содержащихся в сервер-ных страницах, к базам данных, используются стандартные биб-лиотеки доступа к данным. К типичным технологиям, позволяю-щим реализовать эту возможность, относятся ODBC (Open Data-base Connectivity — открытый интерфейс доступа к базам данных), JDBC (Java Database Connectivity — интерфейс доступа к базам данных Java-приложений), RDO (Remote Data Objects — интерфейс доступа к удаленным объектам), ADO (ActiveX Data Object — на-бор высокоуровневых интерфейсов, позволяющих разработчикам обращаться к данным на любом языке программирования на основе ActiveX).

Технологией, дающей возможность функционировать web-серверу, являются содержащие сценарии страницы HTML — ак-тивные серверные страницы (Active Server Pages — ASP) или сер-верные страницы Java (Java Server Pages — JSP). Для создания web-страниц можно использовать технологию написания клиентских сценариев (JavaScript или VBScript), документов XML (eXtensible Markup Language), Java-апплетов, управляющих элементов JavaBean или ActiveX.

Для получения web-страниц с web-сервера клиенты используют протокол HTTP (Hypertext Transfer Protocol — протокол передачи гипертекстовых файлов). Страница может содержать сценарий или скомпилированные и непосредственно выполняемые модули DLL (Dynamic Link Library — динамически компонуемая библиотека), например, ISAPI (Internet Server Application Programming Interface — интерфейс прикладного программирования Internet-сервера), CGI (Common Gateway Interlace — общий шлюзовый интерфейс) илиJava-сервлеты.

Cookie играют роль примитивного механизма поддержки со-единения между клиентом и сервером в системе, которая иначе на-

– 251 –

Page 252: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

зывается Internet-системой без установления соединения. Более сложный механизм соединения клиента с сервером превращает Inte

ans. Web-сервер обрабатывает запросы на страницы, поступающие

от браузера, и д и программный код для выполнения и отображения на клиенте. Web-сервер также

сеансов работы пользо-

когда в реализа-равляет бизнес-

ерфейсы для дру-

BC. Узел базы данных

х и многопользо-

rnet в распределенную объектную систему. В распределенной объектной системе объекты идентифицируются с помощью уни-кальных OID и взаимодействуют зa счет получения OID друг дру-га. Главными механизмами при этом выступают технологии CORBA, DCOM и EJB. При использовании данных технологий объекты могут взаимодействовать без использования протокола HTTP или web-сервера в качестве посредника.

Архитектура развертывания может представлять четырехзвен-ную структуру: клиентский web-браузер, web-сервер, сервер при-ложений, сервер баз данных.

Браузер клиентского узла можно использовать для отображения статических или динамических wеb-страниц, которые могут вклю-чать сценарии и апплеты, загружаемые и выполняемые в рамках браузера. Клиентский браузер можно оснастить дополнительными функциональными возможностями, такими как элементы управле-ния ActiveX или JavaBe

инамически генерирует страницы

обеспечивает настройку и параметризациювателя.

С вер м случае, уп

ер приложений необходим в тоции используются распределенные объекты. Он

икуют свои интлогикой. Бизнес-компоненты публгих узлов через интерфейсы компонент, такие как CORBA, DCOM или EJB.

зБи нес-компоненты инкапсулируют постоянные объекты, хра-нимые в базе данных, чаще всего в реляционной базе. Они взаимо-действуют с сервером баз данных через протоколы связи с базамиданных, например, такими как JDBC или ODобеспечивает масштабируемое хранилище даннывательский доступ к нему.

– 252 –

Page 253: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

êÖáûåÖ

Структурный подход при разработке ИС заключается в деком-поз

льных задач ко всей системе может быть на-руш

может начаться на сам

-ние

деленной архитектуре, так же, как и в централизован-ной

и пользователей через личный кабинет возмож-на

ески удаленных и независимых друг от друга

иции ее на автоматизируемые функции (задачи, выполянемые системой). Декомпозицию можно продолжать до конкретных про-цедур, при этом иерархическая структура автоматизируемой сис-темы сохраняет целостное представление, в котором все состав-ляющие компоненты взаимоувязаны. При разработке системы «снизу-вверх» от отде

ена целостность, что приводит к проблемам информационной стыковки отдельных компонент.

Объектно-ориентированная разработка ИС ом первом этапе жизненного цикла; она не связана с языком

программирования, на котором предполагается реализовать разра-батываемую программную систему: этот язык может и не быть объектно-ориентированным. На этапе разработки объекты — это некоторые формальные конструкции, никак пока не связанные с их будущей реализацией на одном из языков программирования.

Разработка объектно-ориентированной ПО связана с применем объектно-ориентированных методологий анализа и проекти-

рования систем. Обычно эти методологии поддерживаются специализированными инструментальными программными средст-вами, что упрощает их использование. В то же время принято счи-тать, что объектно-оринтированные методолгии и анализ проекти-рования ПО хорошо согласуются с ментальным представлением мира, что позволяет лучше моделировать информационные потоки с помощью программных средств.

В распре, компоненты прикладных информационных систем размеща-

ются в централизованном ядре системы. Работа пользователей, в т. ч. мобильных, подключенных через интернет, внешних инфор-мационных систем

только с централизованным ядром. В общем случае распределенной архитектурой называют про-

грамно-аппаратное решение, состоящее из компонентов, функцио-нирующих на физич

– 253 –

Page 254: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

гет

зчика.

.

ограммного обеспечения. 9. Объектно-ориентированный подход к разработке программ-

ного обеспечения. 10. Выбор распределенной архитектуры. 11. Что такое трехзвенная архитектура? 12. Реализация web-приложений.

ерогенных узлах, предоставляющееся пользователям единой объединенной системой.

Распределенная архитектура информационной системы являет-ся основой системы управления и играет важную роль в работе ор-ганизации. Она состоит из множества компонентов; разделение функций между компонентами привело к появлению различных архитектур ИС, каждая из которых имеет свои достоинства и не-достатки, что определяет особенности ее использования в зависи-мости от требований предприятия-зака

Перечисления достоинств и недостатков программно-аппарат-ных компонентов, архитектур или технологий недостаточно для принятия обоснования в пользу того или иного решения; при этом используется также большое количество критериев выбора, кото-рые к тому же отличаются степенью важности и приоритетами в зависимости от требований к ИС.

В настоящее время выполнены достаточно многочисленные ис-следования в области развития методов совершенствования ИС, основанных на использовании новейших результатов в теории и практике управления

Çéèêéëõ Ñãü ëÄåéèêéÇÖêäà

1. В чем заключается подход SWOT? 2. В чем заключается подход BPR? 3. В чем заключается подход VCF? 4. В чем заключается подход построения EA? 5. В чем заключается методология TOGAF? 6. Что такое модель Захмана? 7. В чем заключается подход, основанный на знании предмет-

ной области? . Структурный подход к разработке пр8

– 254 –

Page 255: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

á

ожность решения глобальных задач, напри-мер, таких, как создание единой управления предприяти-ем. При разработке таких с хорошо представлять со-вре

азличные средства и технологии разработки, в т. ч. и объект-но-ориентированные пе о исполь ля создан множе-ст сте ам разных т

сложных процессов. Основная ценность соврменных методик разработк ных систем состоит в ом, что они позв яют свести к инимуму тру мкую рутинную боту и сосредот ься на реше и творческих дач.

Учебное пособие отраж многолетн построения ин-фо онны стем и о их созданию независи т об-ластей применения. Оно рассчитано на подготовку специалситов, глу

сматриваются информационно-, классификация ин-

формационных сситем, а также подхо льзуемые при их разработке.

Объединяющим начало всех информационных сист явля-ются их цели ачи и фу и. Различия еделяются соба-ми ами едствами лизации поставленных цел задач и фу .

ÄäãûóÖçàÖ

Современные информационные системы становятся сложнее, чтобы обеспечить возм

системыистем важно

менные подходы, существующие в этой области, и основные сложности процесса.

Р, ус шн зуются д ия

ва сложных си м в с ых облас ях. Потребность в сложных информационных системах все время

растет. По мере того, как увеличивается производительность и па-дает цена вычислительной техники, появляются возможности вы-полнить автоматизацию все более

и информационт ол м дое ра очит ни за

аетбучения

ий опытрмаци х си мо о

боко понимающих информационные технологии ввода, обра-ботки и поиска информации вообще, безотносительно к компьюте-рам и программам. Детально распоисковые языки, системы индексирования

ды, испо

м ем , зад нкци опр спо

, методнкций

и ср реа ей,

В пособии лана попы изложения единых позиций тех сде тка с взглядов, которых придерживаются авторы и их коллеги в области, обычно называемой разработкой информационных систем в эко-номической сфере.

– 255 –

Page 256: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

За последние годы данная област тате быстрого разви-ь в результия теоретических и икладны аспекто тала приобретать ые пр х в с новочертания, причем г практических сфер внедрения, а такж на-кру е б таль средс начите о расширился. Инфор-ор инструмен ных тв з льнмационные ы как , кри - систем рассматриваются неотъемлемая тически важная составляющая современного бизнеса. Невозможно представить себе устойчиво функционирующее предприятие без средств поддержки его основных бизнес-функций в виде мощного центра информационных технологий.

Современные теории менеджмента и техно- информационныхлогий в бизнесе, принципы построения информационных систем не должны заслонять того, и чего е это ается пред а-рад вс созд — назнчения той ли иной информационной системы. Любой род ея- и дт це прав и эт ебует о, ельности человека осознанно лена лен, о тр тогчтобы цель создания сист соста ее . емы вляла основу

«Не существует попутного ветра, если неизвестно, куда плыть» (Сенека). Поэтому у человека в процессе своей деятельности долж-на быть сформулирована цель, которая и определяет направление разработок.

Ориентация на процессы, а не на функциональные задачи, при- водит к тому, что в большинстве современных методологий разра-ботки информационных систем, в т. ч. корпоративных, за основу принято описание бизнес-процессов, происходящих в той или иной органиазции. Бизнес-процессы являются одним из видов функцио-нальных моделей предприятия. Их разработка является проблемой, требующей знаний и опыта в сфере бизнеса, области организаци-онного управления, а также информационных технологий. Кроме детального проникновения в механизмы функционирования орга-низации, для ее реализации необходимы также соответствующие методики и инструментальные средства.

– 256 –

Page 257: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

èêÄäíàäìå

Ва ждого задани ся исходя и рвой буквы фамил аемого.

дание 1

Вариант А). Найти э дискретной вели-чины Х ную рядом распределения.

риант ка я выбирает з пеии обуч

За

1 (, задан

нтропию случайной

1 2 3 4 5 6 7 8 X Веро p 0,1 0,2 0,1 0,05 0,1 ,3 0,1 ятность 0,05 0

В 2-4 (БВГ). Слово из М символ символ може ой из 2 букв я которых блицы. Опр опию этого ова.

арианты т быть одн

ов, каждый заданы в та, значени

еделите энтр сл

Вариант

2 3 4 M 3 2 4

«a» 0,2 0,3 0,4 буквы

«b» 0,8 0,7 0,6

Варианты 5-7 (ДЕЖ). Слово из M символов, каждый символ может быть одной из 2 букв, значения которых заданы вопределите энтропи

таблице, ю этого слова.

Вариант

5 6 7 M 3 2 4

«a» 0, 0,3 0,4 2 «s» 0,4 0,4 0,4 буквы «d» 0,3 0,2 0,4

Варианты 8-12 (ЗИКЛ кретная случайная величина за- двоичны Определить энтропию этого

числа, если задана вероятность появления ноля.

М). Дисдана М-битовым м числом.

– 257 –

Page 258: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

Вариант

11 12 8 9 10 M 2 6 3 4 5

вероятность 0,2 0,3 0,6 0,3 0,4

ты сдает т. П ие, состоящее из д рвая — количество сдавших зачет, вто-рая — количест

Вариан заче

13-17 (НОПРС). В группе N человек, каждый из них о результатам сообщения выдается сообщенвух цифр (пево не сдавших), определить энтропию сообщения.

Вариант

13 14 15 16 17 N 3 4 5 6 2

вероятность сдачета одним студ 0,3 0,6 0,3 0,4 чи за- 0,2 ентом

Варианты ави

«0» в каждом 19 — N = 3, вар

Варианты 21-22 .

вероятность появления 22 — N = 3).

3 -ятность нахожшение количес ий этой буквы к количеству букв в тек-сте определить энтропию символа текста (Расчет выполнить программно).

18-20 (ТУФ). Дано N-разрядное двоичное число. симость энтропии д.с.в. от вероятности появления разряде этого числа (вариант 18 — N = 2, вариант иант 20 — N = 4).

Построить з

(ХЦ). Дано N-разрядное троичное числосимость энтропии дискретной случайной величины появления «1» в каждом разряде этого числа, если

«0» равна 0,3 (вариант 21 — N = 2, вариант

Построить завиот вероятности

Вариант 2 (ШЩЭЮЯ). Дан текст. Исходя из того, что веродения каждой буквы текста определяется как отно-тва вхожден

,

Задание 2

Целые значения дискретной случайной величины X1 (табл. 1) и X2 определяются подбрасыванием двух идеальных фигур, а дис-кретная случайная величина Y = X1 + X2. Определить I(X1,Y), I(X2,Y).

– 258 –

Page 259: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

Вариант на гран1 или Х2

Количество граней фигуры

ОчкиХ

ях,

0 (АБВ) 0; 1 2

1 (ГДЕ) 3 0; 1;2

2 (ЖЗИ 0; 1; ) 4 2; 3

3 (КЛ 1; 2; 3; 4 ) 5 0;

4 (МН 2; ) 6 0; 1; 3; 4; 5

5 (ОП -1; ) 2 1

6 (РС) 3 0; 1;-1

7 (ТУФ) 4 -2; -1; 1; 2

8 (ХЦЧШ 0; 1; -1; 2; -2 ) 5

9 (ЩЭЮ 1Я) 6 -3; -2; - ; 1; 2; 3

Задание 3

Реализоват сортировки из ляетс

вашего вари ассива на два под- в та ся, к -

шего вариан

вки

о

ь алгоритм Шеннона-Фенно, алгоритмтаблицы 1 (номер алгоритма опредеанта mod 6])*, а условие деление м

выбрать я, как [номер

массива блице 2 (номер условия определяетта mod 5]).

ак [номер ва

Таблица 1 Выбор алгоритма сортиро

Вариант Алгоритм сортир вки

1 (АБВГ) Пузырьковая

2 ( ЖЗИ) Вставкой ДЕ

3 (КЛМН) Шейкерная

4 (ОПРСТ) Выбором

5 (УФХЦЧ Быстрая )

6 (ШЩЭЮ Слиянием Я)

– 259 –

Page 260: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

Таблица 2 Условие построения подмассивов

Вариант Способ построения подмассивов

1 (АБВГД)

первый подмас-си одмассива имеет

мальное отличие от суммы вероятности второго ассив

Выбрано такое количество элементов вв, чтобы сумма вероятности первого п

миниподм а

2 (ЕЖЗИК)

ран ее число элементов первого подмас-, при котором сумма вероятности его элементов не

ольше пол ммы вероятностей всех ементов масси-ва. Если это условие

п й вероятностью

Выбсива

о наибольш

б усу элне может быть выполнено, то пер-ит из одного элемента с наибольшевый одмассив состо

3 ( П)

аноа, м

ментов не меньше по стей всех элемен- м не может быть выполнено,

то первый подмассивьш ь

ЛМНО

Выбрсив

наибольшеепри котором су

число элементов первого подмас-ма вероятности оставшихся эле-лусуммы вероятно

тов ассива. Если это условие состоит из одного элемента с наи-ю бол ей вероятност

4 ( ХЦВыбрано наименьшее -

, пр умьш в

РСТУФ ) сивабол

число элементов первого подмасма вероятности его элементов ероятностей всех элементов массива

и котором се полусуммы

5 (ШЩЭЮЯ)

р е элементов первого подмас-, мто л - ма

Выбсива

ано наименьшепри котором су

числома вероятности оставшихся эле-усуммы вероятностей всех элеменмен

товв не больше поссива

а в о и «1» в двоичном коде (сумма эт ятн ра размера блоков реали-зо гор а лить среднюю степень сжатия. Ис з варианта, бенность организации очереди (та и ит е а (табл. 2).

Задание 4

Задан ероятн сть встречи «0» их веро остей вна 1). Для различноговать ал итм Х фмена и опредеходя иблица 1)

определите осом обхода дер алгор в

– 260 –

Page 261: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

Таблица 1 В и ации очереди

т со

арианты орган з

Вариан О бенности организации очереди Направлениесортировки

1 (АБ) Предварительная сортирт

овка массива. Алгори м сортировки — вставкой Убывание

2 (ВГ) Предварительная сортирАлгоритм сортировки —

овка массива. Убывание пузырьковая

3 Предварительная сортиритм(ДЕ) овка массива.

выбором Убывание Алгор сортировки —

4 (ЖЗИ) Предварительная сортирАлгоритм сортировки — Убывание овка массива.

обменом

5 (КЛ) овСортир ку осуществлять при добавлении Убываниев очередь

6 (МН) Предварительная сортиртм

овка массива. Алгори сортировки — вставкой Возрастание

7 Предварительная сортиртм(ОП) овка массива.

пузырьковая Возрастание Алгори сортировки —

8 рительная ртм(РС) Предва

Алгори сорти

сортировки —овка массива. выбором Возрастание

9 (ТУ) ПредваАлгори

ри ртмтельная сорти сортировки —

овка массива. обменом Возрастание

10 ) ро зрастание (ФХЦШ Сортив очередь

вку осуществля

ть при добавлении Во

11 (ЩЭЮЯ) рти Без со ровки очереди

Таблица 2 Варианты обхода дерева

Вариант Алгоритм обхода дерева 1 (А-К) Префиксный 2 (Л-Я) Постфиксный

– 261 –

Page 262: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

Задание 5

Дан либо исходный текст, либо код этого текста (в зависимости от вида функции варианта). Реализовать алгоритм с соответствую-щими особенностя

Особенности алгоритма

ми. Выбор алгоритма и вида функции

Вариант

Название словар- Вид ного ал-горитма

функции

1 2 3 4

1 (А) LZ77 кодирование иск в словаре подстроки из бу-

фера для определения ее первого по

вхождения справа

2 (Б) LZ77 кодирование поиск в словаре подстроки из бу-фера для определения ее первого вхождения слева

3 (В) LZ77 декодирование

4 (Г) LZSS кодирование поиск в словаре подстроки из бу-фера для определения ее первого вхождения справа

5 (Д) LZSS кодирование фера дпоиск в словаре подстроки из бу-

ля определения ее первого ия слева вхожден

6 (Е) LZSS декодирование

7 из бу-ервого

вхождения справа дирование

поиск в словаре подстрокифера для определения ее п (ЖЗ) LZB ко

дирование поиск в словаре подстроки из бу-фера для определения ее первого вхождения слева

8 (И) LZB ко

9 (К) LZB декодирование 1 кодирование 0 (Л) LZ78 1 екодирование 1 (М) LZ78 д1 вание 2 (Н) LZW кодиро

– 262 –

Page 263: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

1 2 3 4 1 декодирование 3 (О) LZW

1 кодирование модификация LZW: ограничение размера словаря, при превышении его размера словарь очищается

4 (П) LZC

1модификация LZW: ограничение

5 (Р) LZC декодирование размера словаря, при превышении его размера словарь очищается

16 (С) LZC кодирование

модификация LZW: ограничение размера словаря, при превышении его размера из словаря убираются строки, которые редко использу-ются

1 использование больших массивов 7 (Т) LZ77 кодирование из текстовых файлов

18 (У) LZ77 кодирование использование больших массивов из текстовых файлов

1 вание использование больших массивов из текстовых файлов 9 (Ф) LZSS кодиро

2 дирование использование больших массивов из текстовых файлов 0 (Х) LZSS ко

21 (Ц) LZ78 кодирование использование больших массивов из текстовых файлов

22 (ШЩ) LZ78 кодирование использование больших массивов из текстовых файлов

2 кодирование использование больших массивов из текстовых файлов 3 (Э) LZW де

24 кодирование использование больших массивов (ЭЮЯ) LZW из текстовых файлов

– 263 –

Page 264: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

áÄÑÄçàü Ñãü ëÄåéèêéÇÖêäà

íÖëíõ Ñãü ëÄåéäéçíêéãü

е информации и ее потребителя, соответствие инф

адекватность; адекватность; ватность.

я;

ответа. я смыслового содержания информации исполь-

зуекая мера информации;

а информации; ера информации;

мера информации.

;

; ое;

1. Отношениормации цели управления, которая на ее основе реализуется,

отражает: я адекватность; 1) синтаксическа

2) семантическая 3) прагматическая

адек4) смысловая2. Информация не может быть следующих видов: 1) дискретная; 2) логическа3) аналоговая; 4) нет правильного3. Для измеренится: 1) синтаксичес2) семантическая мер3) прагматическая м4) вероятностная 4. К методам классификации объектов не относится: 1) иерархический2) сетевой; 3) фасетный; 4) дескрипторный. 5. Классификационное кодирование включает в себя: 1) логическое; 2) параллельное3) полудуплексн4) симметричное.

– 264 –

Page 265: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

6. Регистрационное кодирование включает в себя: 1) групповое; 2) порядковое;

е. это:

я хранения или пер утем отбрасывания маловажной информации;

личества бит, необходимых для хранения или пер ормации, что дает возможность передавать соо быстро и хранить более экономно и оперативно;

я более быстро и хранить бол

ю емкость, равную отношению количества сем рмации в сообщении к объему обрабатывае-мы

рмация содержит минимальный, но достаточ-ный ия правильного решения состав (набор) показате-лей

нформации не позже заранее назначенного мом гласованного с временем решения поставлен-ной

3) серийное; 4) логическо7. Цель сжатия — 1) уменьшение информации, необходимой дледачи данных, п2) уменьшение коедачи заданной инфбщения более3) возможность передавать сообщени

ивно. ее экономно и операт8. Семантическуантической инфох данных, отражает: 1) репрезентативность; 2) содержательность;

; 3) достаточностьь. 4) доступност

9. То, что инфо для принят

означает: 1) содержательность; 2) достаточность; 3) доступность;

ость. 4) актуальн10. Поступление иента времени, со

задачи, означает: 1) доступность; 2) актуальность; 3) своевременность; 4) точность.

– 265 –

Page 266: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

11. Степень близости получаемой информации к реальному со-сто сса, явления и т. д.) определяет:

;

собность информации реагировать на изменения исход-ных ия необходимой точности отражает:

ормации не выделяют кла

ации:

о стабильности информация не может быть:

янию объекта (проце1) доступность; 2) актуальность3) своевременность; 4) точность. 12. Спо данных без нарушен1) доступность; 2) актуальность; 3) устойчивость; 4) точность. 13. По признаку места возникновения инфсс … информации: 1) входной; 2) выходной; 3) управляющей; 4) внутренней. 14. По стадии обработки не может быть … информ1) первичной; 2) дополнительной; 3) промежуточной; 4) результатной. 15. По способу отображения информация не подразделяется: 1) на текстовую; 2) графическую; 3) логическую; 4) нет правильного ответа. 16. П1) справочной; 2) переменной; 3) постоянной; 4) нет правильного ответа.

– 266 –

Page 267: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

17. При классификации информации по функциям управления не выд

:

Вероятностный подход к измерению дискретной и непре-рыв

, явлений, про соответствии с определенным при

заключается в следующем: «зн в порядке убывания их ве-роя ельно делят на две части с при-бли

еляют следующие группы: 1) плановая; 2) нормативно-справочная; 3) учетная; 4) стратегическая. 18. Постоянная информация не может быть1) справочной; 2) нормативной; 3) управленческой; 4) плановой. 19. Информацию нельзя передавать: 1) последовательно; 2) параллельно; 3) симметрично; 4) нет правильного ответа. 20. ной информации предложил: 1) Р. Клаузиус; 2) Р. Фишер; 3) К. Шеннон; 4) К. Вирт.

объектов (предметов21. Система распределенияцессов, понятий) по классам в знаком — это: 1) кодирование; 2) сжатие; 3) классификация; 4) верификация. 22. Метод, алгоритм которого ачения дискретной СВ располагаюттностей, а затем последоватзительно равными вероятностями, к коду первой части добав-

ляют 0, а к коду второй — 1», — это:

– 267 –

Page 268: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

1) метод Шеннона–Фэно; 2) метод Хаффмена;

етическое кодирование;

ных значений классификационного при

икаторы; ионный признак; формационного объекта. кода — это: сположения в коде символов, используемых для

оболедования в коде символов;

ь правил кодового обозначения объектов; анное сообщение.

рмации изучает:

прерывные случайные величины; ования. ге процесса функционирования АИПС проис-

ход

;

солютной негибкости структуры; ета.

3) арифм4) метод LZW. 23. В фасете содержится: 1) совокупность однородзнака; 2) классиф3) классификац4) атрибуты ин24. Структура1) порядок разначения классификационного признака; 2) порядок с3) совокупност4) зашифров25. Теория инфо1) разделы кибернетики; 2) свойства информации; 3) дискретные и не4) алгоритмы кодир26. На первом шаит: 1) выделение из поискового массива тех документов, содержа-

ние которых соответствует поисковому предписанию2) процесс индексирования текстов; 3) кодирование; 4) ввод запроса пользователя. 27. Недостаток иерархической системы классификации со-

стоит: 1) в сложности построения; 2) простоте построения; 3) аб4) нет правильного отв

– 268 –

Page 269: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

28. Сообщение — это: емени физический процесс;

: ветствии с

опр-

наяских процессов и сведения,

слу вами лю-дей венной сфере;

предназначена для ввода, обработки, хранения и по-иск

ции;

существует класса:

гические системы;

ющей подсистемы:

чения;

«Специализированный искусственный язык, предназначен-ный ержания и формальных характе-

1) изменяющийся во вр2) известие; 3) совокупность знаков или первичных сигналов, содержащих

информацию; 4) нет правильного ответа. 29. Экономическая информация — это1) система распределения объектов по классам в соотеделенным признаком; 2) процедура группировки на качественном уровне, направлен на выделение однородных свойств; 3) отражение социально-экономичежащие для управления этими процессами и коллекти в производственной и непроизводст4) дискретные и непрерывные случайные величины. 30. АИПС а: 1) синтаксической информации; 2) семантической информа3) прагматической информации; 4) логической информации. 31. В классификации АИПС не1) документальные системы; 2) фактографические системы; 3) информационно-ло4) интеллектуальные системы. 32. В АИПС не выделяют обеспечива1) информационного обеспечения; 2) лингвистического обеспечения; 3) алгоритмического обеспе4) технического обеспечения. 33. для описания основного сод

– 269 –

Page 270: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

рис ационного поиска» определяет пон

различают следую-щег

иц ИПЯ не используются: бого

ест

ила языка;

нно-поисковым языкам, его конструкциям и эле

ь лексико-грамматическими средст-вам

енным; элементы, отображающие волевое

поб

АИ интеллектуальные;

тик документов с целью информятие: 1) язык; 2) информационный язык; 3) информационно-поисковый язык; 4) алгоритмический язык. 34. Представления языковых объектов нео уровня: 1) семантика; 2) синтаксис; 3) полисемия; 4) фонетика. 35. Основным элементом ИПЯ не является: 1) алфавит; 2) синтаксис; 3) лексика; 4) грамматика. 36. В качестве лексических един1) слова, фрагменты слов, словосочетания и выражения люественного языка; 2) коды и шифры; 3) прав4) нет правильного ответа. 37. К информациоментам может быть предъявлено требование: 1) ИПЯ должен располагати для точного выражения основного содержания текста; 2) ИПЯ должен быть двусмысл3) ИПЯ должен содержатьуждение, эмоции и т. д.; 4) ИПЯ должен быть удобным для изучения. 38. По характеру входной продукции не различают следующие ПС: 1)

– 270 –

Page 271: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

2) документальные; 3) фактографические; 4) информационно-логические. 39. Разбиение АИПС, позволяющее выделить ее информацион-

ные, программные, технические и трудовые компоненты — это:

компонентная декомпозиция;

ющие; зиция.

сом ИП

отношения; ;

й;

;

1) функциональная декомпозиция; 2) по3) декомпозиция на обеспечивающие составляющие; 4) организационная декомпозиция. 40. Разбиение АИПС на обеспечивающие подсистемы — это: 1) функциональная декомпозиция; 2) покомпонентная декомпозиция; 3) декомпозиция на обеспечивающие составля4) организационная декомпо41. Совокупность всех отношений, реализуемых синтаксиЯ — это: 1) синтагматические2) парадигматические отношения3) логические отношения; 4) информационные отношения. 42. По способу образования словарного состава не различают: 1) ИПЯ с жестким словарем; 2) ИПЯ со свободным словарем;

й и определени3) ИПЯ со словарем поняти4) ИПЯ без словаря. 43. По наличию парадигматических отношений не различают: 1) ИПЯ с базисными отношениями; 2) ИПЯ без базисных отношений; 3) ИПЯ с внешними отношениями; 4) нет правильного ответа. 44. По учету синтагматических отношений не различают

ИПЯ: 1) с мощной синтагматикой

– 271 –

Page 272: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

2) с неразвитой синтагматикой; 3) с развитой синтагматикой;

ИПЯ лежит:

концептов;

в ИПС процедуры усечения не п

р

Я и формиро-ван

вка нескольких ПП, соответствующих подзапро-сам

4) нет правильного ответа. 45. В основе построения дескрипторных1) принцип координатного индексирования; 2) принцип полного индексирования; 3) принцип выборочного индексирования; 4) принцип статистического индексирования. 46. Полисемия — это: 1) слова, сочетания, выражения, тексты при одинаковом напи-

сании имеют различный смысл; 2) один и тот же знак выражает пучок родственных3) один и тот же денотат имеет разные знаки; 4) система грамматических категорий и способов их выражения. 47. При морфологическом анализе рименяются: 1) с использованием словарей; 2) без использования словарей; 3) с использованием аппа ата математической статистики; 4) нет правильного ответа. 48. Перевод запросов на ИПЯ не выполняется в следующих ва-

риантах: 1) перевод всего информационного запроса на ИПие единого ПОЗа; 2) использование в процессе поиска всего оригинального сооб-

щения или его составляющих; 3) перевод отдельных составляющих на ИПЯ и формирование

поисковых образов подзапросов; 4) нет правильного ответа. 49. Поисковое предписание (ПП), т. е. задание АИПС на поиск

информации, не формулируется следующим образом: 1) формулировка единого ПП, соответствующего единому ПОЗу; 2) формулиро;

– 272 –

Page 273: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

3) формулировка одного ПП, соответствующего всем ПОЗам; 4) нет правильного ответа. 50. Поисковый аппарат АИПС не включает: 1) математический аппарат формализованного представления и

поиска информации; 2) методы и средства структурирования информационных за-

просов; 3) стратегии формирования информационного обеспечения;

инов запроса;

нного документооборота, включающая пред-ста льзованием интернет-технологий;

Web con-ten

й предприятия;

вует отличий.

4) критерии выдачи информации. 51. Процесс формирования ПОЗа не включает следующие этапы: 1) выявление значимых терм2) перевод дескрипторов на естественный язык; 3) формирование поискового образа запроса; 4) нет правильного ответа. 52. Не существует следующих морфологических словарей: 1) основ слов; 2) окончаний слов; 3) ключевых слов; 4) нет правильного ответа. 53. Управление контентом предприятия — это: 1) система электровление документации с испо2) решение, объединяющее EDMS-технологии; 3) единый интернет-портал предприятия; 4) нет правильного ответа. 54. Отличия Enterprise content management (ECM) от

t management (WCM): 1) ECM используется для управления контентом всего пред-

приятия, а WCM только для управления контентом, размещенного на web-портале;

2) ECM используется как хранилище знани3) ECM используется, чтобы управлять информацией, не связы-

вая ее с источником или требуемым представлением; 4) не сущест

– 273 –

Page 274: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

55. Можно ли отнести к АСУП системы электронного доку-ментооборота и почему:

ументооборота является только ча-сть

явл

ктографической.

яти

системы технологической под зволяют автоматизировать сле-дующие

ания к выпуску продукции;

ы CAD (Computer Aided Design) и CA

D, т. к. расчет конструкций является пер-вым

нерного про инже-нер

1) нельзя, т. к. система докю системы управления предприятием; 2) нельзя, т. к. функции системы документооборота не совпа-

дают с функциями АСУП; 3) можно, в том случае если основной продукцией предприятия яются документы; 4) нельзя, т. к. система электронного документооборота являет-

ся д АСУП — фаокументальной системой, а56. К основной задаче информационной системы бюджетиро-

вания относится: 1) формирование бюджета организации; 2) формирование отчетов об использовании средств предпри-я; 3) прогноз финансового состояния; 4) нет правильного ответа. 57. АСТПП (Автоматизированныеготовки производства) по

операции: 1) подготовка оборудов2) планирование и управление вспомогательными процессами

на производстве; 3) разработка маршрутов изготовления изделий; 4) нет правильного ответа. 58. Что отличает систем

E (Computer-Aided Engineering): 1) СAD и CAE не отличаются ничем, т. к. обе они используются

в инженерном проектировании; 2) CAE включает CA этапом проектирования; 3) CAE реализуют математические алгоритмы инже

еализуют функцииектирования, а CAD, как правило, рной графики; 4) нет правильного ответа.

– 274 –

Page 275: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

59. Что отличает концепции компьютеризированного интег-рированного производства (CIM — Computer Integrated Manufact-uring) и гибкие производственные системы (ГПС):

ютерной техники; возможно, реали-зов

агает создание автоматической про-изв

о ответа. т Управление цепочками поставок (SCM —

Sup ement) и Управление взаимоотношениями с кли ustomer Relationships Management):

пла

анирование и оптимизация сна ет внимание на взаимо-дей

нцепции CALS (Continuous Acqusition and Life ная под ycle Ma ненным циклом изделия):

обеспечивающей интеграцию про

. Аббревиа-тур ной промышленности, а PLM — в гр

1) это одна и та же концепция автоматизированного производ-ства в русскоязычном и англоязычном вариантах;

2) гибкие производственные системы не предполагают обяза-тельного использования компь

ать «гибкость» путем организационных мероприятий; 3) концепция ГПС предполодственной системы, в то время как CIM не требует полной ав-

томатизации; 4) нет правильног60. Что отличаеply Chain Managентами (CRM — C1) это одни и те же системы, главной задачей которых являетсянирование работы с поставщиками; 2) SCM основное внимание уделяет работе с поставщиками, в

то время как CRM — покупателям; 3) главная задача SCM-систем — пл

акцентирубжения, в то время как CRMствии с клиентом; 4) нет правильного ответа. 61. Что отличает ко cycle Support — непрерывные поставки и информацион

продукции) и PLM (Product Lifecдержка жизненного циклаnagement — управление жиз1) PLM — совокупность средств информационной поддержки

изделия и интегрирования автоматизированных систем предпри-ятия, что практически совпадает с определением понятия CALS как единой информационной системы,

мышленных автоматизированных систем; 2) CALS и PLM обозначает одну и ту же концепциюа CALS используется в военажданской;

– 275 –

Page 276: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

3) в отличие от PLM, методология CALS регламентируется стандартами;

4) нет правильного ответа. 62. Что отличает автоматизированные системы (АС) и ин-

формационные системы: 1) АС и ИС отличает объект автоматизации;

множество компьютерных систем; андартом ГОСТ 34, в то время как

данных;

АС

люди, взаимодействующие с те

спользование баз данных;

. «Информационная система (ИС) — это система, предна-зна ия информационной модели, чаще всего — ка-кой ловеческой деятельности». В данной форму-лир ено:

истем; ляющей системы;

2) АС и ИС обозначает одно3) АС регламентируются ст

понятие ИС не имеет четкого определения; 4) нет правильного ответа. 63. Что отличает автоматизированные системы (АС) и ин-

формационные системы: 1) АС не используют хранилища2) АС и ИС обозначают одно множество компьютерных систем; 3) АС предполагает автоматизацию бизнес-процессов, в то вре-

мя как ИС могут использовать только ручную обработку информа-ции;

4) нет правильного ответа. 64. Что общего в автоматизированных системах ( ) и ин-

формационных системах: 1) в АС и ИС в систему включаютсяхнологическим оборудованием; 2) АС и ИС предполагают и3) АС и ИС предполагают использование компьютеров; 4) нет правильного ответа. 65ченная для веден-либо области чеовке не определ1) участие компьютерных с2) участие человека в качестве состав3) задачи информационной системы; 4) нет правильного ответа.

– 276 –

Page 277: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

66. Можно ли отнести машинные информационные системы (computer-based information systems) к информационным системам и п

ационные системы выполня-ют ционные системы;

нформационных систем; ьного ответа. тандартов на автоматизированные системы

вкл

СТ 21.ххх;

зрабатывают в случае: к АС;

ключены в задание на проектирова-ние

ильного ответа. 4.ххх изменения к ТЗ на АС не

офо к ТЗ;

м заказчиком и разработчиком;

Т 34.602 обозначен порядок офо ния заказчику результатов работ по соз-дан

еме;

очему: 1) можно, т. к. машинные информте же задачи, что и информа2) машинные информационные системы являются подмножест-

вом информационных систем; 3) нельзя, т. к. это только часть и4) нет правил67. Комплекс сючает в себя: 1) ГОСТ 34.ххх; 2) ГОСТ 19.ххх; 3) ГО4) ГОСТ 37.ххх. 68. В соответствии ГОСТ 34.ххх ТЗ не ра1) плохо выраженных требований2) когда требования к АС в; 3) когда разрабатывается часть АС; 4) нет прав69. В соответствии ГОСТ 3рмляются: 1) дополнением2) протоколом, подписанны3) новой версией ТЗ; 4) нет правильного ответа. 70. В какой части ТЗ по ГОСрмления и предъявлеию системы: 1) раздел требований к сист2) раздел «порядок контроля и приемки системы»; 3) раздел общих требований; 4) нет правильного ответа.

– 277 –

Page 278: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

71. В соответствии с ГОСТ 34.ххх, перечень наименований и комплектность разрабатываемых документов на АС:

ании на создание АС

и исп

ются;

ствии с ГОСТ 34.201, к документации на авто-мат

ых документов, в котором полно-сть

ние; ации на АС, необходимой для изго-

товм;

ии: ГОСТ 34.601;

1; 1;

:

1) должны быть определены в техническом зад; 2) должны быть определены в договоре между заказчиком олнителем; 3) не определя4) нет правильного ответа. 72. В соответизированную систему не относят:

1) комплекс взаимоувязанню описаны все решения по созданию и функционированию сис-

темы; 2) только техническое зада3) совокупность документления, строительства, монтажа и наладки автоматизированной

системы в цело4) нет правильного ответа. 73. В соответствии с ГОСТ 34.603, испытания АС проводят

на стад1) рабочая документация по2) ввод в действие по ГОСТ 34.603) сопровождение АС по ГОСТ 34.604) нет правильного ответа. 74. В соответствии с ГОСТ 34.603, в зависимости от взаимо-

связей испытываемых в АС объектов, не может быть … испыта-ний:

1) автономных; 2) комплексных; 3) гибридных; 4) нет правильного ответа.

высказывание75. Укажите верное1) приемочным испытаниям АС должна предшествовать ее

опытная эксплуатация на объекте;

– 278 –

Page 279: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

2) опытной эксплуатации АС на объекте должны предшество-вать ее приемочные испытания;

приемочными испытаниями;

603, в зависимости от вида тре

ации в ней не подвергают:

завершают (ГОСТ 34.

я отр

;

АСчеты и оценки включают в состав приложений к ТЗ;

3) опытная эксплуатация АС на объекте производится парал-лельно с

4) нет правильного ответа. 76. В соответствии с ГОСТ 34.бований, предъявляемых к АС на испытаниях, проверке или

аттест1) персонал; 2) АС в целом; 3) техническую документацию; 4) нет правильного ответа. 77. Работу по комплексным испытаниям

603): 1) оформлением акта приемки в опытную эксплуатацию; 2) протоколом результатов испытаний; 3) нет верного ответа; 4) нет правильного ответа. 78. Во время опытной эксплуатации АС по ГОСТ 34.603 длажения информации об отказах, сбоях, аварийных ситуациях

и т. п. ведут: 1) акт сверки с требованиями2) рабочий журнал; 3) протоколы; 4) нет правильного ответа. 79. Результаты испытаний объектов, предусмотренных про-

граммой, фиксируют (ГОСТ 34.603): 1) в акте сверки с требованиями; 2) рабочем журнале; 3) протоколах; 4) нет правильного ответа. 80. В соответствии с ГОСТ 34.602, состав какого раздела ТЗ на

может включать расчет ожидаемой эффективности системы: 1) рас

– 279 –

Page 280: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

2) расчеты и оценки включают в раздел «состав и содержание работ по созданию системы»;

о ответа.

а, следующего за титульным, в верх-ней

рвого листа, следующего за титульным, в ниж-ней

правильного ответа. иков ТЗ

на

еднем листе ТЗ;

раз

выделяют (ИСО 900

е;

er-based information system) явл

мом информационной системы, в которой использу-етс техника;

стемы;

3) расчеты и оценки не включают в состав ТЗ; 4) нет правильног81. Согласно ГОСТ 34.602, номера листов в ТЗ проставляют: 1) начиная с первого лист части листа; 2) начиная с пе части листа; 3) начиная с первого (титульного) листа, в верхней части листа; 4) нет82. В соответствии с ГОСТ 34.602, подписи разработчАС помещают: 1) на титульном листе ТЗ; 2) на посл3) не помещают, т. к. помещаются лишь подписи заказчика и работчика; 4) нет правильного ответа. 83. Какие типы бизнес-процессов обычно не0): 1) процессы управления; 2) процессы контроля; 3) процессы вспомогательны4) операционные процессы. 84. Компьютерная система (computяется: 1) синония компьютерная2) частью информационной си3) понятием, включающим информационную систему и техни-

ческие средства, на которых развернута информационная система; 4) нет правильного ответа. 85. СИБИД — это: 1) система стандартов по информации, библиотечному и изда-

тельскому делу;

– 280 –

Page 281: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

2) стандарты, интегрирующие бизнес-процессы и документа-цию;

3) стандарты информационно-библиотечной иерархии доку-мен

о требованиям заказчика;

учаем АС;

бщением понятия АС, т. к. любые автоматизированные сис

ак Direct-Attached Storage, Sto

ема программно-проектной разработки;

твета.

нилища дан

тов; 4) нет правильного ответа. 86. ГПС (ГОСТ 26228-90) — это: 1) системы, реализующие концепцию «безлюдного производ-

ства»; 2) государственная правовая система; 3) гибкие системы проектирования, позволяющие разработать

информационные системы согласн4) нет правильного ответа. 87. АСУ является: 1) наряду с САПР, частным сл2) синонимом автоматизированных систем; 3) оботемы имеют функцию управления; 4) нет правильного ответа. 88. Русскоязычный термин «хранилища данных» обозначает: 1) Data Warehouse; 2) системы хранения данных, таких кrage Area Network; 3) СУБД большой емкости; 4) нет правильного ответа. 89. СППР — это: 1) инструмент, одной из главных функций которого является

оказание помощи лицу, принимающему решения; 2) сист3) программная система, реализующая алгоритмы принятия

управленческих решений; 4) нет правильного о90. Можно ли OLTP-системы считать частным случаем баз

данных, почему: 1) можно, т. к. OLTP-системы должны использовать храных;

– 281 –

Page 282: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

2) нельзя, т. к. базы данных не являются информационными системами;

3) нельзя, т. к. OLTP-системы используют не базы данных, а хранилища данных;

4) можно, т. к. OLTP-системы и базы данных не являются ин-формационными системами.

знания;

R s

Relational OLAP):

данных;

денных нормальных форм удовлетво-ряю

ry in Databases): -

ныхых знаний в «сырых» данных исполь-

зует

91. Инженер по знаниям выполняет следующие задачи в экс-пертной системе:

1) создает новые2) отображает знания экспертов в базу знаний экспертной сис-

темы; 3) обучает пользователей системы знаний работе с ней; 4) нет правильного ответа. 92. Наиболее распространенные СППР: 1) СОД; 2) I S (information reporting sy tems — ИС генерации отчетности); 3) Business Intelligence; 4) нет правильного ответа. 93. Недостатки ROLAP (1) малая производительность системы; 2) ограниченный объем хранилища3) трудность реализации функций SQL языка; 4) отсутствуют недостатки. 94. Какой из вышепривет реляционные хранилища ROLAP: 1) 1 НФ; 2) 2 НФ; 3) 3 НФ; 4) всем вышеперечисленным. 95. Что отличает системы Business Intelligence и KDD (Knowl-

edge Discove1) система Business Intelligence включает процесс поиска полез знаний в «сырых» данных; 2) процесс поиска полезн системы Business Intelligence;

– 282 –

Page 283: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

3) это одни и те же системы; различное название используется раз

нных) — это:

хся в разнородных хранилищах; исследования больших массивов

инф

ений результатов от плана;

итмов обработки данных: ata mining не работают с большим массивом

данвы-

ска атем проверяется ее достоверность, в то вре е фрагменты (пат-тер заранее неизвест-ные ;

возможность обработать данные, но не получить неизвестные знания о системе;

4) нет правильного ответа. 98. В чем отличие документальных систем и документных: 1) документальные системы включают в качестве подмножест-

ва системы документооборота, к которым и относятся документные системы;

2) документные системы основаны на представление информа-ции в документах, поэтому они обозначают те же самые системы, что и документальные;

3) документные системы включают все системы, работающие с документами, следовательно, и системы, в которых информация представлена в текстовом виде (документальные системы);

4) нет отличия.

ными производителями систем; 4) нет правильного ответа. 96. Data mining (Добыча да1) процесс добычи знаний из большого массива данных, нахо-

дящи2) процесс аналитическогоормации, состоящий из трех этапов: исследование, построение

прогнозирующей модели или структуры и ее проверка; 3) набор алгоритмов исследования данных с целью выявления

отклон4) нет правильного ответа. 97. Что отличает алгоритмы Data mining от статистических

алгор1) алгоритмы Dных; 2) статистические алгоритмы основаны на том, что сначала зывается гипотеза, а змя как в основе data mining заложены готовы

ют определитьны дынных), которые позволя типы закономерности из известных3) статистические алгоритмы дают

– 283 –

Page 284: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

99. Чем других ин-формационны

нн ис л П маментальной прео азовани

2 данном систе формац отображ ся в текстовом виде

3 данном систе одная и ходная ормация ред-ставл тся доку нтами;

4 ет отличи100. Что общего у поисковых алгоритмов и оритмов лас-

сификации информации: 1 оисковы алгоритм и алгоритмы классификации инфор-

мац спользу в инф ационны система2 оисковы лгоритм ключаю качеств одзадачи лас-

сификацию информации; 3 поисковы алгоритмы ИПЯ ндексир ние

и кл ификаци индекс использ фасетны иерархические и дескрипторны лгоритм

4 т общих ризнаков101. Что общего у до ентальн информ онных систем

и автоматизированных систем (АС): 1 С включ т компь рные до ентальн системы2 С используют те алгоритмы поиска ормаци что

и до ентальны системы3 окументальные сис ы могут пользов АС в качестве

подсистем; 4 т прави ого отв102. Что общего у сис выборк данных формац но-

поисковых сист : 1 ни используют од ковый алгоритм к ификац ин-

формации; 2 и используют одинаковый критерий выб ментов; 3 те и друг системы гут использоваться иска ф ов; 4 т общих ризнаков

отличают документальные системы от х систем:

1) в да ом типе с тем испо ьзуется ИД (инфор ции доку-бр е);

) в типе м ин ия ает; ) в типе м вх вы инф пяе ме) н я.

алг к

) п е ы ии и ются орм х х; ) п е а ы в т в е п к

) е проводят и оваасс ю ов, уя е,

е а ы; ) не п .

кум ых аци

) А аю юте кум ые ; ) А же инф и, кум е ; ) д тем ис ать

) не льн ета. тем и и ин ион

ем) о ина ласс ии

) он ора доку) и ие мо для по акт) не п .

– 284 –

Page 285: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

103. Фактогра это: 1) системы, предназначенные для поиска фактов;

фические поисковые системы —

2) системы, использующие в качестве языка запроса искусст-венный язык, такой как SQL;

3) документальные системы, предназначенные для поиска фак-тов;

4) нет правильного ответа. 104. Что отличает информацию, представленную в интерне-

те, от информации в классических документальных системах: 1) неструктурированность и избыточность информации интер-

нета; 2) представление информации по различным протоколам; 3) представление документов в интернете в различных форма-

тах; 4) нет отличия. 105. Какие из перечисленных показателей могут быть отнесе-

ны к экспертным оценкам качества информации в интернете: 1) PageRank-метрика; 2) структурные и вспомогательные индексы; 4) показатель релевантности; 4) ни одно из вышеперчисленных.

– 285 –

Page 286: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

äãûóà ä íÖëíÄå Ñãü ëÄåéäéçíêéãü

№ теста № ответа № теста № ответа № теста № ответа 1 3 36 3 71 1 2 2 37 1 72 2 3 2 38 1 73 2 4 2 39 2 74 3 5 2 40 3 75 1 6 2 41 1 76 3 7 2 42 3 77 1 8 2 43 3 78 2 9 2 44 1 79 3

10 3 45 1 80 1 11 4 46 2 81 1 12 3 47 3 82 2 13 3 48 2 83 2 14 2 49 3 84 2 15 3 50 3 85 1 16 1 51 2 86 1 17 4 52 3 87 1 18 3 53 2 88 1 19 3 54 3 89 1 20 3 55 3 90 2 21 3 56 3 91 2 22 1 57 3 92 2 23 1 58 3 93 1 2 3 94 1 4 1 59 2 3 95 1 5 2 60 2 3 96 2 6 2 61 2 3 97 2 7 3 62 2 3 98 1 8 3 632 99 1 9 3 64 1 30 2 65 2 100 3 31 4 66 3 101 1 3 2 3 2 3 67 1 103 103 1 3 3 68 2 34 3 69 3 104 1 35 2 70 3 105 1

– 286 –

Page 287: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

íÖåõ äéçíêéãúçõï êÄÅéí

Ц нтр — вооружить обучаемых практиче-ским кам ания методологий разработки информа-цион стем новых подходов к разработке п логику при-няти ний разработки. В результате вы-полн ракт ы научиться оце-нива льны задачи на основе выявленных фу ых элементов автоматизи-руем ект ое задание на ин-формационную

тст данной дисциплине кон ра крепление теоретических знан иобр авыков по решению задач разр ин ых систем, а также формирование у обучаемых представления о составе, содержании и процедуре создания основных документов в процессе канонического проек-тиров

е Word-я с ис-

, который содержит

исполь-нии этих

. лируются общие требования

системы). ивается перечень и структура

я системой).

ель ко ольной работыи навы и использовных си , способствовать восприятию ими

чения, выработатьрограммного обеспе при выборе средствя реше

ения п ической работы студенты должнй объем проекта, его цели инкций и информацион

ть реан

а, а также формировать технического объ систему.

В соотве вии с тербованиями ГОС по трольная бота предусматривает заий, пр етение практических наботки формационн

ания ИС. Отчет по практической работе предоставляется в вид

файла, в котором средствами приложения он оформляетспользованием табличных и графических материалов.

Каждый обучаемый проводит обследование отдельной пред-тной области (в соответствии со своим вариантом), а в качествеме

результата представляет отчет об обследованииразделы:

1. Анализ существующего уровня автоматизации. 2. Составляется список программного обеспечения,

зуемого в компании, и приводятся данные об использовапакетов в каждом из подразделений организации

3. Общие требования к ИС (формук функциональности разрабатываемой

4. Формы документов (устанавлдокументов, которые должны формироватьс

5. Описание системы учета.

– 287 –

Page 288: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

Описание системы учета включает в себя следующие документы: • учетная политика компании; • план счетов и используемых аналитик; • список типовых хозяйственных операций и их отражение в

каждому справочнику, проек-

ионная диаграмма ионной структуры подраз-

ственности). атизируемых бизнес-процессов (все

ы быть перечислены в общем иметь свой уникальный номер).

ужит для сать взаимодействие организации на верхнем уров-

а бизнес-процессов).

мого. й работы

область

проводках. 6. Описание справочников. По

тируемому в системе, дается описание необходимой иерархической структуры.

7. Организационная диаграмма (организациспользуется для отражения организацделений предприятия и их зон ответ

8. Описание состава автомбизнес-процессы компании должнсписке и каждый должен

9. Физическая диаграмма (физическая диаграмма слтого, чтобы опине с внешними контрагентами).

10. Описания бизнес-процессов (книг11. Проект технического задания. Вариант контрольной выбирается исходя из первой буквы фа-

ми ии обучаел Варианты контрольно

Вариант Предметная1 (А) Продуктовый магазин 2 (Б) Книжный магазин 3 (В) Страховое агентство 4 (Г) Риэлторская фирма 5 (Д) Фитнес-клуб 6 (Е) Дом отдыха, туристическая база

7 (ЖЗ) Кафе, столовая 8 (И) Строительно-монтажное предприятие 9 (К) Авторемонтное предприятие

10 (Л) Гостиница 11 (М) Туристическое агентство

– 288 –

Page 289: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

Вариант Предметная область 12 (Н) Центр проката спортивного снаряжения 13 (О) Аптека 14 (П) Библиотека 15 (Р) Товарищество собственников жилья 16 (С) Рекламное агентство 17 (Т) Ателье

18 (У) Отдел материально-технического снабжения предприятия

19 (Ф) Бюро по трудоустройству 20 (Х) Отдел кадров

21 (ЦЧ) Отдел вневедомственной охраны 22 (ШЩ) Агентство доставки грузов

23 (Э) Дошкольное учреждение 24(ЮЯ) Библиотека

Çéèêéëõ Ñãü èéÑÉéíéÇäà ä ùäáÄåÖçì (áÄóÖíì)

стики информации.

информации и ее потребителя, соответствие ин-орая на ее основе реализуется.

нформации.

ификации объектов. любой классификации.

ание.

.

1. Формально-структурные характери2. Степень соответствия образа объекта и самого объекта. 3. Отношение

формации цели управления, кот4. Виды информации. 5. Меры количества и6. Измерение смыслового содержания информации. 7. Методы класс8. Требования, соблюдаемые при9. Системы кодирования. 10. Классификационное кодиров11. Параллельное кодирование. 12. Последовательное кодирование. 13. Регистрационное кодирование. 14. Понятие сжатия информации и ее цели. 15. Качественные характеристики информации

– 289 –

Page 290: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

16. Классификация информации по признаку места возникновения. ботки.

мации по стабильности. управления.

формации.

рованной информационно-поисковой

. .

17. Классификация информации по стадии обра18. Классификация информации по способу отображения. 19. Классификация инфор20. Классификация информации по функциям21. Способы передачи информации. 22. Вероятностный подход к измерению дискретной и непрерыв-

ной информации. 23. Энтропия дискретной случайной величины. 24. Виды связи между дескрипторами. 25. Метод сжатия Шеннона–Фэно. 26. Метод сжатия Хаффмена. 27. Арифметическое кодирование. 28. Метод сжатия LZW. 29. Классификационные понятия точности информации. 30. Структура. 31. Свойства энтропии дискретных случайных величин. 32. Понятие сообщения и ин33. Понятие экономической информации. 34. Назначение Автоматизи

системы. 35. Процесс функционирования АИПС. 36. Классификация АИПС. 37. Обеспечивающие подсистемы АИПС. 38. Понятие поиска информации. 39. Понятие языка. 40. Понятие информационного языка. 41. Понятие алгоритмического языка. 42. Понятие информационно-поискового языка. 43. Уровни представления языковых объектов. 44. Основные элементы ИПЯ. 45. Понятие лексических единиц ИПЯ. 46. Требования к информационно-поисковым языкам, его конст-

рукциям и элементам. 47. Парадигматические отношения в ИПЯ48. Синтагматические отношения в ИПЯ

– 290 –

Page 291: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

49. Классификация АИПС по характеру входной продукции. 50. Разбиение АИПС на функциональные составляющие (подсис-

формационные,

ы. щие. беспечивающих

амматиче-

ния дескрипторных ИПЯ. иске при ис-

инации

о-

С.

е элементы дескрипторных ИПЯ.

темы). 51. Разбиение АИПС, позволяющее выделить ее ин

программные, технические и трудовые компоненты. 52. Разбиение АИПС на обеспечивающие подсистем53. Разбиение АИПС на организационные составляю54. Разбиение логико-семантических средств, о

создание и функционирование АИПС. 55. Понятие синтагматических отношений. 56. Классификация ИПЯ по характеру использования гр

ских средств. 57. Классификация ИПЯ по способу образования словарного со-

става. 58. Классификация ИПЯ по характеру словаря. 59. Классификация ИПЯ по наличию парадигматических отноше-

ний. 60. Классификация ИПЯ по учету синтагматических отношений. 61. Основы построе62. Нежелательные ситуации, возникающие при по

пользовании чистой координации. 63. Ликвидация недостатков использования чистой коорд

при поиске. 64. Способы построения словарей. 65. Количественные характеристики словарей информационн

поискового языка. 66. Процедуры усечения, применяемые при морфологическом ана-

лизе в ИПС. 67. Перевод запросов на ИПЯ. 68. Поисковое предписание. 69. Поисковый аппарат АИПС. 70. Процесс формирования ПОЗа.

ффективности АИП71. Основные показатели функциональной э72. Типы информационных массивов, используемых в ИПС.

представления языковых объектов. 73. Уровни 74. Основны

– 291 –

Page 292: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

75. Морфологические словари. 76. Системы электронного документооборота.

— Electronic Document

nt (ECM) от Web

. ами процессно-

ed man-

системами и ERP-системами. ы.

й под-

е системы CAD (Computer Aided Design) и CAE (Com-

ства (CIM-Computer Integrated Manufactu-мами (ГПС).

ement) и Управлением взаимоотношениями elationships Management).

nd

жизненного цикла продукции) и PLM (Product Life-

у автоматизированными системами (АС) и ин-формационными системами.

93. Общие черты в автоматизированных системах (АС) и информа-ционных системах.

94. Понятие информационной системы.

77. Направления развития систем EDMSManagement Systems.

78. Управление контентом предприятия. 79. Enterprise content management (ECM). 80. Отличия между Enterprise content manageme

content management (WCM). 81. Соотношение АСУП и системы электронного документооборота82. Отличие между ERP-системами и систем

ориентированного управления ABM/С (activity-basagement, activity-based cost.

83. Отличие между MRP II —84. Бухгалтерские информационные систем85. Основные задачи информационной системы бюджетирования. 86. Понятие САПР. 87. АСТПП (Автоматизированные системы технологическо

готовки производства). 88. Отличи

puter-Aided Engineering. 89. Отличие между концепцией компьютеризированного интегри-

рованного производring) и гибкими производственными систе

90. Отличие между Управлением цепочками поставок (SCM — Supply Chain Managс клиентами (CRM — Customer R

91. Отличие между концепцией CALS (Continuous Acqusition aLife cycle Support — непрерывные поставки и информационная поддержкаcycle Management — управление жизненным циклом изделия).

92. Отличие межд

– 292 –

Page 293: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

95. Машинные информац (computer-based informa-tion systems).

96. Комплекс стандартов на автоматизированные системы. 97.

я С хых решений по системе и

нес-процесс (ИСО 9000) и его виды. 112

116

ионные системы

Разработка ТЗ в соответствии с ГОСТ 34.ххх. 98. Перечень наименований и комплектность разрабатываемых до-

кументов на АС в соответствии с ГОСТ 34.ххх. 99. Документация на автоматизированную систему. 100. Испытани А в соответствии с ГОСТ 34.хх . 101. Разработка предварительных проектн

ее частям в соответствии с ГОСТ 34.601. 102. Стадии создания АС в соответствии с ГОСТ 34.601. 103. Требования ТЗ для информационного обеспечения системы в

соответствии с ГОСТ 34.602 для программного обеспечения системы в соответствии с ГОСТ 34.602.

104. Сроки согласования проекта ТЗ на АС согласно ГОСТ 34.602. 105. Расчет ожидаемой эффективности системы в соответствии с

ГОСТ 34.602. 106. Порядок разделов и подразделов ТЗ на АС, установленный в

ГОСТ 34.602. 107. Правила оформления ТЗ согласно ГОСТ 34.602. 108. Классификация информационных систем. 109. Подсистемы, выделяемые в информационной системе. 110. Жизненный цикл информационной системы. 111. Биз

. Компьютерная система (computer-based information system). 113. ГПС (ГОСТ 26228-90). 114. Классификация систем, основанная на форме представления

информации. 115. Группа стандартов, определяющая документальные информа-

ционные системы. . Система обработки данных.

117. Автоматизированные системы управления и их функции. 118. Management information systems (MIS). 119. Системы поддержки принятия решений (СППР). Примеры. 120. OLTP.

– 293 –

Page 294: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

121. Информационные системы руководства (ИСР, executive in-formation systems — EIS).

122

128

слой в системах Business Intelligence. 131

кации информа-

138

140

ание ручного труда для классификации информации

. Методы искусственного интеллекта. 123. Системы Business Intelligence. 124. Экспертная система и цели ее создания. 125. Инженер по знаниям и его задачи в экспертной системе. 126. Принципы, относящиеся к OLAP-системам. 127. Операции с OLAP-кубами.

. Системы MOLAP (Multidimensional OLAP) и их достоинства. 129. Недостатки ROLAP (Relational OLAP). 130. Семантический

. Сравнение системы Business Intelligence и KDD (Knowledge Discovery in Databases).

132. Системы Data mining и их алгоритмы. 133. Отличие документальных систем от документных и других

информационных систем. 134. Информация документального преобразования (ИДП). 135. Поисковые алгоритмы и алгоритмы классифи

ции. 136. Организация поисковой системы. 137. Общие черты систем выборки данных и информационно-

поисковых систем. . Фактографические поисковые системы.

139. Общие черты поиска в интернете и задачи классического по-иска информации.

. Поисковая система интернета. 141. Характеристики информации, представленной в интернете. 142. Показатели экспертной оценки качества информации в интер-

нете. 143. Использов

в интернете.

– 294 –

Page 295: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

ÉãéëëÄêàâ

Business Intelligence — интеллектуальный инструментарий, по-зволяющий решать проблемы доступа к разнородным данным, по-строению отчетов пользователей и анализу данных. Данные систе-мы могут включать: хранилища данных, запросы конечного пол

.

у переменными, кот

, построение прогнозирующей модели или стр

AP). Гибридные системы (Hybrid OLAP, HO

алгоритмов

ьзователя и инструмент для создания отчетов, OLAP-инструменты, Data Mining инструменты

Data mining (Добыча данных) — процесс аналитического ис-следования больших массивов информации (обычно экономиче-ского характера) с целью выявления определенных закономерно-стей и систематических взаимосвязей межд

орые затем можно применить к новым совокупностям данных. Этот процесс отнюдь не является аналогом поиска отклонений в данных при помощи OLAP-инструментария и включает три основ-ных этапа: исследование

уктуры и ее проверку. Как правило, приложения для «добычи данных» существенно отличаются от OLAP-продуктов и в большей степени предназначены непосредственно для специалистов. В сис-темах «добычи данных» реализованы совершенно другие инстру-ментальные средства от производителей ПО иного, чем средства OLAP.

HOLAP (Hybrid OLLAP) разработаны с целью совмещения достоинств и миними-

зации недостатков, присущих предыдущим классам. В книге Т. Конноли [49] данная технология описана как инструмент, управ-ляемый средой запросов (MQE) c промежуточным MOLAP-кубом.

Knowledge Discovery in Databases (KDD) — процесс поиска полезных знаний в «сырых данных». KDD включает в себя процес-сы подготовки данных, выбора информативных признаков, очистки данных, применения методов Data Mining (DM), постобработки данных. KDD не задает набор методов обработки и , он

– 295 –

Page 296: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

опр

го-мер

нные организованы не в форме реляционных таблиц, а в вид

, реа

ормации об-раз

нения ее характеристик и от инт

еделяет последовательность действий, которые необходимы для того, чтобы из исходных данных получить знания.

MOLAP (Multidimensional OLAP). В MOLAP-модели мноное представление данных реализуется физически. В специали-

зированных СУБД, основанных на многомерном представлении данных, да

е упорядоченных многомерных массивов.

OLAP-технология — это технология комплексного динамиче-ского синтеза, анализа и консолидации больших объемов много-мерных данных.

ROLAP (Relational OLAP). Системы оперативной аналитиче-ской обработки реляционных данных (ROLAP) позволяют пред-ставлять данные, хранимые в реляционной базе в многомерной форме, обеспечивая преобразование информации в многомерную модель через промежуточный слой метаданных. В этом случае ги-перкуб эмулируется СУБД на логическом уровне.

Автоматизированная система (АС) — система, состоящая из персонала и комплекса средств автоматизации его деятельности

лизующая информационную технологию выполнения установ-ленных функций (по стандарту ГОСТ 34.ххх).

Адекватность информации — это определенный уровень со-ответствия создаваемого с помощью полученной инф

а реальному объекту, процессу, явлению и т. п. Актуальность информации определяется степенью сохране-

ния ценности информации для управления в момент ее использо-вания и зависит от динамики изме

ервала времени, прошедшего с момента возникновения данной информации.

Алгоритмический язык — язык, предназначенный для записи информации и алгоритмов ее обработки в форме, воспринимаемой ЭВМ. Каждый из названных языков предназначен для описания языковых объектов и, следовательно, в той или иной мере обладает смысло-выразительной способностью, т. е. способностью выражать

– 296 –

Page 297: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

смысловое содержание текстов. Указанная способность зависит от того, на каких уровнях представляются языковые объекты средст-вами данного языка.

Алфавит ИПЯ — система знаков, используемых для записи слов и выражений ИПЯ. Это могут быть буквы русского и (или) английского языка, знаки препинания, арабские цифры, любые иные символы.

Алфавитный словарь — словарь дескрипторов или ключевых слов, упорядоченных по алфавиту.

за знаний состоит из правил анализа информации от пользо-ват

ов в предметной области в формальную стр

их движении пут

пании, обеспечивающая достижение ее стратеги-чес сированных фин

дач.

Архитектура ИС — описание ее функций с точки зрения ко-нечных пользователей и интерфейсов взаимодействия с внешней средой. Это внешний взгляд на описываемый объект, безотноси-тельно к его реализации, в частности, к структуре.

Баеля по конкретной проблеме. Задача инженера по знаниям —

отобразить знания экспертуктуру базы знаний. Бизнес-процесс — последовательность взаимосвязанных задач,

решающих специфическую проблему. Есть три типа бизнес-процесса.

Бухгалтерский учет представляет собой упорядоченную сис-тему сбора, регистрации и обобщения информации в денежном вы-ражении об имуществе, обязательствах организаций и

ем сплошного, непрерывного и документального учета всех хо-зяйственных операций.

Бюджетирование — это технология управления бизнесом на всех уровнях ком

ких целей с помощью бюджетов, на основе сбаланансовых показателей. Информационная система бюджетирова-

ния обеспечивает данные технологии соответствующими прогно-зами, формируемыми в виде управленческих отчетов.

Бюджеты — это планы деятельности предприятия и различных его структурных единиц, выраженные в финансовых показателях. Основное назначение бюджетов — поддержка решения трех управленческих за

– 297 –

Page 298: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

В силу того что данное учебное пособие рассчитано на студен-тов специальности «Прикладная информатика в экономике», необ-ходимо рассмотреть особенности экономической информации.

Вспомогательные процессы поддерживают основные процес-сы (например, бухгалтерский учет, наем работников, ИТ-под-держка).

Географические информационные системы (ГИС) — ин-формационные системы, обеспечивающие сбор, хранение, обра-ботку, отображение и распространение данных, а также получение на их основе новой информации и знаний о пространственно-координированных явлениях.

Геоинформатика (GIS science, geographic information science, geoinforma-tics) — наука, технология и производственная деятель-ность по научному обоснованию, проектированию, созданию, эксплуатации и использованию географических информационных систем, по разработке геоинформационных технологий и по при-ложению ГИС для практических или геонаучных целей. Входит составной частью в геоматику (по одной из точек зрения) или предметно, методически и технологически пересекается с ней.

Геоинформационные технологии, ГИС-технологии (GIS technology) — технологическая основа создания географических информационных систем, позволяющая реализовать функциональ-ные возможности ГИС в форме программных средств.

Геоматика — область деятельности, связанная с использовани-ем системного подхода к выбору средств сбора, интеграции, обра-ботки и распространения пространственных данных в бесконечном потоке цифровой информации.

Гнездовой словарь — совокупность классов (гнезд) семанти-чески связанных между собой дескрипторов или ключевых слов, упорядоченных по алфавиту дескрипторов, отображающих верши-ны классов.

Государственные стандарты (ГОСТы) принимаются государ-ственными органами, имеют силу закона. Разрабатываются с уче-том мирового опыта или на основе отраслевых стандартов. Могут

– 298 –

Page 299: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

иметь как рекомендательный, так и обязательный характер (стан-дарты безопасности). Для сертификации создаются государствен-ные или лицензированные органы сертификации.

Грамматика ИПЯ — совокупность средств и способов по-строения, изменения и сочетания лексических единиц. Грамматика включает морфологию и синтаксис. Морфология — совокупность сре — дств и способов построения и изменения слов. Синтаксиссовокупность средств и способов соединения слов в выражения и фразы.

Данные — 1) информация, обработанная и представленная в формализованном виде для дальнейшей обработки [4].

информация2) , представленная в виде, пригодном для обработ-ки автоматическими средствами при возможном участии человека [11].

3) некоторый факт, то на чем основан вывод или любая интел-лектуальная система [12].

4) факты, понятия или инструкции, представленные в условной форме, удобной для пересылки, интерпретации и обработки чело-веком или автоматизированными средствами» (Ассоциация стан-дартов Франции — АФНОР).

5) зарегистрированные на любых носителях сведения об объек-те (реальном или вымышленном) независимо от того, дошли они до какого-нибудь приемника и интересуют ли они его.

Декомпозиция на обеспечивающие составляющие АИПС. Обеспечивающими составляющими или подсистемами АИПС на-зывают элементы, которые обеспечивают реализацию заданных фун

.

кций АИПС. Денотат — обозначаемое (объект, предмет и т. д.). Дескриптор — понятие, обозначающее группу эквивалентных

или близких по смыслу ключевых слов, т. е. это имя класса сино-нимов. В качестве дескрипторов могут быть использованы код, слово или словосочетание. Словарь дескрипторов с заданными па-радигматическими отношениями между его элементами носит на-звание тезауруса. Тезаурус является основным типом словарей со-временных ИПС

– 299 –

Page 300: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

Документная система или система управления документами (records system) — информационная система, обеспечивающая сбор документов (включение документов в систему), управление доку-ментами и доступ к ним в течение времени [50]. Большинство сис-тем

ицируемую инф

язано с ее смысловым содержанием (семантикой) и прагма-тик

м отра-жат

обеспечи-вае

ности, и путем согла-сов

о мире,

управления документами используют ИДП. Документы — специализированная форма информации. Мож-

но определить деятельность с целью создания документа и дея-тельность, побочным продуктом которой может стать документ. Стандарт ГОСТ Р ИСО 15489-1-2007 определяет документ как за-фиксированную на материальном носителе идентиф

ормацию, созданную, полученную и сохраняемую организаци-ей или частным лицом в качестве доказательства при подтвержде-нии правовых обязательств или деловой деятельности [10].

Достаточность (полнота) информации означает, что она со-держит минимальный, но достаточный для принятия правильного решения состав (набор показателей). Понятие полноты информа-ции св

ой. Как неполная, т. е. недостаточная для принятия правильного решения, так и избыточная информация снижает эффективность принимаемых пользователем решений.

Достоверность информации определяется ее свойствоь реально существующие объекты с необходимой точностью.

Измеряется достоверность информации доверительной вероятно-стью необходимой точности, т. е. вероятностью того, что отобра-жаемое информацией значение параметра отличается от истинного значения этого параметра в пределах необходимой точности.

Доступность информации восприятию пользователятся выполнением соответствующих процедур ее получения и

преобразования. Например, в информационной системе информа-ция преобразовывается к доступной и удобной для восприятия пользователя форме. Это достигается, в част

ания ее семантической формы с тезаурусом пользователя.

Знак — обозначение данного денотата. Знание — в теории искусственного интеллекта, совокупность

сведений (у индивидуума, общества или у системы ИИ)

– 300 –

Page 301: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

вкл

ии для принятия решений. Главное отличие знаний от

— совокупность имен классов услов-ной

порядка (род-вид, часть-цел

ование базируется на совокупности инст-рук

ючающих в себя информацию о свойствах объектов, законо-мерностях процессов и явлений, а также правилах использования этой информац

данных состоит в их активности, т. е. появление в базе новых фактов или установление новых связей может стать источником активности системы.

Знание — 1) информация, о которой кто-либо осведомлен. 2) селективная, упорядоченная, определенным способом (мето-

дом) полученная, в соответствии с какими-либо критериями (нор-мами) оформленная информация, имеющая социальное значение и признаваемая в качестве именно знаний определенными социаль-ными субъектами и обществом в целом [9].

3) это закономерности предметной области (принципы, связи, законы), полученные в результате практической деятельности и профессионального опыта, позволяющие специалистам ставить и решать задачи в этой области» [14, 15].

4) проверенный практикой результат познания действительно-сти, верное ее отражение в сознании человека. Знание противопо-ложно незнанию, т. е. отсутствию проверенной информации о чем-либо? Сущность научных знаний заключается в понимании дейст-вительности в ее прошлом, настоящем и будущем, в достоверном обобщении фактов, в том, что за случайным оно находит необхо-димое, закономерное, за единичным — общее и на этой основе осуществляет предвидение. Мышление человека постоянно дви-жется от незнания к знанию, от поверхностного ко все более глубо-кому и всестороннему знанию [1].

Иерархический словарь эквивалентности лексических единиц, упорядоченная в соот-

ветствии с заданным на ней отношениемое и т. д.). Индексирование — процесс перевода текстов естественного

языка на ИПЯ. Индексирций, детально описывающих процесс индексирования и пред-

ставляющих собой комплекс правил, включающих и правила при-менения ИПЯ.

– 301 –

Page 302: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

Информационная система (ИС) — 1) система людей, храни-мых данных и процессов обработки данных и информации в кон-тек

еческой деятельно-сти

знаний человечества, относящихся к данной пре

ионировании.

ионного фонда и т

сте конкретной организации. Обработка включает ручные или автоматизированные процессы.

2) система, предназначенная для ведения информационной мо-дели, чаще всего — какой-либо области челов

. Эта система должна обеспечивать средства для протекания информационных процессов: хранения, передачи, преобразования информации. По мнению одних авторов, ИС включает в себя пер-сонал, ее эксплуатирующий, по мнению других — нет.

Информационно-поисковый тезаурус (ИПТ) по сути пред-ставляет собой нормативный словарь-справочник, в котором зафиксирована часть

дметной области. ИПТ можно представить как мультиграф, узлы которого соответствуют понятиям предметной области, а дуги — существующим парадигматическим отношениям между ними.

Информационное обеспечение АС — совокупность форм до-кументов, классификаторов, нормативной базы и реализованных решений по объемам, размещению и формам существования ин-формации, применяемой в АС, при ее функц

Информационно-поисковая система (Information retrieval system), ИПС — совокупность справочно-информац

ехнических средств информационного поиска в нем. Информа-ционный поиск осуществляется с целью распространения инфор-мации. Распространенная информации является составной частью справочно-информационного обслуживания (СИО).

Информационно-поисковый язык — специализированный искусственный язык, предназначенный для описания основного содержания (центральной темы) и формальных характеристик до-кументов с целью информационного поиска.

Информационный язык — формальная семантическая систе-ма, включающая алфавит, правила образования конструкций, их преобразования и интерпретации и предназначенная для описания, обработки, логической переработки и поиска информации.

– 302 –

Page 303: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

Информационные коммуникации — пути и процессы, обес-печивающие передачу сообщений от источника информации к ее потребителю.

Информация (от лат. informatio — разъяснение, изложение) — 1) ч

овеком, но также между человеком и автоматом, автома-том

в, понятий) по классам в соответствии с оп-ред

оре с другими КС.

то-то сказанное, новости; знание, полученное любым способом; 2) в информационной теории и теории компьютеров: это точная мер диа информации, измеренная в битах и охватывающая апазон от нуля (это когда все известно заранее) и до какого-то максималь-ного значения, когда ничего заранее о содержании сообщения не известно; 3) любые данные, хранящиеся в компьютере» (Webster New World Dictionary of the American Language ed. David Guralnik, Prentice Hall Press, Division of Simon & Schuster).

— первоначально — сведения, передаваемые одними людьми другим людям устным, письменным или каким-либо другим спо-собом (например, с помощью условных сигналов, с использовани-ем технических средств и т. д.), а также сам процесс передачи или пол сучения этих ведений. Впоследствии термин притерпел два принципиальных изменения в трактовке. Во-первых, оно было расширено и включило обмен сведениями не только между челове-ком и чел

и автоматом; обмен сигналами в животном и растительном ми-ре. Передачу признаков от клетки к клетке и от организма к организму также стали рассматривать как передачу информации. Во-вторых, была предложена количественная мера информации (работы К. Шеннона, А. Н. Колмогорова и др.), что привело к соз-данию теории информации.

Классификатор — систематизированный свод наименований и кодов классификационных группировок.

Классификация — система распределения объектов (предме-тов, явлений, процессо

еленным признаком. Ключевое слово (КС) — полнозначное слово естественного

языка, выражающее смысловое содержание фрагмента документа или запроса самостоятельно или в наб

– 303 –

Page 304: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

Кодовый словарь — перечень лексических единиц, системати-зированный по убыванию или возрастанию их кодов.

Компьютерная система, которую иногда называют программ-но-технический комплекс информационной системы (ПТК ИС). Тол

процедур (правил) опр

ствление какой-либ

формализованного представления семантиче-

ько компьютерная система и программное обеспечение явля-ются подсистемами информационной системы.

Концепт — свойство денотата, его смысл, значение, информа-ция, которую несет знак о денотате и о его месте в системе реалий. Знак обозначает денотат и выражает его концепт. Например: знак Ф.И.О.; денотат — конкретный человек; концепт — человек, а не дерево и не животное. Лексические единицы (ЛЕ) языка — это зна-ки. Омонимия знака состоит в том, что один и тот же знак выража-ет разные концепты.

Корпоративные стандарты разрабатываются крупными фир-мами (корпорациями) с целью повышения качества своей продук-ции. Такие стандарты разрабатываются на основе собственного опыта и с учетом требований мировых стандартов. Корпоративные стандарты не сертифицируются, но являются обязательными для применения внутри корпорации. В условиях рыночной конкурен-ции могут иметь закрытый характер. В ИТ-сфере известны стан-дарты, разработанные Microsoft, Intel, IBM.

Критерий релевантности — совокупностьеделения смыслового соответствия ПОДа ПОЗу.

Лексика, или словарный состав ИПЯ, — совокупность слов, словосочетаний и выражений, используемых для построения тек-стов ИПЯ.

Лингвистическое обеспечение АС — совокупность средств и правил для формализации естественного языка, используемых при общении пользователей и эксплуатационного персонала АС с ком-плексом средств автоматизации при функционировании АС.

Лицензия — это право (разрешение) на осущео деятельности. Логико-семантический комплекс АИПС. Логико-семантиче-

ский комплекс (ЛСК) — комплекс языковых, логических, и мате-матических средств

– 304 –

Page 305: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

ско

функционирования как каждой составляющей всех ра-нее

й информации с целью ее автоматизированной обработки и по-иска. ЛСК представляет собой теоретическую и практическую базу создания и

рассмотренных декомпозиций АИПС, так и АИПС в целом.

Математическое обеспечение АС — совокупность математи-ческих методов, моделей и алгоритмов, примененных в АС.

Международные стандарты разрабатываются, как правило, специальными международными организациями на основе мирово-го опыта и лучших корпоративных стандартов. Имеют сугубо ре-комендательный характер. Право сертификации получают органи-зации (государственные и частные), прошедшие лицензирование в международных организациях.

Методическое обеспечение АС — совокупность документов, описывающих технологию функционирования АС, методы выбора и применения пользователями технологических приемов для полу-чения конкретных результатов при функционировании АС.

Морфология — основные закономерности построения слов языка, т. е. система грамматических категорий и способов их вы-раж

писании имеют различ-ный

ения.

Научная информация — это получаемая в процессе познания логическая информация, которая адекватно отображает закономер-ности объективного мира и используется в общественно-истори-ческой практике. В этом определении названы четыре наиболее существенных признака, которые необходимы и, по-видимому, достаточны для раскрытия понятия «научная информация».

Необходимо отметить, что ИПС может не использовать компь-ютерные технологии, но нас эти системы интересовать не будут. В силу этого термины «Автоматизированная ИПС» и «ИПС» будем считать синонимами.

Омонимия слова, сочетания, выражения, текста (любого знака) состоит в том, что они при одинаковом на

смысл. Например, понятие «соль» может обозначать вещество, ноту, главную часть, суть чего-либо.

– 305 –

Page 306: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

Операционные процессы — в этих процессах создаются пер-вичные потоки данных, они — часть основного бизнеса. Типичные операционные процессы — покупка, производство, маркетинг и продажа.

Организационная декомпозиция АИПС. Такая декомпозиция соответствует организационной структуре информационного ин-ститута, центра или иной организации, в структуру которой входит АИПС. Среди элементов организационной декомпозиции могут быть: вычислительный центр, отделы или лаборатории. Декомпо-зиция на обеспечивающие подсистемы, в чем-то перекрываясь с покомпонентной декомпозицией, тем не менее представляет новую точку зрения на состав и структуру АИПС.

Организационное обеспечение АС — совокупность докумен-тов, устанавливающих организационную структуру, права и обя-занности пользователей и эксплуатационного персонала АС в условиях функционирования, проверки и обеспечения работоспо-собности АС.

Отраслевые стандарты действуют в пределах организаций нек тоторой отрасли. Например, строи ельные нормы и правила раз-рабатываются с учетом требований мирового опыта и специфики отрасли. Подлежат сертификации.

Парадигматические отношения — это отношения, обуслов-ленные наличием не языковых, а логических связей между предме-тами и явлениями, обозначенными данными словами.

Переменная информация отражает фактические количествен-ные и качественные характеристики производственно-хозяйствен-ной деятельности фирмы. Она может меняться для каждого случая как по назначению, так и по количеству. Например, количество произведенной продукции за смену, еженедельные затраты на дос-тавку сырья, количество исправных станков и т. п.

Пермутационный словарь — словарь словосочетаний, упоря-доченный по алфавиту каждого слова, словосочетания. Каждое словосочетание встречается в таком словаре столько раз, сколько слов оно включает.

– 306 –

Page 307: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

Поиск информации — выделение из поискового массива тех документов, содержание которых соответствует поисковому пред-писанию.

Поисковый образ документа (ПОД) и (или) поисковый образ запроса (ПОЗ) — некоторая характеристика, кратко отражающая его

ия выз

С этих по-зиц

мы — software АИ

и

смысловое содержание (иногда ПОЗ называют поисковым предписанием (ПП)).

Покомпонентная декомпозиция АИПС. Такая декомпозицвана необходимостью самостоятельного рассмотрения инфор-

мационной, программной и технической среды АИПС. ий в составе АИПС целесообразно выделить: информационную

базу (базу данных, словари, справочники и т. д.), программные средства (СУБД/ПС, пользовательские програм

ПС); технические средства (hardware АИПС), организационные средства.

Полисемия знака состоит в том, что один и тот же знак выра-жает пучок родственных концептов. Например, знак «ключ» обо-значает дверной ключ, нотный ключ, ключ к шифру. Все три кон-цепта близки между собой по смыслу.

Полнозначные слова — существительные, прилагательные, глаголы, наречия, числительные, местоимения. Неполнозначные слова — предлоги, союзы, связки, частицы.

Посткоординированные ИПЯ — ИПЯ, словарный состав ко-торых не связан грамматикой заранее и такая связь осуществляется в процессе индексирования (или) поиска.

Постоянная (условно-постоянная) информация — это неиз-менная и многократно используемая в течение длительного перио-да времени информация.

Правовое обеспечение АС — совокупность правовых норм, регламентирующих правовые отношения при функционировании АС и юридический статус результатов ее функционирования.

Правописание — система правил, устанавливающая единооб-разные способы передачи речи на письме.

Прагматическая (потребительская) адекватность. Она от-ражает отношение информации и ее потребителя, соответствие ин-

– 307 –

Page 308: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

фор

ется только с использованием элементов такой же-стк

л

е рас-про

мации цели управления, которая на ее основе реализуется. Проявляются прагматические свойства информации только при наличии единства информации (объекта), пользователя и цели управления. Прагматический аспект рассмотрения связан с ценно-стью, полезностью использования информации при выработке по-требителем решения для достижения своей цели. С этой точки зре-ния анализируются потребительские свойства информации. Эта форма адекватности непосредственно связана с практическим ис-пользованием информации, с соответствием ее целевой функциидеятельности системы.

Прекоординированные ИПЯ — это ИПЯ, словарный состав которых жестко связан грамматическими средствами в единую структуру. Лексика и грамматика такого языка, а также синтаксис, морфология, все парадигматические и синтагматические отноше-ния самостоятельно не существуют, а образуют единую жесткую связанную структуру. Индексирование текстов (перевод текстов на ИПЯ) выполня

ой структуры. По сути дела, каждый ИПЯ этого типа представ-ляет собой некоторую систему классификации.

Преобразование информации документальной (ИДП) — процесс ана итико-синтетического изучения документов (текстов) и подготовки вторичной информации, отражающей наиболее суще-ственные элементы содержания этих документов. Наиболе

страненные формы представления результатов ИДП — библио-графическое описание, аннотация, реферат, конспект, обзор и т. п. Преобразование может осуществляться в виде индексирования, извлечения из документов необходимых фактографических дан-ных, свертывания объема текста при относительном сохранении объема смысловой информации, представления данных в наиболее рациональной для хранения и восприятия форме и т. д. В общем смысле ИДП включает также перевод текстов с одного языка на другой [1].

тн нияПринцип координа ого индексирова — принцип, кото-рый предполагает, что основное смысловое содержание документа может быть выражено списком ключевых слов, т. е. списком наи-

– 308 –

Page 309: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

более существенных для понимания текста назывных полнознач-ных слов. Принцип чистого координатного индексирования и по-иска состоит в индексировании документов и запросов списками ключевых слов, являющихся ПОДами и ПОЗами, и в последующем сравнении полученных списков.

Программное обеспечение АС — совокупность программ на носителях данных и программных документов, предназначенная для отладки, функционирования и проверки работоспособности АС.

Процесс индексирования текстов — перевод содержания до-кумента и (или) запроса с естественного языка на ИПЯ.

Процессы управления — процессы, которые управляют дей-ствием системы. Типичные процессы управления включают «об-щее управление» и «стратегическое управление».

Реквизит — логически неделимый нформацион ый элемент, описывающий определенное свойство объекта, процесса, явления и т. п.

Релевантность — смысловое соответствие сообщения (доку-мента) тексту информационного запроса на естественном языке. Релевантность сообщения запросу в таком понимании может оце-нить только человек. Критерий, которым он при этом пользуется при принятии решения о релевантности, сформулировать невоз-можно.

Репрезентативность информации связана с правильностью ее отбора и формирования в целях адекватного отражения свойс

и н

твобъекта.

Своевременность информации означает ее поступление непозже заранее назначенного момента времени, согласованного с временем решения поставленной задачи.

Семантика — основные закономерности строения внутренней (смысловой) стороны языковых объектов. Семантический уровень представления языковых объектов позволяет отобразить их смы-словое содержание, выразить связь смыслов отдельных знаков со смыслом текста (связь смысла языковых объектов между собой и со смыслом образуемого ими более сложного языкового объекта).

– 309 –

Page 310: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

Семантическая (смысловая) адекватность. Эта форма опре-деляет степень соответствия образа объекта и самого объекта. Се-мантический аспект предполагает учет смыслового содержания инф

ия, рассматриваются смысловые связи. В ин-фор

к

правило, из-вле

. Однако выражаемые эти-ми

отличается от смысла зна о

синтаксис представляет собой совокупность способов и средств

ормации. На этом уровне анализируются те сведения, которые отражает информац

матике устанавливаются смысловые связи между кодами пред-ставления информации. Эта форма служит для формирования понятий и представлений, выявления смысла, содержания инфор-мации и ее обобщения.

Сертификат на услуги — документ, подтверждающий, что ка-чество услуг соответствует определенным требованиям.

Сертификация — процедура подтверждения соответствия, по-средством которой независимая от изготовителя (продавца, испол-нителя) и потребителя (покупателя) организация удостоверяет в письменной форме, что продукция соответствует установленным требованиям.

Сетевые роботы — это программы, оторые, исходя из неко-торого начального множества ссылок (URL), рекурсивно сканиру-ют веб-страницы, извлекая из них новые ссылки. Как

ченные ссылки сначала передаются модулю стратегии сканирования, который определяет, какие из них стоит посещать и отдает соответствующие ссылки обратно сетевым роботам.

Синонимия знака состоит в том, что один и тот же денотат имеет разные знаки. Например, знаки «коллега», «друг», «тезка» могут обозначать один и тот же денотат

знаками концепты могут отличаться друг от друга. В данном примере смысл знака «коллега» существенно

ка «тезка», т. е. концепты знаков не совпадают. Знаки «к лле-га», «тезка», «друг» — условные синонимы. Абсолютная синони-мия имеет место тогда, когда разные знаки обозначают один и тот же денотат и выражают одинаковый концепт.

Синтагматические отношения — это совокупность всех от-ношений, реализуемых синтаксисом ИПЯ. С этой точки зрения

– 310 –

Page 311: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

выражения синтагматических отношений. Простейшим видом син-тагматических отношений является отношение вхождения не-ско

Я не может функ-цио

льких лексических единиц ИПЯ в один и тот же текст, фрагмент текста, фразу и т. д., т. е. отношение координации. Иногда говорят: ИПЯ без грамматики. Но поскольку ни один ИП

нировать без синтаксиса, выражающего синтагматические от-ношения между его словами, информационно-поисковые языки без грамматики фактически не существуют.

Синтаксис — основные закономерности, определяющие отно-шения между единицами языка в пределах конкретных текстов. Синтаксический уровень представления языковых объектов позво-ляет выразить их структуру, отношения знаков в тексте, законо-мерности построения текстов.

Синтаксическая адекватность отображает формально-структурные характеристики информации и не затрагивает ее смы-слового содержания. На синтаксическом уровне учитываются тип носителя и способ представления информации, скорость передачи и обработки, размеры кодов представления информации, надеж-ность и точность преобразования этих кодов и т. п. Информацию, рассматриваемую только с синтаксических позиций, обычно назы-вают данными, т. к. при этом не имеет значения, смысловая сторо-на. Эта форма способствует восприятию внешних структурных ха-рактеристик. То есть синтаксической стороны информации.

положений, мет

отличаются друг от друга, и описать их общий состав и структуру

Система (system) — комбинация взаимодействующих элемен-тов, организованных для достижения одной или нескольких по-ставленных целей (ГОСТ Р ИСО/МЭК 15288—2005).

Система индексирования (СИ) — совокупность методов и средств перевода текстов с ЕЯ на ИПЯ в соответствии с заданным набором словарей лексических единиц и с правилами применения ИПЯ. Помимо правил применения ИПЯ, система индексирования может включать большое разнообразие инструкций,

одов и т. д., регламентирующих те или иные этапы процесса индексирования. Существующие системы индексирования сильно

– 311 –

Page 312: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

не представляется возможным. Однако наличие общих признаков позволяет дать системное представление о классах систем индек-сир

ышленным системам имеет более ши

ти AutoCAD (САПР фирмы Autodesk, реали-зую

ования. Система кодирования — совокупность правил кодового обо-

значения объектов. Системы автоматизированного проектирования (САПР) —

общий термин для обозначения всех аспектов проектирования с использованием средств вычислительной техники. Обычно охва-тывает создание геометрических моделей изделия (твердотельных, трехмерных, составных), а также генерацию чертежей изделия и их сопровождение. Следует отметить, что отечественный термин «САПР» по отношению к пром

рокое толкование, чем CAD. Он включает в себя как CAD, так и CAM, а иногда и элементы CAE. К наиболее известным CAD-си-стемам можно отнес

щая решения для различных отраслей промышленности, начи-ная с машиностроительных проектов до геоинформационных систем — ГИС), ArchiCAD (программное обеспечение для архи-тектурного проектирования от компании Graphisoft).

Системы обработки данных (СОД) — комплекс взаимосвя-занных методов и средств сбора и обработки данных, необходимых для организации управления объектами. СОД основываются на применении ЭВМ и других современных средств информационной техники, поэтому их также называют автоматизированными систе-мами обработки данных (АСОД) [1].

Словарь отрицаний — перечень лексических единиц, не ре-комендуемых для индексирования и поиска.

Словосочетание — последовательность нескольких слов (обычно 2-5) естественного языка, выражающая основное смысло-вое содержание фрагмента документа или запроса. Словосочетаниеможет использоваться и в роли ключевого слова. Обычно словарь КС включает и отдельные слова и словосочетания. Однако число словосочетаний в словаре КС мало по сравнению с числом отдель-

– 312 –

Page 313: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

ных слов. И наоборот, словарь словосочетаний в основном состоит из словосочетаний.

Содержательность информации отражает семантическую ем-кос

, право потребителя на приобретение товаров надлежащего

качества, а также право на безопасность и комфортность труда.

Тезаурус — это совокупность сведений, которыми располагает пользователь или система.

Техническое задание на создание автоматизированной сис-темы является основным документом, определяющим требования и порядок создания (развития или модернизации) автоматизиро-ванной системы, в соответствии с которым проводится разработка АС и ее приемка при вводе в действие.

Техническое обеспечение АС — совокупность всех техниче-ских средств, используемых при функционировании АС.

Точность информации определяется степенью близости полу-чаемой информации к реальному состоянию объекта, процесса, яв-ления и т. п.

Управление взаимоотношениями с клиентами (CRM — Customer Relationships Management) — это стратегия компании, касательно взаимодействия с клиентами во всех организационных аспектах — рекламе, продаже, доставке и обслуживании клиентов, дизайне и производстве новых продуктов, выставлении счетов и т. п. CRM — концептуально новый подход к взаимодействию с клиентом. Данный модуль интегрирован, как правило, в системах ERP II (Enterprise Resource & Relationship Processing).

Устойчивость информации отражает ее способность реагиро-вать на изменения исходных данных без нарушения необходимой

ть, равную отношению количества семантической информации в сообщении к объему обрабатываемых данных.

Стандартизация — это деятельность, направленная на разра-ботку и установление требований, норм, правил, характеристик как обязательных для выполнения так и рекомендуемых, обеспечи-вающая

– 313 –

Page 314: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

точности. Устойчи ативность, обусловлена выбранной .

вость информации, как и репрезент методикой ее отбора и формирования

Фонетика — осно поведения речевого вные закономерностиаппарата и способы их использования.

Формальная релевантность — соответствие ПОДа ПОЗу. По-скольку ПОД и ПОЗ представляют собой формализованные струк-

их употребления в поисковом массиве.

и и коллективами людей в производ-

содержат информацию лишь в той мере, в какой они но-

АС — совокупность реализо-

пометрических, физиологических характе-

туры, оценку такой релевантности может дать компьютер. Однако я этого необходимо задать ему формальное выражение критедл рия

релевантности. Функциональная декомпозиция АИПС — декомпозиция на

функциональные подсистемы.

Частотный словарь — словарь лексических единиц, упорядо-ченный по убыванию или возрастанию частоты

Экономическая информация — 1) совокупность сведений, отражающих социально-экономические процессы и служащих для управления этими процессамственной и непроизводственной сфере.

2) информация об экономических отношениях и процессах об-щественного воспроизводства. Знания, сведения, входящие в эко-номическую информацию, с точки зрения воспринимающих их субъектоввы и полезны для решения каких-либо задач [2].

Экспертная система (ЭС, expert system) — это компьютерная ограмма, а не информационная пр система. Ее цель — заменить

специалиста-эксперта в решении проблемной ситуации. Энтропия дискретной СВ — это минимум среднего количест-

ва бит, которое нужно передавать по каналу связи о текущем зна-чении данной дискретной СВ.

Эргономическое обеспечениеванных решений в АС по согласованию психологических, психо-физиологических, антро

– 314 –

Page 315: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

ристик и возможностей пользователей АС с техническими харак-теристиками комплекса средств автоматизации АС и параметрами

очей среды на рабочих местах персонала АС. раб

Язык — это знаковая система любой физической природы, вы-полняющая познавательную и коммуникативную функции в про-цессе человеческой деятельности. Естественный язык (ЕЯ) есть особого рода преобразователь заданных смыслов в тексты, и на-оборот.

– 315 –

Page 316: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

ëèàëéä ãàíÖêÄíìêõ

Основная литература 1. Автоматизированные информационные технологии в экономике:

учебник / М. И. Семенов, И. Т. Трубилин, В. И. Лейко. М.: Финансы и статистика, 2003.

2. Ивашко А. Г., Карякин Ю. Е., Цыганова М. С. Информационные сис-темы: учеб.-метод. пособие. Тюмень: Изд-во ТюмГУ, 2007. 256 с.

3. Информационные системы в экономике: учебник / под ред. В. В. Ди-ка. М.: Финансы и статистика, 2004.

4. Исаев Г. Н. Информационные системы в экономике: учеб. пособие. М.: Омега-Л, 2006. 462 с.

5. Советов Б. Я., Цехановский В. В. Информационные технологии: учеб. для вузов. М.: Высшая школа, 2006.

Дополнительная литература 1. Вендеров А. М. Проектирование программного обеспечения экономи-

ческих ИС: учебник. М.: Финансы и статистика, 2000.

мации / под ред. С. В. На-

Г. Д. Автоматизированные

стемы. М.: Мир,

йлюк О. Ф. Фактографиче-туальное и логическое про-

. 662 с.

б. пособие. СПб.: Изд-во СПбУЭФ, 1996. М.:

ение АСУ.

2. Гайдамакин И. А. Автоматизированные ИС, банки и БД: учеб. посо-бие. М.: Гелиос, АРВ, 2002.

3. Компьютерные технологии в обработке инфорзарова. М.: Финансы и статистика, 1995.

4. Криницкий Н. А., Миронов Г. А., Фролов информационные системы. М.: Наука, 1982. 384 с.

5. Ланкастер Ф. У. Информационные поисковые си1972.

6. Максимович Г. Ю., Романенко А. Г., Самоские базы данных: модели данных, концепектирование. М.: РГГУ, 1997. 83 с.

7. Мартин Дж. Организация баз данных в вычислительных системах. М.: Мир, 1980

8. Матвеев Л. Л. Информационные системы: Поддержка принятия реше-ний: уче

9. Мишенин А. И. Теория экономических информационных систем. Финансы и статистика, 2003.

10. Пономарева К. В., Кузьмин Л. Г. Информационное обеспечМ.: Высш. шк., 1991.

– 316 –

Page 317: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

11. Попов И. И., Романенко А. Г., Сумароков Л. Н. Теоретико-множест-венное моделирование информационных систем // Вопросы информа-

делирование информационных систем. М.:

технологии: учеб.

ционной теории и практики. М.: ВИНИТИ, 1978. № 33-34. С. 16-63. 12. Романенко А. Г. Мо

МГИАИ, 1988. 83 с. 13. Румянцева Е. Л., Слюсарь В. В. Информационные

пособие / под ред. проф. Л. Г. Гагариной. М.: ИД «Форум»: ИНФРА-М, 2007.

14. Якубайтис Э. А. Информационные сети и системы. М.: Финансы и статистика, 1996.

Список источников информации 1. Большая советская энциклопедия. http://www.rubricon.com/ 2. Большой толковый словарь компьютерных терминов (Collins

Dictionary of Personal Computing, ed. Ian R. Sinclaire), изд-во Вече. АСТ. М. 1999.

3. Политехнический словарь // под ред. акад. А. Ю. Ишлинского. М.: Изд-во «Советская Энциклопедия», 1980.

4. ГОСТ 7.0-99. Информационно-библиотечная деятельность, библио-графия. Термины и определения. Взамен ГОСТ 7.0-84, ГОСТ 7.26-80;

1введ. 0 .07.2000. 5. Толковый словарь по вычислительной технике: более 50 000 терми-

нов: пер. с англ. М.: Рус. ред., 1995. 478 с. 6. Федеральный закон РФ от 27.07.2006 г. № 149-ФЗ «Об информации,

информационных технологиях и о защите информации». Взамен ФЗ от 20.02.1995 г. № 24-ФЗ «Об информации, информатизации и защи-те информации и ФЗ» от 4.06.1996 г. № 85-ФЗ «Об участии в между-народном информационном обмене».

7. Информатика. Энциклопедический систематизированный словарь-справочник. http://slovari.yandex.ru/dict/informatica.

8. Википедия — свободная энциклопедия. http:// ru.wikipedia.org/. 9. Новейший философский словарь: 3-е изд., исправл. Минск: Книжный

Дом. 2003. 1280 с. 10. ГОСТ Р ИСО15489-1-2007 Система стандартов по информации, биб-

лиотечному и издательскому делу. Управление документами. 11. ГОСТ 15971-90 СИСТЕМЫ ОБРАБОТКИ ИНФОРМАЦИИ. Терми-

ны и определения. 12. Webster's New World Dictionary of the American Language, D. B. Gu-

ralnic, ed., Williiam Collins and World Publishing Co., New York, 1974.

– 317 –

Page 318: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

13. IEEE Std 610.12-1990 IEEE Standard Glossary of Software Engineering Terminology.

14. Калинина Л. В. Тарасова Е. Г. Информационные системы: учебно-практическое пособие. Ульяновск: УлГТУ, 2008. 178 с.

15. Wikipedia. http://en.wikipedia.org/. 16. Першиков В. И. Толковый словарь по информатике / В. И. Перши-

ков, В. М. Савинков. 2-е изд, доп. М.: Финансы и статистика, 1995.

иклопедический систематизиро-

кационные технологии в терминах и фактах).

. Информационная технология. Комплекс стандартов

ия, поиска и обработки тек-

67 с. верситет ин-

и М.: Изда-

итмы сжатия информации //«Монитор» 7/93–

Наука, 1986.

вания. Ежегодник. М.: Наука, 1969.

дник. М.: Наука, 1969.

543 с. 17. ГОСТ Р ИСО/МЭК 15288—2005. Информационная технология. Сис-

темная инженерия. Процессы жизненного цикла систем. 18. Воройский Ф. С. Информатика. Энц

ванный словарь-справочник. (Введение в современные информаци-онные и телекоммуниМ.: Финансы и статистика, 2007.

19. ГОСТ 34.003-90на автоматизированные системы. Автоматизированные системы. Термины и определения.

20. Информатика: учебник. 3-е изд., перераб. / под ред. Н. В. Макаровой. М.: Финансы и статистика, 2000. 768 с.

21. Максимович Г. Ю., Шрубек А. Н. Документальные базы данных. Пакеты прикладных программ для храненстовой информации. М.: РГГУ, 1997. 56 с.

22. Ревунков Г. Н., Самохвалов Э. Н., Чистов В. В. Базы и банки данных и знаний. М.: Высшая школа, 1992. 3

23. Лидовский В. В. Теория информации — Интернет-униформационных технологий — ИНТУИТ.ру, 2007.

24. Шеннон К. Работы по теории информации и кибернетиктельство иностранной литературы, 1963.

25. Винер Н. Кибернетика. М.: Наука, 1983. 26. Нечаев В. И. Элементы криптографии. М.: Высшая школа, 1999. 27. Мастрюков Д. Алгор

6/94. 28. Питерсон Р., Уэлдон Э. Коды, исправляющие ошибки. М.: Мир,

1976. 29. Розанов Ю. А. Лекции по теории вероятностей. М.: 30. Берталанфи Л. Общая теория систем — обзор проблем и результатов

// Системные исследо31. Рапопорт А. Различные подходы к общей теории систем //Системные

исследования. Ежего

– 318 –

Page 319: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

32. Анфилатов В. С., Емельянов А. А., Кукушкин А. А. Системный ана-лиз в управлении. М.: Финансы и статистика, 2002.

, 1989.

сис-

анализ и исследование операций. М.:

рь.

ию ГОСТ Р ИСО/МЭК 12207 (Процессы

гия. «Инь» и «Янь» информационных техноло-

4 с.

жения.

СПб.: Изд-во СПбГПУ, 2004. 224 с.

зы данных: проектирование, реа-лизация и сопровождение. Теория и практика. 2-е изд. М.: Вильямс, 2001. 1120 с.

33. Перегудов Ф. И., Тарасенко Ф. П. Введение в системный анализ. М.: Высшая школа

34. Зыков В. В. Введение в системный анализ: моделирование, управле-ние, информация. Тюмень: Изд-во ТюмГУ, 1998.

35. Васильев В. И., Романов Л. Г., Червоный А. А. Основы теории тем. М.: МГТУ ГА, 1994.

36. Дегтярев Ю. И. Системный Высшая школа, 1996.

37. Уемов А. И. Системный подход и общая теория систем. М.: Мысль, 1978.

38. Советов Б. Я., Яковлев С. А. Моделирование систем: учебник для вузов. М.: Высшая школа, 2001.

39. Месарович М., Такахара Я. Общая теория систем: математические основы. М.: Мир, 1978.

40. Моисеев Н. Н. Математические задачи системного анализа. М.: Нау-ка, 1981.

41. ГОСТ Р ИСО 9000-2001 Системы менеджмента качества. Основные положения и слова

42. ГОСТ Р ИСО/МЭК ТО 15271-2002 «Информационная технология. Руководство по примененжизненного цикла программных средств)».

43. Архитектура и стратегий предприятия / А. Данилин, А. Слюсаренко. М.: Интернет-Ун-т Информ. Технологий, 2005. 50

44. Р 50-605-80-93 Рекомендации по стандартизации. СРПП. Термины и определения.

45. ГОСТ Р 15.000-94. Система разработки и постановки продукции на производство. Основные поло

46. Информационные системы: учеб. пособие / под ред. В. Н. Волковой, Б. И. Кузьмина.

47. ГОСТ 26228-90 Системы производственные гибкие. Термины и оп-ределения, номенклатура показателей.

48. ГОСТ 24.103-84 Автоматизированные системы управления. Общие положения.

49. Конноли Т., Брег К., Страчан А. Ба

– 319 –

Page 320: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

50. Основные подходы к архитектуре Хранилищ данных. http://www. interface.ru/fset.asp?Url = /ca/osnpodhodi.htm.

51. Емельянова Н. З., Партыка Т. Л., Попов И. И. Основы построения

//

2000.

om-

автоматизированных информационных систем: учеб. пособие. М.: ФОРУМ: ИНФРА-М, 2005. 416 с.

52. ГОСТ Р ИСО 15489-1-2007 Система стандартов по информации, библиотечному и издательскому делу. Управление документами.

53. РД. Безопасность информационных технологий. Руководство по фор-мированию семейств профилей защиты. Гостехкомиссия России, 2003 г. [Электронный ресурс]. Режим доступа: http://www. fstec.ru/spravs/spc/doc_3_3_022.htm.

54. ГОСТ 7.73-96. СИБИД. Поиск и распространение информации. Тер-мины и определения.

55. ГОСТ 7.74–96. СИБИД. Информационно-поисковые языки. Термины и определения. Пантелеева 56. Н. Вводный курс по поисковым системам. http:meta.math.spbu.ru/~nadejda/ir-tutorial/nadejda_ir.html.

57. Некрестьянов И. С. Тематико-ориентированные методы информаци-онного поиска: дис. … физ. мат. н. СПб.: СПбГУ,

58. Сегалович И. Как работают поисковые системы. http:// company.yandex.ru/articles/article10.html.

59. Brin S., Page L. The Anatomy of a Large-Scale Hypertextual Web Search Engine. Computer Science Department, Stanford University, Stanford, CA 94305. http://google.stanford.edu/

60. Определение ECM — http://www.aiim.org/about-ecm.asp 61. Ulrich Kampffmeyer, «ECM — Herrscher über Informationen». C

puterWoche, CW-exktraKT, Munich, September 24th, 2001. 62. Электронные словари ABBYY Lingvo 12. Выпуск12.0.0.442. Словарь

ABBYY Lingvo 12 English (LERP1200038440640185). 63. Федеральный закон об электронной цифровой подписи. № 1-ФЗ от

10 января 2002 года. 64. Шеперд Д. Освой самостоятельно XML за 21 день. 2-е изд. М.: Виль-

ямс, 2002. 432 с. (в свободном доступе книга находится по http://www.natahaus.ru/).

65. Центр компетенции BPMi — http://www.bpmi.ru/. 66. Институт типовых решений производства (ИТРП). http://www.

itrp.ru/content/theory/ 67. SAS Activity Based Management. http://www.dssdev.ru/Solu-

tion/ABM.php.

– 320 –

Page 321: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

68. Описание стандарта MRPII. http://www.citforum.ru/cfin/mrp/ mrp2.shtml.

69. Федеральный закон «О бухгалтерском учете» от 21 ноября 1996 г.

ng) Процессно-ориентированное бюдже-

системы — http://www.itstan.ru/.

66.htm

дел 3 заменен на ГОСТ 34.603-92).

-80 Требования к содержанию документа Описание по-

в по техниче-

ования к содержанию документов по функцио-

вые проектные решения. Основные положения.

кументов при создании автоматизированных систем (Взамен

№ 129-ФЗ. 70. ABB (Activity-Based Budgeti

тирование. — http://www.proces.biz/ABB/index.html. 71. Информационные технологии и 72. Управление цепочками поставок (SCM). http://www.

logistics.ru/21/7/1/i8_473. Гудков Д. Информационная поддержка изделия на всех этапах жиз-

ненного цикла (CALS «Continious Acquisition And Life-Cycle Support»). http://www.espotec.ru/art_info.htm.

74. ГОСТ 24.104-85 Автоматизированные системы управления. Общие требования (Раз

75. ГОСТ 24.202-80 Требования к содержанию документа Технико-экономическое обоснование.

76. ГОСТ 24.203-80 Требования к содержанию общесистемных доку-ментов.

77. ГОСТ 24.204становки задачи.

78. ГОСТ 24.205-80 Требования к содержанию документов по информа-ционному обеспечению.

79. ГОСТ 24.206-80 Требования к содержанию документоскому обеспечению.

80. ГОСТ 24.207-80 Требования к содержанию документов по про-граммному обеспечению.

81. ГОСТ 24.208-80 Требования к содержанию документов стадии Ввод в эксплуатацию.

82. ГОСТ 24.209-80 Требования к содержанию документов по организа-ционному обеспечению.

83. ГОСТ 24.210-82 Требнальной части.

84. ГОСТ 24.703-85 Типо85. ГОСТ 34.201-89 Информационная технология. Комплекс стандартов

на автоматизированные системы. Виды, комплектность и обозначе-ния доГОСТ 24.101-80, ГОСТ 24.102-80).

– 321 –

Page 322: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

86. ГОСТ 34.601-90 Информационная технология. Комплекс стандартов на автоматизированные системы. Автоматизированные системы.

Т 24.602-86).

е

91. 80-88 Автоматизированные системы. Основные положения. 92. Р 50-34.126-92. Информационная технология. Правила проведения

работ при создании автоматизированных систем. 93. ГОСТ Р ИСО/МЭК 12207-99 «Информационная технология. Процес-

сы жизненного цикла программных средств». 94. Бойченко А. В., Кондратьев В. К., Филинов Е. Н. Основы открытых

информационных систем. М.: Издательский центр АНО «ЕОАИ», 2004. 128 с.

95. Буч Г., Якобсон А., Рамбо Дж. UML. Классика CS. 2-е мзд. / пер. с англ.; под общ. ред. проф. С. Оролова. СПб.: Питер, 2006. 736 с.

96. Максимович Г. Ю., Романенко А. Г., Самойлюк О. Ф. Информацион-ные системы: учеб. пособие / под общ. ред. К. И. Курбакова. М.: Изд-во Рос. Экон. Акад., 1999. 198 с.

97. Михайлов А. И., Черный А. Н., Гиляревский Р. С. Научные комму-никации и информатика. М.: Наука, 1976. 755 с.

98. Попов И. И., Романенко А. Г., Сумароков Л. Н. Автоматизированные системы и сети: учеб. пособие. М.: МИФИ, 1978. 51 с.

99. Системы управления базами данных и знаний: Справочник / А. Н. Наумов, А. М. Вендров, В. К. Иванов и др. / под ред. А. Н. Наумова. М.: Финансы и статистика, 1991. 349 с.

100. Винер Н. Кибернетика или управление и связь в животном и машине. 2-е изд. М.: Сов. радио, 1968. 325 с.

Стадии создания. (Взамен ГОСТ 24.601-86, ГОС87. ГОСТ 34.602-89 Информационная технология. Комплекс стандартов

на автоматизированные системы. Техническое задание на созданиавтоматизированной системы (Взамен ГОСТ 24.201-85).

88. ГОСТ 34.603-92 Информационная технология. Виды испытаний ав-томатизированных систем (Взамен ГОСТ 24.104-85 в части разд. 3.).

89. РД 50-34.698-90 «Методические указания информационная техноло-гия. Комплекс стандартов и руководящих документов на автомати-зированные системы. Автоматизированные системы требования к содержанию документов».

90. РД 50-682-89 Информационная технология. Комплекс стандартов и руководящих документов на автоматизированные системы. Общие положения.

50-6РД

– 322 –

Page 323: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

101. Д. Г. Автоматизированные документально-фактографические рмационно-поисковые системы. // Итоги науки и техники.

. Информатика. Т. 12. М.: ВИНИТИ, 1988. 168 с. 102. Сэлтон Г. Автоматичес нение и поиск информации.

М.: Сов. радио, 1973. 364103. Урсул А. Д. К информация». //

НТИ. Сер. 1. 1104. Романенко А. Г онных систем. М.:

МГИАИ, 19105. Попов И. И етико-множест-

венное моделирование стем // Вопросы информа-ционной теории и практик 8. № 33-34. С. 16-63.

106. Шемякин Ю. И. Введе . М.: Финансы и статисти-ка, 1985. 190 с.

107. Криницкий Н. А., Миронов Г. А., ролов Г. Д. Автоматизированные информационные системы. М.: Наука, 1982. 384 с.

108. Мцяшек, Лешек, А. Анализ треб й и проектирование систем. Ра стем с использовани м М.: Вильямс, 20

109. В циклопе ipedia.org/. 110. SW еджмента (подго-

то етерб ме-не igs.ru/publication

111. Wikipedia the free encyclopedia. http://en.wikipedia.org/wiki/Main_Page. 112. Реинжиниринг: не автоматизируйте — уничтожайте / пер. с англ.

Reengineering Work: Don’t Automate, Obliterate by Michael Hammer; Harvard Business Review, July-August 1990. http://www. cfin.ru/chuvakhin/bpr.shtml/.

113. Хаммер М., Чампи Д. Реинжиниринг корпораций. Манифест рево-люции в бизнесе / пер. с англ. Ю. Е. Корнилович. М.: Манн, Иванов и Фербер, 2006. 287 с.

114. Value Chain Framework. http://www.12manage.com/methods_porter_ value_chain_ru.html.

115. Тельнов Ю понентная ме-тодологи истика, 2004. 320 с.

116. Micha с: http:// markus.spb.ru/na на © Harvard Busi-ness School Publ ». 2001. № 4.

ЛахутиинфоСер

кая обработка, хра с.

обсуждению определения понятия «966. № 6. С. 1-7.

. Моделирование информаци88. 83 с. ., Романенко А. Г., Сумароков Л. Н. Теор

информационных сии. М.: ИНИТИ, 197

ние в информатикуВ

Ф

ованиезработка си UML / пер. с англ.

02. 432 с. икипедия — свободная эн дия. http://ru.wik

OT-анализ как инструмент стратегического менвлено компанией «БИГ — П ург» в рамках проекта «7 нотджмента». http://b s/swot_analise.php.

. Ф. Реинжиниринг бизнес-процессов. Комя. 2-е изд. переаб. и доп. М.: Финансы и стат

el Porter’ ый ресурs Value Chain // Электроннvalochnaya/porter.shtml; с ссылкойishin равлениеg. Журнал «Искусство уп

– 323 –

Page 324: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

– 324 –

117. TOGAF — The Open Group Architecture Framework. http://www.open-group.org/.

118. Zachman Framework — http://www.zifa.com. 119. John Zachman / Concepts of The Framework For Enterprise Architecture/

http://apps.adcom.uci.edu/EnterpriseArch/Zachman/zachman3_files/sachman3.htm.

120. Description of Row to Row differences by David Hays. http:// apps.adcom.uci.edu/EnterpriseArch/Zachman/.

121. E. F. Codd, S. B. Codd, C. T. Salley. Providing OLAP (On-Line Analyti-cal Processing) to User-Analysts: An IT Mandate. — E.F.Codd & Associ-ates, 1993. http://www.minet.uni- jena.de/dbis/lehre/ss2005/sem_ dwh/lit/Cod93.pdf.

122. Бурцева Е. В., Рак И. П., Селезнев А. В., Терехов А. В., Чернышов В. Н. Информационные системы: учеб. пособие. Тюмень: Изд-во ТГТУ 2009. 121 с. http://window.edu.ru/library/pdf2txt/260/68260/41810/ page6.

Page 325: iside.distance.ruiside.distance.ru/w/Books/Инф-е сис-мы и техн.1.pdf · УДК 004(075.8) ББК З973я73 И244 А. Г. Ивашко, Ю. Е. Карякин. ИНФОРМАЦИОННЫЕ

– 325 –

Учебное издание

Александр Григорьевич ИВАШКО Юрий Евгеньевич КАРЯКИН

ИНФОРМАЦИОННЫЕ СИСТЕМЫ

И ТЕХНОЛОГИИ

Учебное пособие

Редактор Ю. Ф. Евстигнеева Технический редактор Н. Г. Яковенко Компьютерная верстка С. Ф. Обрядова Компьютерный дизайн обложки Е. Г. Шмакова Печать электрографическая Н. С. Власова, А. В. Башкиров Печать офсетная В. В. Торопов, С. Г. Наумов

Подписано в печать 04.06.2013. Тираж 130 экз. Объем 20,25 усл. п. л. Формат 60×84/16. Заказ 412.

Издательство Тюменского государственного университета

625003, г. Тюмень, ул. Семакова, 10 Тел./факс: (3452) 45-56-60, 46-27-32

E-mail: [email protected]