Калинина В. - Надежность и эффективности АИС
ВВЕДЕНИЕ В ТЕОРИЮ НАДЕЖНОСТИ СЛОЖНЫХ СИСТЕМ
Современные требования к надежности сложных систем. Определение и измерение надежности
Одной из основных проблем построения вычислительных систем во все времена остается задача обеспечения их продолжительного функционирования. Эта задача имеет три составляющие: надежность, готовность и удобство обслуживания.
Все эти три составляющие предполагают, в первую очередь, борьбу с неисправностями системы, порождаемыми отказами и сбоями в ее работе. Эта борьба ведется по всем трем направлениям, которые взаимосвязаны и применяются совместно.
Надежность - свойство объекта сохранять во времени в установленных пределах значения всех параметров, характеризующих способность выполнять требуемые функции в заданных режимах и условиях применения, технического обслуживания, хранения и транспортировки. При необходимости в понятие "объект" могут быть включены информация и ее носители, а также человеческий фактор, например при рассмотрении надежности АИС.
Терминология по надежности в технике распространяется на любые технические объекты. Проблема надежности, возникшая много лет назад, заставила говорить о ней в первую очередь инженеров и экономистов, а затем и математиков как о проблеме номер один. Вначале речь шла не о низкой надежности технических средств в настоящем смысле слова. Безотказность и даже ремонтопригодность техники были вполне удовлетворительными, но затраты на восстановительные работы, замену отказавших деталей и различные технические профилактические мероприятия были слишком велики.
По известным источникам, в 1949 г. около 70% всей морской радиоэлектронной аппаратуры США находилось в состоянии ремонта. В конце Второй мировой войны около 60% самолетного оборудования, переброшенного на Дальний Восток, оказалось неисправным, при этом около 50% запасных комплектов и элементов вышли из строя в результате хранения.
В тот период радиосвязное оборудование находилось в неработоспособном состоянии 1/7 всего времени эксплуатации, радиолокационное - 5/6, гидроакустическое - около 1/2 этого времени. Перечисление можно
было бы продолжить для других видов техники, других стран и других периодов времени.
Прошло чуть более четверти века, и мир заговорил о научно-технической революции. Начали создаваться сверхсложные системы в информатике, энергетике, транспорте и в других отраслях народного хозяйства. Причем это были не просто системы, которые характеризовались большим числом входящих в их состав элементов, сложными структурой и алгоритмами функционирования. Это были системы, пронизывающие всю инфраструктуру современного общества на государственном уровне, а это приводило не только к чисто структурному и функциональному их усложнению, но и резкому повышению требований к надежности, живучести и безопасности функционирования.
Этот период развития техники характеризуется уже не только лозунгами о важности проблемы надежности, но и бурным развитием методов обеспечения высокой надежности систем на всех этапах - при проектировании, производстве, испытаниях и эксплуатации.
Действительно, проектирование и реализация сложных технических систем, на создание которых в течение многих лет затрачивались огромные людские и материальные ресурсы, уже невозможно было осуществлять "на глазок". Требовался строгий математический расчет всех технических параметров, включая различные показатели надежности, нужны были обоснованные технико-экономические решения.
При этом, учитывая огромную ответственность задач, решаемых техническими сверхсистемами на уровне национальной экономики, национальной безопасности, порою непредвидимые экономические и морально-политические последствия от возможных ошибок и отказов в этих системах, необходимо было не только обеспечить технические возможности этих систем вообще, но и, что самое главное, сохранить и поддержать работоспособность этих систем в течение очень длительного времени эксплуатации.
Повышение надежности основано на принципе предотвращения неисправностей путем снижения интенсивности отказов и сбоев за счет применения электронных схем и компонентов с высокой и сверхвысокой степенью интеграции, снижения уровня помех, облегченных режимов работы схем, обеспечения тепловых режимов их работы, а также за счет совершенствования методов сборки аппаратуры.
Показатель надежности - количественная характеристика одного или нескольких свойств, составляющих надежность объекта. К показателям надежности относят количественные характеристики надежности, которые вводят согласно правилам статистической теории надежности.
Показатели надежности вводят по отношению к определенным режимам и условиям эксплуатации.
Комплексный показатель надежности - показатель надежности, ха-
растеризующий несколько свойств, составляющих надежность объекта. Примером комплексного показателя надежности служит коэффициент готовности (см. п. 3.1).
Расчетный показатель надежности - показатель надежности, значения которого определяются расчетным методом.
Экспериментальный показатель надежности - показатель надежности, точечная или интервальная оценка которого определяются по данным испытаний.
Универсальной единицей измерения надежности является среднее время наработки на отказ (MTBF - Mean Time Between Failure).
Надежность - комплексное свойство, состоящее в общем случае из безотказности, долговечности, ремонтопригодности и сохраняемости.
Безотказность - свойство объекта непрерывно сохранять работоспособное состояние в течение некоторого времени. Безотказность в той или иной степени свойственна объекту в любом из возможных режимов его существования.
Работоспособное состояние (работоспособность) - состояние объекта, при котором значения всех параметров, характеризующих способность выполнять заданные функции, соответствуют требованиям нормативно-технической и (или) проектной документации.
Долговечность - свойство объекта сохранять работоспособное состояние до наступления предельного состояния при установленной системе технического обслуживания и ремонта.
Ремонтопригодность - свойство объекта, заключающееся в приспособленности к поддержанию и восстановлению работоспособного состояния путем технического обслуживания и ремонта. Термин "ремонтопригодность" традиционно трактуется в широком смысле, он эквивалентен международному термину "поддерживаемость".
Сохраняемость подразумевает под собой возможность хранения объекта в исправном состоянии при отсутствии эксплуатации.
Исправное состояние (исправность) - состояние объекта, при котором он соответствует всем требованиям нормативно-технической и (или) проектной документации.
Неисправное состояние (неисправность) - состояние объекта, при котором он не соответствует хотя бы одному из требований нормативнотехнической и (или) проектной документации.
Работоспособный объект может быть неисправным. Переход объекта из исправного состояния в неисправное работоспособное состояние происходит из-за повреждений.
Под критериями повреждений понимают признаки или совокупность признаков неисправного, но работоспособного состояния объекта.
Таким образом, основные эксплуатационные характеристики системы существенно зависят от удобства ее обслуживания, в частности от ремонтопригодности, контролепригодности и т.д.
Можно привести примеры многих современных технических систем, для которых решение проблемы надежности в самом прямом смысле означает, быть или не быть данной системе. К ним можно отнести различные системы информатики: региональные и отраслевые автоматизированные системы управления, включающие в свой состав большое число ЭВМ, системы управления воздушным движением для гражданской авиации, автоматизированные системы управления технологическими процессами, сеть центров управления и слежения за космическими объектами, сети и системы передачи данных.
Усложнение систем идет в различных направлениях. С одной стороны, в состав технических систем входит все большее число комплектующих элементов.
С другой стороны, усложняется их структура, определяющая соединение отдельных элементов и их взаимодействие в процессе функционирования и поддержания работоспособности. Понятно, что усложнение систем является прямым следствием постоянно возрастающей ответственности выполняемых ими функций, сложности и многообразия этих функций, что, в свою очередь, диктуется прогрессом науки и техники.
При прочих равных условиях система, состоящая из большого числа комплектующих элементов и имеющая более сложную структуру и сложный алгоритм функционирования, является менее надежной по сравнению с более простой системой. Это требует разработки специальных методов обеспечения, повышения и поддержания надежности таких систем, включая разработку математических методов априорных расчетов и экспериментальной оценки.
Инженеры, физики и математики приложили немало совместных усилий для разработки современной теории надежности. Были предприняты гигантские усилия для создания более надежных компонентов, более простых и надежных схем и конструкций, улучшения условий эксплуатации.
Были разработаны соответствующие методы, позволяющие осуществлять анализ и синтез разрабатываемых технических средств на этапе проектирования, проводить обоснованные оценки показателей надежности этих средств во время испытаний и эксплуатации.
Однако проблема надежности продолжает оставаться одной из основных для современной техники. Дело, видимо, объясняется не столько тем, что достигнутая надежность современных технических систем слишком низка, сколько тем, что непрерывно усложняются решаемые задачи и одновременно повышаются требования к надежности их выполнения.
Обслуживаемые и необслуживаемые объекты. Резервирование
Обслуживаемый объект - объект, для которого проведение технического обслуживания предусмотрено нормативно-технической и (или) проектной документацией.
Надежность обслуживаемого объекта возрастает за счет повышения интенсивности устранения неисправностей.
Необслуживаемый объект - объект, для которого проведение технического обслуживания не предусмотрено нормативно-технической и (или) проектной документацией
Пусть, например, имеет место многоканальная система передачи с частотным и временным разделением каналов - сложный комплекс технических средств, включающий в себя оконечную аппаратуру, устанавливаемую на оконечных пунктах (ОП), промежуточную аппаратуру, размещаемую в обслуживаемых (ОУП) или необслуживаемых (НУП) усилительных пунктах, а также линий связи (рис. 1.1).
за того, что в цепи теряется часть энергии передаваемого сигнала. Конкретные электрические параметры цепи и чувствительность приемного устройства определяют допустимую дальность связи. Например, при передаче речи мощность сигнала на выходе микрофона телефонного аппарата Р
пер = 1 мВт, а чувствительность телефона приемного аппарата Р
пр = 0,001 мВт.
Таким образом, максимально допустимое затухание цепи не должно быть больше 3max = 10 Ід(Рпер/ Рпр) = 10 lg(1/0,001) = 30 дБ. Зная затухание a
max и коэффициент затухания на 1 км длины линии связи а, можно определить дальности передачи І = a
max/a.
В системах передачи применяется способ компенсации затухания сигналов повышением мощности сигнала в нескольких равномерно расположенных точках тракта. Часть канала связи между соседними промежуточными усилителями называется усилительным участком.
Изменение уровней сигнала вдоль магистрали описывается диаграммой уровней, приведенной на рис. 1.2.
Аппаратура ОУП и НУП служит не только для усиления аналогового сигнала, но и для коррекции (выравнивания) амплитудно-частотных и фазочастотных характеристик линейного тракта. Аппаратура НРП и ОРП предназначена для восстановления амплитуды, длительности и временного интервала между импульсами сигнала цифровых систем.
Расстояние между НУП (НРП) меняется в широких пределах для различных систем передачи и может составлять от единиц до десятков (иногда сотни) километров. Как правило, НУП (НРП) представляет собой металлическую камеру, имеющую подземную и наземную части. В камере размещаются вводно-коммутационное и усилительное (регенерационное) оборудование.
Аппаратура ОП и ОУП (ОРП) размещается в зданиях, где постоянно находится технический персонал для ее обслуживания.
Резервирование - способ обеспечения надежности объекта за счет использования дополнительных средств и (или) возможностей, избыточных по отношению к минимально необходимым для выполнения требуемых функций. Резервирование используется для достижения заданного уровня надежности сложного объекта при недостаточно надежных компонентах и там, где требуется обеспечить безотказную работу системы при наличии внешних дестабилизирующих факторов (например, в системах управления войсками и оружием).
Для необслуживаемых объектов более выгодным является резервирование на низком уровне. В этом случае с целью обеспечения надежности подвергаются дублированию те компоненты устройства, выход из строя которых во время эксплуатации наиболее вероятен.
Надежность системы и ее элементов.
Методы испытаний надежности систем
Надежность АИС целиком и полностью зависит от надежности входящих в нее компонентов. В простейшем случае для определения вероятности безотказной работы системы, т.е. ее надежности, достаточно воспользоваться теоремой умножения вероятностей. Например, если система содержит два элемента, вероятности безотказной работы которых в течение определенного промежутка времени равны соответственно 0,95 и 0,98, то вероятность безотказной работы системы в течение этого промежутка времени составит 0,950,98 = 0,931. В более сложных случаях для определения надежности системы приходится использовать более сложный математический аппарат, а иногда рассчитать вероятность безотказной работы аналитическими методами просто не представляется возможным.
Тогда для определения надежности автоматизированных систем (АС) проводят испытания.
Испытания АС представляют собой процесс проверки выполнения заданных функций системы, определения и проверки соответствия требованиям технического задания (ТЗ) количественных и (или) качественных характеристик системы, выявления и устранения недостатков в действиях системы, в разработанной документации. Для АС устанавливают следующие основные виды испытаний:
1) предварительные;
2) опытная эксплуатация;
3) приемочные.
От того, какие взаимосвязи в испытываемых в АС объектов, испытания могут быть автономные или комплексные.
Автономные испытания охватывают части АС. Их проводят по мере готовности частей АС к сдаче в опытную эксплуатацию.
Комплексные испытания проводят для групп, взаимосвязанных частей АС или для АС в целом.
Для планирования проведения всех видов испытаний разрабатывают документ "Программа и методика испытаний". Программа и методика испытаний должны устанавливать необходимый и достаточный объем испытаний, обеспечивающий заданную достоверность получаемых результатов. Программа и методика испытаний может разрабатываться на AC в целом,
на части АС. В качестве приложения могут включаться тесты (контрольные примеры).
Предварительные испытания АС проводят для определения ее работоспособности и решения вопроса о возможности приемки AC в опытную эксплуатацию. Предварительные испытания следует выполнять после проведения разработчиком отладки и тестирования поставляемых программных и технических средств системы и представления им соответствующих документов о их готовности к испытаниям, а также после ознакомления персонала АС с эксплуатационной документацией.
Опытную эксплуатацию АС проводят с целью определения фактических значений количественных и качественных характеристик АС и готовности персонала к работе в условиях функционирования АС, определения фактической эффективности АС, корректировки (при необходимости) документации.
Приемочные испытания АС проводят для определения соответствия АС техническому заданию, оценки качества опытной эксплуатации и решения вопроса о возможности приемки АС в постоянную эксплуатацию. Приемочным испытаниям АС должна предшествовать ее опытная эксплуатация на объекте.
В зависимости от вида требований, предъявляемых к АС на испытаниях, проверке или аттестации в ней подвергают:
1) комплекс программных и технических средств;
2) персонал;
3) эксплуатационную документацию, регламентирующую деятельность персонала при функционировании АС;
4) АС в целом.
При испытаниях АС проверяют:
1) качество выполнения комплексом программных и технических средств автоматических функций во всех режимах функционирования АС согласно ТЗ на создание АС;
2) знание персоналом эксплуатационной документации и наличие у него навыков, необходимых для выполнения установленных функций во всех режимах функционирования АС согласно ТЗ на создание АС;
3) полноту содержащихся в эксплуатационной документации указаний персоналу по выполнению им функций во всех режимах функционирования АС согласно ТЗ на создание АС;
4) количественные и (или) качественные характеристики выполнения автоматических и автоматизированных функций АС в соответствии с ТЗ;
5) другие свойства АС, которым она должна соответствовать по ТЗ.
Испытания АС следует проводить на объекте заказчика. По согласованию между заказчиком и разработчиком предварительные испытания и
приемку программных средств АС допускается проводить на технических средствах разработчика при создании условий получения достоверных результатов испытаний.
Допускается последовательное проведение испытаний и сдача частей АС в опытную и постоянную эксплуатацию при соблюдении установленной в ТЗ очередности ввода АС в действие.
Автономные испытания АС следует проводить в соответствии с программой и методикой автономных испытаний, разрабатываемых для каждой части АС. В программе автономных испытаний указывают:
1) перечень функций, подлежащих испытаниям;
2) описание взаимосвязей объекта испытаний с другими частями АС;
3) условия, порядок и методы проведения испытаний и обработки результатов;
4) критерии приемки частей по результатам испытаний.
К программе автономных испытаний следует прилагать график проведения автономных испытаний. Подготовленные и согласованные тесты (контрольные примеры) на этапе автономных испытаний должны обеспечить:
1) полную проверку функций и процедур по перечню, согласованному с заказчиком;
2) необходимую точность вычислений, установленную в ТЗ;
3) проверку основных временных характеристик функционирования программных средств (в тех случаях, когда это является существенным);
4) проверку надежности и устойчивости функционирования программных и технических средств.
В качестве исходной информации для теста рекомендуется использовать фрагмент реальной информации организации-заказчика в объеме, достаточном для обеспечения необходимой достоверности испытаний. Результаты автономных испытаний частей АС следует фиксировать в протоколах испытаний. Протокол должен содержать заключение о возможности (невозможности) допуска части АС к комплексным испытаниям.
В случае если проведенные автономные испытания будут признаны недостаточными, либо будет выявлено нарушение требований регламентирующих документов по составу или содержанию документации, указанная часть АС может быть возвращена на доработку и назначен новый срок испытаний.
Комплексные испытания АС проводят путем выполнения комплексных тестов. Результаты испытаний отражают в протоколе.
Работу завершают оформлением акта приемки в опытную эксплуатацию. В программе комплексных испытаний АС или частей АС указывают:
1) перечень объектов испытания;
2) состав предъявляемой документации;
3) описание проверяемых взаимосвязей между объектами испытаний;
4) очередность испытаний частей АС;
5) порядок и методы испытаний, в том числе состав программных средств и оборудования, необходимых для проведения испытаний, включая специальные стенды и полигоны.
Для проведения комплексных испытаний должны быть представлены:
1) программа комплексных испытаний;
2) заключение по автономным испытаниям соответствующих частей АС и устранение ошибок и замечаний, выявленных при автономных испытаниях;
3) комплексные тесты;
4) программные и технические средства и соответствующая им эксплуатационная документация.
При комплексных испытаниях допускается использовать в качестве исходной информацию, полученную на автономных испытаниях частей АС. Комплексный тест должен:
1) быть логически увязанным;
2) обеспечивать проверку выполнения функций частей АС во всех режимах функционирования, установленных в ТЗ на АС, в том числе всех связей между ними;
3) обеспечивать проверку реакции системы на некорректную информацию и аварийные ситуации.
Протокол комплексных испытаний должен содержать заключение о возможности (невозможности) приемки АС в опытную эксплуатацию, а также перечень необходимых доработок и рекомендуемые сроки их выполнения. После устранения недостатков проводят повторные комплексные испытания в необходимом объеме.
Опытную эксплуатацию проводят в соответствии с программой, в которой указывают:
1) условия и порядок функционирования частей АС и АС в целом;
2) продолжительность опытной эксплуатации, достаточную для проверки правильности функционирования АС при выполнении каждой функции системы и готовности персонала к работе в условиях функционирования АС;
3) порядок устранения недостатков, выявленных в процессе опытной эксплуатации.
Во время опытной эксплуатации АС ведут рабочий журнал, в который заносят сведения о продолжительности функционирования АС, отказах, сбоях, аварийных ситуациях, изменениях параметров объекта автоматизации, проводимых корректировках документации и программных средств, наладке технических средств. Сведения фиксируют в журнале с указанием даты и ответственного лица. В журнал могут быть занесены замечания
персонала по удобству эксплуатации АС. По результатам опытной эксплуатации принимают решение о возможности (или невозможности) предъявления частей АС и системы в целом на приемочные испытания.
Работа завершается оформлением акта об окончании опытной эксплуатации и допуске системы к приемочным испытаниям.
Приемочные испытания проводят в соответствии с программой, в которой указывают:
1) перечень объектов, выделенных в системе для испытаний, и перечень требований, которым должны соответствовать объекты (со ссылкой на пункты ТЗ);
2) критерии приемки системы и ее частей;
3) условия и сроки проведения испытаний;
4) средства для проведения испытаний;
5) фамилии лиц, ответственных за проведение испытаний;
6) методику испытаний и обработки их результатов;
7) перечень оформляемой документации.
Для проведения приемочных испытаний должна быть предъявлена следующая документация:
1) техническое задание на создание АС;
2) акт приемки в опытную эксплуатацию;
3) рабочие журналы опытной эксплуатации;
4) акт завершения опытной эксплуатации и допуска АС к приемочным испытаниям;
5) программа и методика испытаний.
Приемочные испытания следует проводить на функционирующем объекте. В первую очередь они должны включать проверку:
1) полноты и качества реализации функций при штатных, предельных, критических значениях параметров объекта автоматизации и в других условиях функционирования АС, указанных в ТЗ;
2) выполнения каждого требования, относящегося к интерфейсу системы;
3) работы персонала в диалоговом режиме;
4) средств и методов восстановления работоспособности АС после отказов;
5) комплектности и качества эксплуатационной документации.
Проверку полноты и качества выполнения функций АС рекомендуется
проводить в два этапа. На первом этапе проводят испытания отдельных функций (задач, комплексов задач). При этом проверяют выполнение требований ТЗ к функциям (задачам, комплексам задач).
На втором этапе проводят проверку взаимодействия задач в системе и выполнение требований ТЗ к системе в целом. По согласованию с заказчиком проверка задач в
зависимости от их специфики может проводиться автономно или в составе комплекса. Объединение задач при проверке в комплексах целесообразно проводить с учетом общности используемой информации и внутренних связей.
Проверку работы персонала в диалоговом режиме проводят с учетом полноты и качества выполнения функций системы в целом.
Проверке подлежат:
1) полнота сообщений, директив, запросов, доступных оператору, и их достаточность для эксплуатации системы;
Анализ и контроль покупных и повторно используемых компонентов
технические (метрологические, технологические, конструкторские);
- экономические (финансовые, нормативные, материальные);
- социальные (организационные, правовые, кадровые).
Комплексное использование всех этих факторов и их компонентов -
основное условие успешного функционирования системы управления качеством продукции. Этот опыт обобщен в серии международных стандартов ISO 9000, на основе которых издана серия отечественных стандартов ГОСТ 40.9000.
В соответствии с этими стандартами существует тесная связь стадий жизненного цикла и качества. Это отражается в так называемой петле качества (рис.
5.5).
Под уровнем качества изделия понимаются относительные характеристики качества (или его обобщенная характеристика) по сравнению с со- Маркетинговые
исследования
Утилизация
изделия
Техпомощь и обслуживание
Монтаж и эксплуатация
Реализация и распределение методы количественной обработки качественных экспертных оценок. Разработка требований к надежности АИС и показателям качества АИС на этапе системного анализа проекта проводится в основном с использованием моделей экспертных оценок.
Экспертная система качества - программная система, которая использует экспертные знания и модели экспертных оценок для обеспечения высокоэффективного решения задач в предметной области управления качеством. При разработке экспертных систем качества широко используются методы, наработанные в исследованиях по искусственному интеллекту.
Типовая схема оценки уровня качества изделия приведена на рис. 5.6.
безотказность (свойство изделия сохранять работоспособность в течение некоторого времени наработки без вынужденных перерывов);
- долговечность (свойство изделия сохранять работоспособность до
предельного состояния с необходимыми перерывами для технического обслуживания);
- сохраняемость (свойство изделия сохранять обусловленные эксплуатационные показатели в течение и после срока хранения и транспортировки).
Показатели надежности, по существу, дополняют характеристику технического эффекта, так как предопределяют длительность и вероятность или полноту появления этого эффекта при эксплуатации изделия. Например, суммарный эффект Э от изделия у потребителя за срок службы Т
сл (в годах) при годовом эффекте в случае безотказной работы Эг составит
Э = ЭгТ
слК
эф,
где К
эф - коэффициент сохраняемости, учитывающий степень безотказности изделия в эксплуатации.
Таким образом, надежность изделия - это свойство, безусловно, одно из важнейших для него на всех этапах его жизненного цикла (кроме утилизации). С другой стороны, оно имеет четкую технико-экономическую природу. Необходимая надежность конкретного изделия определяется его назначением, и мера надежности - одна из тех характеристик, за которую платит потребитель.
В то же время обеспечение необходимого уровня надежности может быть решено многими техническими приемами, реализация каждого из которых требует определенных затрат. В такой постановке возникает задача технико-экономической оптимизации надежности изделия и затрат на ее обеспечение.
Критерием выбора оптимального решения при определении уровня надежности изделия служит минимум суммы приведенных затрат в комплексе "изделие-потребители-смежные звенья":
Е
нXК + ХС ® min’
j j
где j - число объектов комплекса, по которым инвестиции (K) или (и) текущие затраты (С) различны в зависимости от вариантов выполнения изделия;
Е
н - внутренний темп окупаемости инвестиций.
Это выражение равносильно следующему:
Е
НКо + С + У
тс + У
п + У
а ® min,
где К
0 - капитальные затраты на повышение надежности (снижение вероятности отказов) изделия;
С0 - текущие затраты на повышение надежности;
У
тс - годовой ущерб от отказов изделия у потребителя (ремонт, обслуживание);
У
п - годовой ущерб в основной деятельности потребителя от отказов изделия;
У
сз - годовой ущерб в смежных звеньях от отказов изделия.
Предположим, таким изделием является генератор электроэнергии, поставляемый фирмой для районных электростанций. При его отказах потребителю наносится ущерб не только из-за дополнительного обслуживания и ремонта генератора, но и из-за снижения качества продукции (напряжение, частота в электросетях), недовыпуска продукции, непроизводительного расхода ресурсов при простое, необходимости иметь резервное оборудование и дополнительные запасы. В свою очередь ущерб в смежных звеньях (у потребителей электроэнергии) может быть особенно велик (им необходимо иметь соответствующие средства защиты, аварийное автономное резервное питание, запас предметов труда и т.д.). Типичная ситуация отображена на графиках (рис.
5.7). Предположим, что в исходном варианте изделия показатели его надежности были на уровне Н,, а цена потребления изделия (инвестиции в него и текущие расходы) была З
п1. Изготовителем разработан модифицированный вариант изделия с повышенной надежностью H
opt, но цена его потребления З
п.
0| З
п1.
В отраженной на графике рис. 5.7 ситуации потребителю изделия будет выгодно заплатить большую сумму за изделие с повышенной надежностью, так как при этом цена потребления изделия за
вычетом суммы ущерба от отказов изделия будет минимальной. Дальнейшее повышение надежности и, следовательно, цены изделия будет невыгодно потребителю. Задача производителя изделия состоит в таком проектировании модифицированного изделия и организации его производства, чтобы обеспечить привлекательную для фирмы-изготовителя норму прибыли.
Таким образом, мы еще раз убеждаемся в том, что изготовитель должен системно подойти к ценообразованию на продукцию, изучив экономические характеристики эксплуатации изделия потребителем.
Технически возможны различные методы повышения надежности изделия:
- применение более прочных материалов с более высокими нагрузочными характеристиками, изменение конструктивных решений;
- поэлементное или поканальное резервирование;
- повышение схемной надежности;
- совершенствование технологии изготовления;
- совершенствование системы ремонтов, обслуживания и эксплуатации.
По каждому из этих вариантов технологических решений должны быть
рассчитаны затраты, а далее целесообразно построить диаграммы "затраты-надежность", аналогичные приведенным на рис. 5.7.
Анализ таких диаграмм позволяет принять решение о методах реализации экономически оптимальной надежности изделия.
Определение потребности в новой системе в значительной степени является творческой задачей, и аналитические методы на этом этапе системотехнических работ носят вспомогательный характер.
Системотехника - научное направление, использующее методы системного анализа для создания, испытания и эксплуатации сложных технических и организационно-технических систем.
Анализ и контроль покупных и повторно используемых компонентов (ПИК). Комплексные испытания АИС
Единичному и мелкосерийному производству изделий, каким зачастую является производство АИС, свойственны особенности, существенно влияющие на качество выпускаемой продукции. К таким особенностям можно отнести частую переналадку технологического оборудования, обусловленную изменением номенклатуры выпускаемых изделий и перерывами в производстве, что в свою очередь приводит к консервации и расконсервации этого оборудования; частичную потерю навыков и квалификации производственного персонала, нестабильность производственных условий; нерентабельность производства из-за больших затрат на требуемые испытания и т.д.
В составе нового комплекса стандартов разработан стандарт ГОСТ РВ 20.57.418-98 (срок введения с 1 июля 1999 г.), в котором установлены дополнительные к регламентированным действующими стандартами требования к обеспечению, контролю качества и правилам приемки, например электрорадиоизделий для указанных "неординарных" условий производства.
На стадии разработки изделий должны быть проработаны вопросы обеспечения качества составляющих конструктивных элементов, узлов изделий. Поэтому выделяются критичные конструктивные элементы, для которых определяются информативные параметры, соответствие которых установленным критериям свидетельствует о сохранении требуемых свойств изделия. Разрабатываются и опробоваются методики контроля информативных параметров. Учитывая, что создать полностью управляемый технологический процесс невозможно, остаются слабо или практически не управляемые технологические операции, на которых высока вероятность возникновения дефектов.
Поэтому после таких операций необходимы расширенный диагностический неразрушающий контроль и отбраковочные испытания с жесткими критериями забракования.
Рекомендуется также создание необходимых конструктивно-технологических и производственных запасов по параметрам, установленным в конструкторской и технологической документации соответственно.
На стадии производства целесообразно больше внимание уделить вопросам обеспечения качества в ходе технологического процесса, включая вопросы оптимизации организации производства, а также усилению входного контроля покупных материалов, полуфабрикатов и повторно используемых компонентов; дополнительному инструктажу и аттестации производственного персонала; усилению контроля технологической дисциплины со стороны службы контроля качества и представителя заказчика; внеочередной аттестации испытательного оборудования, технологического процесса по точности и настроенности. В самом технологическом процессе необходимо расширить состав и ужесточить критерии операционного контроля и статистического регулирования технического процесса; ввести дополнительные контрольные операции со стороны ОТК и представителя заказчика, включая сплошной контроль информативных параметров, инспекционный контроль за отбраковочными испытаниями и проведением диагностического неразрушающего контроля.
Целесообразно дополнительно проводить ускоренные испытания на надежность критичных конструктивных элементов, проверку сохранения конструктивно-технологических и производственных запасов по параметрам. Следует расширить объем информации о результатах контроля, вносимой в сопроводительные листы изготавливаемой партии изделий, с целью ее анализа и выработки, а при необходимости давать рекомендации по проведению корректирующих воз-
действий для последующих партий изделий аналогичных типов.
После длительного перерыва в производстве изделий необходимо провести дополнительные мероприятия по обеспечению готовности производства к нормальному функционированию, в том числе:
- ремонтные и пусконаладочные работы;
- оценку технического состояния средств технологического оснащения;
- внеочередную аттестацию испытательного оборудования, технологического процесса по точности и настроенности;
-дополнительный инструктаж и (или) аттестацию производственного персонала;
- инспекционный контроль или сертификацию системы качества.
В связи с уменьшением объема выпуска возникают ситуации, когда объем выборок для полноценных испытаний становится сопоставимым с объемом годового выпуска изделий. Бывают случаи заказа изделий небольшими партиями, изготавливаемыми на заводах в течение месяца или квартала. В этих случаях целесообразно сокращать объем периодических испытаний с одновременным ужесточением приемо-сдаточных испытаний путем введения:
- сплошного контроля при проведении неразрушающих видов испытаний;
- усиленных планов выборочного контроля;
- кратковременных механических, климатических испытаний, испытаний на безотказность в течение 48, 96 или 168 ч;
- контроля параметров, отнесенных в ТУ к категории периодических испытаний;
- контроля дополнительных параметров-критериев годности в процессе и в конце механических, климатических испытаний и испытаний на безотказность, в том числе контроля информативных параметров.
В соответствии с требованиями ГОСТ РВ 20.57.418 в зависимости от характера производства допускается существенно изменять состав и объем периодических испытаний.
Для изделий единичного и мелкосерийного производства допускается для проведения определенных подгрупп испытаний включать типы изделий, выпускаемых по разным ТУ, имеющих однотипную конструкцию, близкие технологии и применяемые материалы. При этом оценку результатов испытаний распространяют на все типы изделий, входящих в единую конструктивно-технологическую группу. При получении отрицательных результатов испытаний смешанной выборки допускается проводить испытания отдельно на каждом из типов изделий, входящих в конструктивно-технологическую группу, по правилам первичных испытаний.
Приемку и отгрузку в этом случае производят по положительным результатам испытаний.
Для изделий единичного неритмичного и прерывистого производства в состав периодических испытаний не включают виды испытаний, которыми контролируют требования, подтвержденные контролем информативных параметров.
Испытания проводят на одной укрупненной подгруппе, объединяющей механические, климатические и конструктивные испытания, или последовательно по каждой из этих групп на одной выборке изделий. При испытаниях применяют фиксированные одноступенчатые планы контроля при минимальном объеме выборки с приемочным числом, равным нулю.
Приемку и отгрузку изделий осуществляют по результатам приемо-сдаточных и периодических испытаний соответственно.
Для изделий узкоцелевого применения, предназначенных для конкретной аппаратуры, допускается не проводить отдельных видов испытаний при условии осуществления подконтрольной эксплуатации со стороны предприятия-изготовителя таких изделий. Для изделий мелкосерийного неритмичного и прерывистого производства допускается также увеличивать периодичность испытаний, сохраняя при этом планы контроля в соответствии с ТУ.
После перерыва производства более чем на 9 месяцев (если иного не установлено в ОТУ) все основные виды периодических испытаний проводятся на первых партиях.
Типовые испытания осуществляют для изделий прерывистого производства, если за период перерыва произошли существенные изменения в области применяемых материалов, технологического оборудования, условий производства, технологических сред, а также при существенном снижении качества. В их состав включают те виды испытаний, которые не проведены при очередных периодических испытаниях, а также испытания из состава квалификационных.
Представляется, что регламентированный стандартом ГОСТ РВ 20.57.418 порядок сокращения объема разрушающих и дорогостоящих испытаний готовых изделий при усилении мер по обеспечению качества в процессе разработки и производства позволит сократить затраты на приемку изделий, выпускаемых в условиях единичного и мелкосерийного производства, с сохранением достигнутого уровня качества.
Организация эксплуатационного обслуживания АИС
Любая АИС в процессе работы требует эксплуатационного обслуживания. Как правило, комплексное эксплуатационное обслуживание включает в себя:
- настройку и регламентное эксплуатационное обслуживание на объек-
тах программно-технических комплексов автоматизированных информационных систем;
- инсталляцию, настройку и обслуживание системного, инструментального и прикладного программного обеспечения АИС;
- выбор методов и средств измерения эксплуатационных характеристик и функциональных подсистем АИС;
- анализ эксплуатационных характеристик АИС с целью выработки требований по их модификации.
Как показывает статистика, на эксплуатационное обслуживание вычислительной техники в Англии ежегодно расходуется 1,6 млрд. фунтов стерлингов. Развивающейся при этом тенденцией является обеспечение обслуживания не основными производителями и поставщиками вычислительной техники, а фирмами, специализирующимися только на обслуживании. Так, доля универсальных специализированных фирм, обслуживающих самую разнообразную и разнотипную вычислительную технику, составляет сейчас 10% в общем объеме эксплуатационного обслуживания ЭВМ. К числу преимуществ такой формы обслуживания относят повышение качества и оперативности ремонта, сокращение расходов, а также численности обслуживающего персонала.
Так, фирма "Бритойл" (отделение фирмы "Бритиш петролеум", Глазго), располагающая 1300 ЭВМ и сопутствующей периферийной аппаратурой 30 различных поставщиков, привлекла к их обслуживанию фирмы "АТМ". В результате уменьшились расходы на обслуживание, упростилось управление им, а вместо командируемых ремонтных бригад в составе 10-15 инженеров на предприятие направлен один инженер-ремонтник, находящийся там постоянно. Со своей стороны основные поставщики стремятся заключать контакты на ремонт и обслуживание всей вычислительной техники данного предприятия или организации, преследуя, в частности, небескорыстную цель продажи им только своей продукции.
Они также пытаются мешать деятельности специализированных эксплуатационных фирм, не продавая им запасных частей и документацию на свою вычислительную технику или не давая им доступа к своему специализированному испытательно-диагностическому оборудованию и специальному программному обеспечению.
Тем не менее эксплуатационные и сервисные фирмы успешно работают благодаря оперативности и более высокому качеству выполнения ремонтно-профилактических работ. Например, в типовом контракте с эксплуатационной фирмой оговаривается требование принятия мер по отказам и неисправностям вычислительной техники в течение не более чем четырех часов, а при необеспечении ремонта на месте предусматривается замена отказавшего блока или устройства (клавиатуры, носителя на магнитных дисках и т.п.) с его эвакуацией для ремонта в специальных мастерских.
Практика эксплуатационного обслуживания показывает, что наиболее ненадежными являются не сами ЭВМ, а периферийная аппаратура, имеющая движущиеся части и компоненты. Так, чаще всего выходят из строя печатающие аппараты, причем 20% отказов происходит из-за неумелого или небрежного обращения, в том числе из-за проливания кофе на клавиатуры. Наряду с этим отмечается устойчивая тенденция повышения надежности работы вычислительной техники. Например, хотя расходы на ее эксплуатационное обслуживание возрастают ежегодно на 10%, это ниже роста общих расходов на компьютерный сервис.
Фирма "АТМ" составила и непрерывно ведет специальную таблицу со статистическими данными о надежности вычислительной техники разных поставщиков. Эта таблица используется в частном порядке для консультаций, в том числе фирмой "Бри-тойл", которая в результате прекратила закупки одного из графических видеоиндикаторов в силу его низкой отказоустойчивости.
Фирма "Харуэлл компьютер пауэр" разработала комплект машинных программ "Статус IQ" для оперативного поиска и вывода информации из базовых массивов данных. В отличие от существующих средств аналогичного назначения вместо ключевых слов в новых программах поиск производится путем постановки вопросов на обычном английском языке.
Так, в вопросе "Какие стандарты по выхлопным газам распространяются на контроль загрязнения среды, создаваемого автотранспортом на шоссе М6?", выделяются такие отправные понятия, как "стандарты на выхлопные газы", "контроль", "загрязнение среды" и "автотранспорт", с помощью которых в базовом массиве ищется относящаяся к делу информация. Вывод последней осуществляется в порядке наиболее вероятного правдоподобия.
ЗАДАНИЯ ДЛЯ САМОСТОЯТЕЛЬНОЙ РАБОТЫ
1. Составьте логическую схему базы знаний по теме юниты.
2. Перечислите основные виды испытаний для автоматизированных систем:
1)
2)
3)
3. Перечислите общие требования для построения математических моделей:
1)
2)
3)
4)
5)
6)
4. Запишите формулу нормального закона изменения вероятности отказов P(t), или распределение Гаусса (для постепенных отказов).
5. Перечислите способы описания конечных автоматов:
1)
2)
ТРЕНИНГУМЕНИЙ
Пример выполнения упражнения тренинга на умение 1
Задание
Построить и проанализировать диаграмму состояний конечного автомата, заданного следующей таблицей переходов:
| Текущее состояние |
Следующее состояние |
Выход |
| |
Вход |
Вход |
| |
j |
0 |
1 |
f |
0 |
1 |
| So |
|
S2 |
So |
|
1 |
0 |
| Si |
|
Si |
S2 |
|
0 |
1 |
| So |
|
So |
S2 |
|
0 |
1 |
Решение
(пример выполнения задания)
i недостижимо, если автомат начинает работу из состояния s
0 или S2.
Выполните самостоятельно следующие задания:
Задание 1.1
Построить и проанализировать диаграмму состояний конечного автомата, заданного следующей таблицей переходов:
| Текущее состояние |
Следующее состояние |
Выход |
| |
Вход |
Вход |
| |
j |
0 |
1 |
f |
0 |
i |
| So |
|
S2 |
So |
|
0 |
i |
| Si |
|
Si |
So |
|
0 |
i |
| S2 |
|
Si |
Si |
|
0 |
i |
Задание 1.2
Построить и проанализировать диаграмму состояний конечного автомата, заданного следующей таблицей переходов:
| Текущее состояние |
Следующее состояние |
Выход |
| |
Вход |
Вход |
| |
j |
0 |
1 |
f |
0 |
1 |
| So |
|
S2 |
So |
|
0 |
1 |
| S |
|
S3 |
So |
|
1 |
1 |
| S2 |
|
Si |
S3 |
|
0 |
1 |
| S3 |
|
Si |
S2 |
|
1 |
0 |
Задание 1.3
Построить и проанализировать диаграмму состояний конечного автомата, заданного следующей таблицей переходов:
| Текущее состояние |
Следующее состояние |
Выход |
| |
Вход |
Вход |
| |
j |
0 |
1 |
f |
0 |
1 |
| So |
|
Si |
So |
|
0 |
1 |
| Si |
|
S3 |
So |
|
1 |
0 |
| S2 |
|
S4 |
S3 |
|
1 |
0 |
| S3 |
|
Si |
S4 |
|
1 |
1 |
| S4 |
|
So |
S2 |
|
0 |
1 |
Пример выполнения упражнения тренинга на умение 2
Задание
Определить коэффициент экономической эффективности внедряемой АИС при заданных начальных условиях:
С
ти - затраты на теоретические исследования;
С
пр - затраты на разработку программ и программной документации;
С
мч - стоимость одного машинного часа работы ЭВМ, у.е./ч.;
t
Mp - машинное время решения задачи, ч.;
С
зп - заработная плата программиста в единицу времени, у.е./ч.;
t
npoz.p - время программиста, затрачиваемое на решение задачи с помощью ЭВМ, ч;
С
кос - накладные (косвенные) расходы;
С
сс - затраты на социальное страхование;
С? и Ср
н - соответственно затраты на базовое решение задачи базовым и новым способом;
Vs и ?
н - частота решения задачи соответственно базовым и новым способом.
Решение
(пример выполнения задания)
п/п |
Алгоритм |
Конкретное соответствие данной ситуации предложенному алгоритму |
| 1. |
Определение единовременных затрат |
Единовременные затраты на разработку и внедрение новых методов решения задачи включают:
Км = Сти + Спр |
| 2. |
Определение суммы затрат на решение поставленной задачи с помощью новой
АИС |
Стоимость разового решения задачи определяется из следующего соотношения:
Ср = С t + С t + С + С
Смч1мрг Сзп1прог.р ' СкосГ Ссс |
| 3. |
Определение снижения издержек при решении задачи новым способом по сравнению со старым способом |
Экономический эффект определяется по следующей формуле:
Э = Ср?5- СрПн |
| 4. |
Определение коэффициента экономической эффективности |
Критерий оценки экономической эффективности внедрения новых методов решения задач определяется из соотношения:
Кэ =
Км |
Выполните самостоятельно следующие задания:
Задание 2.1
Определить коэффициент экономической эффективности внедряемой АИС при заданных начальных условиях:
С
ти = 2000 у.е.; С
пр = 900 у.е.; С
мч = 2 У-е./ч .; t
Mp = 0,5 ч.;
С
зп = 10 у.е./ч.;
tnpos.p = 0 ,5 ч.;
Скос = 90 у-е.; С
сс = 70 у.е.;
С = 80 у.е.; Срр = 50 у.е.; ?
р = 100;
Пн = 10.
Задание 2.2
Определить коэффициент экономической эффективности внедряемой АИС при заданных начальных условиях:
С
кос = 70 у-е.; С
00 = 60 у.е.; Ср
8 = 25 у.е.; Ср
н = 23 у.е.; v
d = 100;
?н = 150.
С
ти = 3000 у.е.; С
пр = 10000 у.е.;
С
мч = 3 у-е./ч.;
К,р = 0,7 ч.;
С
зп = 11 у.е./ч.;
Ьірог.р = 0,6 ч.;
Имитационное моделирование надежности
Конечный автомат "в чистом виде" - это математическая модель устройства с конечной памятью, преобразующего дискретную информацию. Конечный автомат является одним из важнейших видов управляющих систем.
Содержательно конечный автомат можно охарактеризовать как устройство, имеющее входной и выходной каналы и находящееся в каждый из моментов дискретного времени, называемых тактовыми моментами, в одном из состояний. По входному каналу в каждый тактовый момент в устройство поступают сигналы a - буквы входного алфавита A; в те же моменты по выходному каналу устройство выдает сигналы b - буквы выходного алфавита B, причем b определяется состоянием s из алфавита состояний S и буквой а; внутреннее состояние яСв следующий тактовый момент также определяется состоянием s и буквой а из предыдущего момента. Таким образом, для некоторых функций j и f имеет место:
b = j (a,s), sC= f(a,s).
Эти функции называются соответственно выходной и переходной функциями; они определяют закон "переработки" слов в алфавите A, подаваемых побуквенно на входной канал устройства при условии задания начального состояния устройства.
Полное описание конечного автомата - описание, при котором функции перехода и выхода всюду определены.
Для конечных автоматов предполагается конечность алфавитов A, S, B. Если считать указанную "переработку" слов главной характеристикой устройства, то его можно отождествить с набором (A, S, B, j, f), который и называют конечным автоматом. Для этой формы описания конечного автомата характерно отношение исследователя к устройству как внешнего наблюдателя.
Само задание конечного автомата называется при этом абстрактным конечным автоматом. В случае, когда устройство рассматривается с учетом того, что оно собрано по некоторым композиционным правилам из абстрактных конечных автоматов, приходят к понятию структурного конечного автомата, который в итоге также реализует некоторый абстрактный конечный автомат.
Автомат вообще (от греческого automatoz - самодействующий) - управляющая система, являющаяся конечным автоматом или некоторой его модификацией, полученной путем изменения его компонентов или функционирования. Основное понятие - конечный автомат - возникло в середине XX в. в связи с попытками описать на математическом языке функционирование нервных систем, универсальных вычислительных машин и других реальных автоматов.
Характерной особенностью такого описания является дискретность соответствующих математических моделей и конечность областей значений их параметров, что приводит к понятию конечного автомата.
Наряду с понятием конечного автомата рассматриваются различные его обобщения и модификации, отражающие те или иные особенности реальных устройств. Для конечного автомата (A, S, B, j, f) существующие модификации можно разбить на следующие три основные группы.
К первой группе относятся автоматы, у которых некоторые из алфавитов A (входной), S (состояний) или B (выходной) бесконечны, в связи с чем такие автоматы называются бесконечными. Ко второй группе относятся автоматы, у которых вместо выходной и переходной функций j и f допускаются произвольные отношения или случайные функции. Таковы частичные, недетерминированные, вероятностные и другие автоматы. К третьей группе относятся автоматы со специфическими множествами входных объектов.
Таковы, например, автоматы с переменной структурой. Существуют автоматы, принадлежащие одновременно разным группам. Наряду с этим большую роль играют специальные подклассы конечных автоматов, например, автоматы без памяти. Кроме того, использование понятий и методов из других разделов математики также приводит к появлению специфических классов автоматов и связанных с ними задач.
Например, при применении алгебраических средств возникают понятия автоматов: линейного, группового, свободного и других автоматов; вопросы теории кодирования порождают понятия самонастраивающихся, обратимых автоматов и других.
Пример. Рассмотрим следующий конкретный конечный автомат M = [A, S, B, j, f]. Входной алфавит A = {0, 1}; выходной алфавит B = {0, 1}; три внутренних состояния S = {s
0, s
1, s
2}; функции выхода и перехода задаются предписаниями:
| ф: |
f: |
| (so, 0) a si |
(so, 0) a 0 |
| (so, 1) a so |
(so, 1) a 1 |
| (si, 0) a s2 |
(si, 0) a 1 |
| (si, 1) a si |
(s1, 1) a 0 |
| (s2, 0) a so |
(s2, 0) a 1 |
| (s2, 1) a s2 |
(s2, 1) a 0 |
Подадим на вход последовательность 0, 1, 0, 1. Если автомат находился сначала в состоянии s
0, то, прочитав первый символ 0, он перейдет в состояние s
1 и напечатает 0. Прочитав затем 1, он останется в состоянии s
1 и напечатает 0. Прочитав следующий 0, он перейдет в состояние s
2 и напечатает 1. Наконец, прочитав последний символ 1, автомат закончит
работу в состоянии s
2, имея на выходной ленте последовательность 0, 0, 1, О.Таким образом, автомат преобразовал вход 0, 1,0, 1 (или, короче, 0101) в 0, 0, 1, 0 (или 0010).
Есть два удобных способа описать этот автомат. Прежде всего можно построить диаграмму состояния автомата - описание конечного автомата с помощью помеченного ориентированного графа (рис.
2.3) - орграфа.
Вершины этого орграфа помечены символами, обозначающими внутренние состояния. Каждая дуга помечена парой символов a, b, где a - входной символ, вызывающий переход в следующее состояние, отвечающее этому ребру, а b - выходной символ, который автомат выпечатывает. таблица состояний и табличное представление функций j и f (табл. 1):
| Таблица 1 |
| Текущее состояние |
Следующее состояние |
Выход |
| |
Вход |
Вход |
| |
j |
0 |
1 |
f |
0 |
1 |
| So |
|
Si |
So |
|
0 |
1 |
| S |
|
S2 |
Si |
|
1 |
0 |
| S |
|
So |
S2 |
|
1 |
0 |
|
Оба способа имеют свои преимущества и недостатки. Таблица обычно удобнее при вычислениях, диаграмма нагляднее. Например, по диаграмме легче обнаружить состояния, недостижимые из других состояний. На следующем рис. 2.4 показана диаграмма состояний автомата, у которого состояние s, недостижимо, если автомат начинает работу из состояния s
0 или s
2: 0,0 1,1
это раздел теории управляющих систем, изучающий математические модели преобразователей дискретной информации, называемых автоматами. С определенной точки зрения такими преобразователями являются как реальные устройства (вычислительные машины, автоматы, живые организмы и т.д.), так и абстрактные системы (например, формальная система, аксиоматические теории и т.д.). Наиболее тесно теория автоматов связана с теорией алгоритмов.
Большинство задач теории автоматов - общие для основных видов управляющих систем. К ним относятся задачи анализа и синтеза автоматов, задачи полноты, минимизации, эквивалентных преобразований автоматов и другие. Задача анализа состоит в том, чтобы по заданному автомату описать его поведение или по неполным данным об автомате и его функционированию установить те или иные его свойства. Задача синтеза автоматов состоит в построении автомата с наперед заданным поведением или функционированием. Задача полноты состоит в выяснении, обладает ли подмножество МФавтоматов свойством полноты, т.е. совпадает ли с М множество всех автоматов, которые получаются путем конечного числа применений некоторых операций к автоматам из заданного подмножества автоматов МФ Задача эквивалентных преобразований в общем виде состоит в том, чтобы найти систему правил преобразований (так называемую полную систему правил) автоматов, которые удовлетворяют опреде-
ленным условиям и позволяют преобразовать произвольный автомат в любой эквивалентный ему автомат (два автомата эквивалентны, если они имеют одинаковое поведение автомата. Поведение автомата - математическое понятие, описывающее взаимодействие автомата с внешней средой. Примером внешней среды конечного автомата является множество входных слов, а поведением - словарная функция, реализуемая автоматом, или событие, представимое автоматом).
Помимо перечисленных, в теории автоматов имеются специфические проблемы, характерные для автоматов. Так, в зависимости от условий задачи поведение автомата удобно задавать на разных языках, в связи с чем важными являются выбор достаточно удобного адекватного языка и перевод с одного языка на другой. В тесной связи с задачами синтеза и эквивалентных преобразований находится задача минимизации числа состояний автомата, а также получение соответствующих оценок. Близкий круг вопросов возникает в связи с моделированием поведения автоматов одного класса с автоматами другого класса. Здесь также представляют интерес вопросы минимизации моделирующих автоматов и оценки их сложности. Специальный раздел теории автоматов связан с так называемыми экспериментами с автоматами (т.е. способами получения информации о внутренней структуре автоматов по их поведению). Основная задача здесь состоит в том, чтобы получить определенные сведения о строении автомата путем наблюдения за его реакцией на те или иные внешние воздействия. При этом возникает большой круг задач, связанный с классификацией экспериментов и с вопросами разрешимости задач определенными видами экспериментов, а также с оценками длин минимальных экспериментов, достаточных для решения тех или иных задач. Понятие эксперимента с автоматами используется также в задачах надежности управляющих систем и их контроля, в частности автоматов.
Модель надежности на основе конечных автоматов - модель работоспособных состояний объекта, основанная на описании и (или) диаграмме состояния конечного автомата. Многие из перечисленных выше задач могут рассматриваться как алгоритмические проблемы. Для конечных автоматов большинство из них имеют положительное решение.
Имитационное моделирование надежности
На протяжении XX в. в СССР и России при разработке проблем теоретико-интерпретационного плана формировалось все более ясное и четкое понимание роли и значения имитационного моделирования - как при оценке эффективности существующих и предлагаемых новых методов решения задач, возникающих в рамках интерпретационного процесса, так и при оценке
надежности и точности решений задач, получаемых на практике по конкретным данным; вместе с тем следует признать, что имитационное моделирование все еще используется в недостаточном объеме. Этот вывод легко получить из анализа специальной литературы; он имеет важное ориентирующее значение.
Имитационная модель надежности - модель, отображающая состояния и функционирование объекта, в которой переменные, принятые в качестве характеристик исследуемого объекта, характеризуют свойства, составляющие надежность объекта.
В тех случаях, когда решаемые задачи допускают строгую математическую формулировку, задачи имитационного моделирования всегда оказываются некорректно поставленными, т.е. фактически требующими использования не только строгих математических методов, но также и использования дополнительных процедур эвристического характера (типа процедур распознавания образов).
Построение интерпретационных моделей всегда осуществляется по двум линиям:
а) сбора имеющихся данных, относящихся ко всем элементам интерпретационной модели, прежде всего о строении изучаемого объекта, а также к характеристикам, определяющим его работоспособность, и связанных с ними априорных ограничений;
б) проведения специальных расчетов (решения вспомогательных задач), позволяющих внутренними средствами уточнить модельные представления об объекте, характеристиках и связях между характеристиками и объектом.
Как правило, на этапе построения интерпретационных моделей основное значение имеют задачи нахождения (явных) аппроксимаций изучаемых свойств и специальные обработки построенных аппроксимаций (чаще всего, хотя и не обязательно, линейных). Что касается этапа собственно нахождения интерпретаций в рамках принятых интерпретационных моделей, то здесь основное значение имеют процедуры аппроксимационной оптимизации (параметров изучаемого объекта по экспериментальным данным о характеристиках); при этом с очевидностью должны использоваться регулярные (регуляризующие) алгоритмы.
После нахождения интерпретации по необходимости используются процедуры - обычно эвристические, типа распознавания образов, а также (но далеко не всегда!) имитационное моделирование в целях нахождения оценок точности и надежности построенной интерпретации.
НАДЕЖНОСТЬ АВТОМАТИЗИРОВАННЫХ ИНФОРМАЦИОННЫХ СИСТЕМ
Комплексные показатели надежности АИС.
Надежность компонентов АИС и технических средств
Комплексные показатели надежности АИС - показатели, которые обеспечивают достижение основных целей функционирования АИС, определенных в нормативно-технической и (или) проектной документации. Комплексные показатели надежности АИС разрабатываются на этапе формирования технического задания.
Коэффициент готовности АИС - вероятность того, что АИС и все ее компоненты окажутся в работоспособном состоянии в произвольный момент времени, кроме планируемых периодов, в течение которых применение АИС или отдельных компонентов по назначению не предусматривается.
Повышение готовности АИС предполагает подавление в определенных пределах влияния отказов и сбоев на работу системы с помощью средств контроля и коррекции ошибок, а также средств автоматического восстановления вычислительного процесса после проявления неисправности, включая аппаратурную и программную избыточность, на основе которой реализуются различные варианты отказоустойчивых архитектур. Повышение готовности - есть способ борьбы за снижение времени простоя системы.
Единицей измерения здесь является коэффициент готовности, который определяет вероятность пребывания системы в работоспособном состоянии в любой произвольный момент времени. Статистически коэффициент готовности определяется как MTBF/(MTBF+MTTR), где MTTR (Mean Time To Repair) - среднее время восстановления (ремонта), т.е. среднее время между моментом обнаружения неисправности и моментом возврата системы к полноценному функционированию.
В последние годы в литературе по вычислительной технике все чаще употребляются термины "системы высокой готовности", "системы высокой степени готовности", "системы с высоким коэффициентом готовности". Все эти термины по существу являются синонимами, однако как и многие термины в области вычислительной техники, термин "высокая готовность" понимается по-разному отдельными поставщиками и потребителями вычислительных систем. Совершенно аналогично некоторые слова, связанные с термином "высокая готовность", такие, например, как "кластеризация", также употребляются в различных значениях.
Важно иметь стандартный набор определений для того, чтобы предложения различных поставщиков можно было сравнивать между собой на основе одинаковых терминов.
Ниже приведены общепринятые в настоящее время определения, которые мы будем использовать для различных типов систем, свойством которых является та или иная форма снижения планового и непланового времени простоя:
- Высокая готовность (High Availability). Настоящие конструкции с высоким коэффициентом готовности для минимизации планового и непланового времени простоя используют обычную компьютерную технологию. При этом конфигурация системы обеспечивает ее быстрое восстановление после обнаружения неисправности, для чего в ряде мест используются избыточные аппаратные и программные средства.
Длительность задержки, в течение которой программа, отдельный компонент или система простаивает, может находиться в диапазоне от нескольких секунд до нескольких часов, но более часто в диапазоне от 2 до 20 мин. Обычно системы высокой готовности хорошо масштабируются, предлагая пользователям большую гибкость, чем другие типы избыточности.
- Эластичность к отказам (Fault Resiliency). Ряд поставщиков компьютерного оборудования делит весь диапазон систем высокой готовности на две части, при этом в верхней его части оказываются системы эластичные к отказам.
Ключевым моментом в определении эластичности к отказам является более короткое время восстановления, которое позволяет системе быстро откатиться назад после обнаружения неисправности.
- Устойчивость к отказам (Fault Tolerance). Отказоустойчивые системы имеют в своем составе избыточную аппаратуру для всех функциональных блоков, включая процессоры, источники питания, подсистемы ввода/вывода и подсистемы дисковой памяти. Если соответствующий функциональный блок неправильно функционирует, всегда имеется горячий резерв.
В наиболее продвинутых отказоустойчивых системах избыточные аппаратные средства можно использовать для распараллеливания обычных работ. Время восстановления после обнаружения неисправности для переключения отказавших компонентов на избыточные для таких систем обычно меньше одной секунды.
- Непрерывная готовность (Continuous Availability). Вершиной линии отказоустойчивых систем являются системы, обеспечивающие непрерывную готовность.
Продукт с непрерывной готовностью, если он работает корректно, устраняет любое время простоя (как плановое, так и неплановое). Разработка такой системы охватывает как аппаратные средства, так и программное обеспечение и позволяет проводить модернизацию (upgrade) и обслуживание в режиме on-line.
Дополнительным требованием к таким системам является отсутствие деградации в случае отказа. Время восстановления после отказа не превышает одной секунды.
- Устойчивость к стихийным бедствиям (Disaster Tolerance). Широ-
кий ряд продуктов и услуг связан с обеспечением устойчивости к стихийным бедствиям. Иногда устойчивость к стихийным бедствиям рассматривается в контексте систем высокой готовности.
Смысл этого термина в действительности означает возможность рестарта или продолжения операций на другой площадке, если основное месторасположение системы оказывается в нерабочем состоянии из-за наводнения, пожара или землетрясения. В простейшем случае продукты, устойчивые к стихийным бедствиям, могут просто представлять собой резервные компьютеры, расположенные вне основного местоположения системы, сконфигурированные по спецификациям пользователя и доступные для использования в случае стихийного бедствия на основной площадке.
В более сложных случаях устойчивость к стихийным бедствиям может означать полное (зеркальное) дублирование системы вне основного местоположения, позволяющее принять на себя работу немедленно после отказа системы на основной площадке.
Все упомянутые типы систем высокой готовности имеют общую цель - минимизацию времени простоя. Имеются два типа времени простоя компьютера: плановое и неплановое. Минимизация каждого из них требует различной стратегии и технологии.
Плановое время простоя обычно включает время, принятое руководством, для проведения работ по модернизации системы и для ее обслуживания. Неплановое время простоя является результатом отказа системы или компонента.
Хотя системы высокой готовности возможно больше ассоциируются с минимизацией неплановых простоев, они оказываются также полезными для уменьшения планового времени простоя.
Современные АИС строятся или, скорее, будут строиться из компонентов. (Компонент - самостоятельный программный или аппаратный продукт, поддерживающий объектную парадигму, реализующий отдельную область логики и умеющий взаимодействовать с другими компонентами с помощью открытых интерфейсов.) Такая технология позволит ответить на самые острые проблемы компьютерного мира - сокращение времени разработки автоматизированной системы, облегчение процесса внедрения и поддержка гибкости внедренного решения. На рис.
3.1 изображены этапы жизненного цикла АИС.
требования к надежности автоматизированных систем, описываемые в техническом задании на систему, включают в себя:
1) состав и количественные значения показателей надежности для системы в целом или ее подсистем;
2) перечень аварийных ситуаций, по которым должны быть регламентированы требования к надежности, и значения соответствующих показателей;
3) требования к надежности технических средств и программного обеспечения;
4) требования к методам оценки показателей надежности и их контролю на разных стадиях создания системы в соответствии с действующими нормативно-техническими документами.
Перечисленные требования позволяют обеспечить необходимый (заложенный при проектировании) для АИС в целом уровень надежности.
Методы надежности программного обеспечения
Надежность сложных программных средств определяется теми же факторами, что и надежность любых технических объектов, однако доминирующими являются дефекты и ошибки проектирования, так как физическое хранение программ на магнитных носителях характеризуется очень высокой надежностью. Программа любой сложности и назначения при строго фиксированных исходных данных и абсолютно надежной аппаратуре исполняется по однозначно определенному маршруту и дает на выходе строго определенный результат. Однако случайное изменение исходных данных и накопленной при обработке информации, а также множество условных переходов в программе создают огромное число различных маршрутов исполнения каждого сложного ПС. Источниками ненадежности являются непроверенные сочетания исходных данных, при которых функционирующее ПС дает неверные результаты или отказы. В результате комплекс программ не соответствует требованиям функциональной пригодности и работоспособности.
При применении понятий надежности к программным средствам следует учитывать особенности и отличия этих объектов от традиционных технических систем, для которых первоначально разрабатывалась теория на-
дежности:
- не для всех видов программ применимы понятия и методы теории надежности - их можно использовать только к программным средствам, функционирующим в реальном времени и непосредственно взаимодействующим с внешней средой;
- при разработке и оценке качества программных компонентов к ним не применимы понятия надежности функционирования, если при обработке информации они не используют значения реального времени и не взаимодействуют непосредственно с внешней средой;
- доминирующими факторами, определяющими надежность программ, является количество дефектов и ошибок проектирования и разработки; второстепенное значение имеет физическое разрушение программных компонентов при внешних воздействиях;
- относительно редкое разрушение программных компонентов и необходимость их физической замены приводят к принципиальному изменению понятий сбоя и отказа программ и к разделению их по длительности восстановления относительно некоторого допустимого времени простоя для функционирования информационной системы;
- для повышения надежности комплексов программ особое значение имеют методы автоматического сокращения длительности восстановления и преобразования отказов в кратковременные сбои путем введения в программные средства временной, программной и информационной избыточности;
- непредсказуемость места, времени и вероятности проявления дефектов и ошибок, а также их редкое обнаружение при реальной эксплуатации достаточно надежных программных средств не позволяют эффективно использовать традиционные методы априорного расчета показателей надежности сложных систем, ориентированные на стабильные, измеряемые значения надежности составляющих компонентов;
- традиционные методы форсированных испытаний надежности систем путем физического воздействия на их компоненты не применимы для программных средств и их следует заменять на методы форсированного воздействия информационных потоков внешней среды.
С учетом перечисленных особенностей применение основных понятий теории надежности сложных систем к жизненному циклу и оценке качества комплексов программ позволяет адаптировать и развивать эту теорию в особом направлении - надежности программных средств. Предметом изучения теории надежности комплексов программ (Software Reliability) является работоспособность сложных программ обработки информации в реальном времени. К задачам теории и анализа надежности сложных программных средств можно отнести следующие:
- формулирование основных понятий, используемых при исследовании и применении показателей надежности программных средств;
- выявление и исследование основных факторов, определяющих характеристики надежности сложных программных комплексов;
- выбор и обоснование критериев надежности для комплексов программ различного типа и назначения;
Экспертиза и прогнозирование отказов
2) сложность процедур диалога, возможность работы персонала без специальной подготовки;
3) реакция системы и ее частей на ошибки оператора, средства сервиса.
Проверка средств восстановления работоспособности АС после отказов ЭВМ должна включать:
1) проверку наличия в эксплуатационной документации рекомендаций по восстановлению работоспособности и полноту их описания;
2) практическую выполнимость рекомендованных процедур;
3) работоспособность средств автоматического восстановления функций (при их наличии).
Проверку комплектности и качества эксплуатационной документации следует проводить путем анализа документации на соответствие требованиям нормативно-технических документов ТЗ. Результаты испытаний объектов, предусмотренных программой, фиксируют в протоколах, содержащих следующие разделы:
1) назначение испытаний и номер раздела требований ТЗ на АС, по которому проводят испытание;
2) состав технических и программных средств, используемых при испытаниях;
3) указание методик, в соответствии с которыми проводились испытания, обработка и оценка результатов;
4) условия проведения испытаний и характеристики исходных данных;
5) средства хранения и условия доступа к конечной, тестирующей программе;
6) обобщенные результаты испытаний;
7) выводы о результатах испытаний и соответствии созданной системы или ее частей определенному разделу требований ТЗ на АС.
Протоколы испытаний объектов по всей программе обобщают в едином протоколе, на основании которого делают заключение о соответствии системы требованиям ТЗ на АС и возможности оформления акта приемки АС в постоянную эксплуатацию.
Работу завершают оформлением акта о приемке АС в постоянную эксплуатацию.
Экспертиза и прогнозирование отказов.
Эксплуатационный контроль надежности систем
Расширение функций контроля и управления в автоматизированных информационных системах способствует сбережению всех видов ресурсов и уменьшению расхода электроэнергии. Прогнозирование отказов АИС на ранних стадиях их возникновения обеспечивает долговечность, высокую степень надежности работы основного оборудования. За счет развития диспетчерской системы экспертизы аварий сокращается как число аварий, на устранение которых тратятся значительные денежные средства, так и время отключения электрооборудования.
АИС способствует повышению контроля за действием оператора и предотвращению несанкционированного вмешательства в работу оборудования. Немаловажное значение для повышения эффективности работы системы имеет также оперативное формирование и представление отчетной документации.
Повышение эффективности работы системы требует соблюдения ряда принципов при ее построении. Наиболее важными из них являются максимальное удовлетворение запросов заказчика и обеспечение централизованного контроля и управления в одной интегрированной иерархической системе.
Важным направлением развития систем компьютерной поддержки безопасности является построение компьютерных тренажерных комплексов для обучения операторов АИС действиям в предаварийных и аварийных ситуациях. Ключевой вопрос при разработке таких тренажерных систем состоит в обеспечении полноты описания возможных нештатных ситуаций с целью гарантировать готовность обученных на тренажере операторов к действиям в условиях реально возникающих разнообразных нарушений хода работы системы.
В такой постановке именно полнота учета возможных нарушений может рассматриваться в качестве критерия при определении детальности и требуемой точности моделирования на стадии проектирования тренажеров.
В проблематике исследования потенциальной опасности при работе АИС и надежности оператора существует целый ряд методов, позволяющих решить задачу обеспечения полноты возможных нарушений. В их числе, наряду с наиболее простыми способами определения множества потенциально опасных ситуаций на основе анализа регламентной документации по процессу или с привлечением прогнозирования по методике "Что произойдет, если?", необходимо указать методы анализа деревьев возможных событий, отказов или ошибок операторов с оцениванием вероятности их наступления, например THERP (Technique for Human Error Rate Prediction). На сегодня разработчикам доступно множество компьютерных продуктов,
реализующих указанные методики. Однако в рамках компьютерного тренинга наиболее подходящими представляются методы экспертизы опасностей, предусматривающие описание процесса с помощью специального языка в форме так называемых карт технологического процесса, систематическая проверка состояния каждой его части на предмет выявления возможности и характера отклонения от проектного режима работы и оценивания возможной опасности.
Следует отметить, что при любом способе построения формального множества нештатных ситуаций, оно подвергается затем экспертной оценке специалистов конкретного этапа работы, опытных операторов. Такая оценка позволяет отобрать действительно вероятные события и уточнить количественную меру их нежелательных последствий.
Очевидно при этом, что даже самые подробные и хорошо структурированные перечни нештатных ситуаций не исчерпывают проблему полноты тренинга, поскольку естественные изменения в самих АИС и средствах предаварийной защиты потребуют корректировки существующих тренировочных упражнений и составления новых. Важно в этой связи, чтобы тренажерные системы были снабжены эффективными инструментами расширения библиотеки возможных неисправностей и отказов, что формулируется в требовании пополняемости тренажеров новыми нештатными ситуациями.
Реализация описанного подхода в рамках объектно-ориентированного моделирования АИС сводится к следующему. В библиотеках потоков, аппаратов и математических объектов, обычно выделяемых в структуре классов при объектно-ориентированном моделировании, полученные на стадии предварительного анализа опасностей возможные нарушения в ходе работы учитываются в виде свойств элементов библиотек.
При этом указанные библиотеки, построенные с учетом возможного наследования свойств объектов, могут легко расширяться и модифицироваться при возникновении новых нештатных ситуаций или процедур их корректировки. Упомянутые элементы библиотек снабжаются также программными интерфейсами, позволяющими управлять свойствами объектов извне, что важно при имитации развития сложных нештатных ситуаций с помощью вмешательств инструктора обучения в форме однократных воздействий или развернутых во времени сценариев нарушений.
Объединение различных систем и подсистем в АИС, функционирующую как единое целое, а также стабилизация технологических и эксплуатационных характеристик производятся автоматизированной системой управления и контроля (АСУиК), предназначенной для:
- скрупулезного исполнения регламента работы;
- поддержания стабильных выходных параметров при нестабильных
входных параметрах и при нестабильных эксплуатационных условиях;
- выдачи в автоматическом режиме рекомендаций обслуживающему персоналу по оперативному управлению процессом выполнения задачи;
- автоматического предотвращения нештатных и выхода из аварийных ситуаций;
- контроля и регистрации параметров работы системы;
- визуализации для оператора текущего состояния выполнения задачи.
АСУиК осуществляет целенаправленные воздействия на физические и логические процессы, протекающие в составных частях автоматизированной информационной системы, а также реализует сбор, хранение и обработку информации, отражающей существо процессов управления. АСУиК играет основополагающую роль для достижения желательных показателей качества АИС.
Поэтому выбор структуры АСУиК во многом определяет эффективность АИС.
АСУиК, как правило, строится по блочно-иерархическому принципу. Каждый блок является самодостаточным по выполняемой функции и может находиться в одном из уровней иерархии по отношению к аппаратуре абонентов АИС и в одном из уровней иерархии по отношению к решаемой функциональной задаче.
Иерархия АСУиК повторяет иерархию физических, логических и эксплуатационных процессов комплекса (объект управления).
АСУиК может быть реализована в виде программируемой цифровой системы с тремя уровнями иерархии.
Первый уровень иерархии составляют приборы контроля и исполнения физических воздействий, замкнутые через контроллер (микропроцессор). Здесь реализуется функционирование АИС в автоматическом режиме по алгоритмам, определяемым технологическим регламентом и инструкцией по эксплуатации.
Второй уровень иерархии используется лишь для комплексов большой производительности и базируется на пульте управления и контроля, где производится автоматизированное управление при непосредственном контакте с оборудованием АИС (используется для ремонтных и пусконаладочных работ).
Третий уровень иерархии представляет собой автоматизированное рабочее место (АРМ) оператора, строится для комплексов большой производительности на базе персонального компьютера (в частных случаях может быть реализован на базе пульта управления с органами мнемоники и ручного управления) и снабжается по мере необходимости устройствами регистрации, отображения и документирования.
Такая структура АСУиК позволяет воспользоваться стандартными приборными и программными решениями, что удешевляет стоимость АСУиК и сокращает сроки проектирования. В то же время иерархичность АСУиК делает ее гибкой системой, позволяющей в процессе эксплуатации менять как ее структуру, так приборный и программный состав.
Работа диспетчера комплексов большой производительности максимально облегчена за счет применения программных средств анализа, использования графического представления текущих ситуаций, а также показа в удобном для диспетчера виде путей выхода из нештатных ситуаций. Система позволяет диспетчеру вмешиваться в ход автоматического выполнения регламента выполняемой задачи, создавать по командам диспетчера новые связи между отдельными аппаратными узлами, работать в ручном режиме.
Использование при построении комплексов средств автоматизации значительно упрощает процесс эксплуатации автоматизированных информационных систем, повышает их "живучесть" за счет автоматического предотвращения нештатных ситуаций, продлевает срок безремонтной работы оборудования вследствие скрупулезного исполнения технологического регламента. Все это ведет, в конечном счете, к существенному снижению эксплуатационных расходов.
Роль ЭВМ в обеспечении надежности систем
Современный рынок "персональных рабочих станций" не просто определить. По сути он представляет собой совокупность архитектурных платформ персональных компьютеров и рабочих станций, которые появились в настоящее время, поскольку поставщики компьютерного оборудования уделяют все большее внимание рынку продуктов для коммерции и бизнеса. Этот рынок традиционно считался вотчиной миникомпьютеров и мэйнфреймов, которые поддерживали работу настольных терминалов с ограниченным интеллектом. В прошлом персональные компьютеры не были достаточно мощными и не располагали достаточными функциональными возможностями, чтобы служить адекватной заменой подключенных к главной машине терминалов.
Хотя рабочие станции на платформе Unix были очень сильны в научном, техническом и инженерном секторах, но были почти также неудобны, как и ПК, для того чтобы выполнять серьезные офисные приложения. С тех пор ситуация изменилась коренным образом.
Персональные компьютеры в настоящее время имеют достаточную производительность, а рабочие станции на базе Unix имеют программное обеспечение, способное выполнять большинство функций, которые стали ассоциироваться с понятием "персональной рабочей станции". Вероятно оба этих
направления могут серьезно рассматриваться в качестве сетевого ресурса для систем масштаба предприятия. В результате этих изменений практически ушли со сцены старомодные миникомпьютеры с их патентованной архитектурой и использованием присоединяемых к главной машине терминалов.
По мере продолжения процесса разукрупнения (downsizing) и увеличения производительности платформы Intel наиболее мощные ПК (но все же чаще открытые системы на базе Unix) стали использоваться в качестве серверов, постепенно заменяя миникомпьютеры.
Среди других факторов, способствующих этому процессу, следует выделить:
- разнообразие в применении ПК. Помимо обычных для этого класса систем текстовых процессоров, даже средний пользователь ПК может теперь работать сразу с несколькими прикладными пакетами, включая электронные таблицы, базы данных и высококачественную графику;
- адаптацию графических пользовательских интерфейсов, которая существенно увеличила требования пользователей ПК к соотношению производительность/стоимость. И хотя оболочка MS Windows может работать на моделях ПК 386SX с 2 Мбайтами оперативной памяти, реальные пользователи хотели бы получить все преимущества подобных систем, включая возможность комбинирования и эффективного использования различных пакетов;
- широкое распространение систем мультимедиа, прямо зависящее от возможности использования высокопроизводительных ПК и рабочих станций с адекватными аудио- и графическими средствами и объемами оперативной и внешней памяти;
- слишком высокую стоимость мэйнфреймов и даже систем среднего класса, позволяющую сместить многие разработки в область распределенных систем и систем клиент-сервер, которые многим представляются вполне оправданной по экономическим соображениям альтернативой. Эти системы прямо базируются на высоконадежных и мощных рабочих станциях и серверах.
X-терминалы представляют собой комбинацию бездисковых рабочих станций и стандартных ASCII-терминалов. Бездисковые рабочие станции часто применялись в качестве дорогих дисплеев и в этом случае не полностью использовали локальную вычислительную мощь.
Одновременно многие пользователи ASCII-терминалов хотели улучшить их характеристики, чтобы получить возможность работы в многооконной системе, и графические возможности. Совсем недавно, как только стали доступными очень мощные графические рабочие станции, появилась тенденция применения "подчиненных" X-терминалов, которые используют рабочую станцию в ка-
честве локального сервера.
На компьютерном рынке X-терминалы занимают промежуточное положение между персональными компьютерами и рабочими станциями. Поставщики X-терминалов заявляют, что их изделия более эффективны в стоимостном выражении, чем рабочие станции высокого ценового класса, и предлагают повышенный уровень производительности по сравнению с персональными компьютерами.
Быстрое снижение цен, прогнозируемое иногда в секторе X-терминалов, в настоящее время идет очевидно благодаря обострившейся конкуренции в этом секторе рынка.
Прикладные многопользовательские коммерческие и бизнес-системы, включающие системы управления базами данных и обработки транзакций, крупные издательские системы, сетевые приложения и системы обслуживания коммуникаций, разработку программного обеспечения и обработку изображений, все более настойчиво требуют перехода к модели вычислений "клиент-сервер" и распределенной обработке. В распределенной модели "клиент-сервер" часть работы выполняет сервер, а часть пользовательский компьютер (в общем случае клиентская и пользовательская части могут работать и на одном компьютере). Существует несколько типов серверов, ориентированных на разные применения: файл-сервер, сервер базы данных, принт-сервер, вычислительный сервер, сервер приложений.
Таким образом, тип сервера определяется видом ресурса, которым он владеет (файловая система, база данных, принтеры, процессоры или прикладные пакеты программ).
Однако существует классификация серверов, определяющаяся масштабом сети, в которой они используются: сервер рабочей группы, сервер отдела или сервер масштаба предприятия (корпоративный сервер). Эта классификация весьма условна.
Например, размер группы может меняться в диапазоне от нескольких человек до нескольких сотен человек, а сервер отдела обслуживать от 20 до 150 пользователей. Очевидно, в зависимости от числа пользователей и характера решаемых ими задач требования к составу оборудования и программного обеспечения сервера, к его надежности и производительности сильно варьируются.
Файловые серверы небольших рабочих групп (не более 20-30 человек) проще всего реализуются на платформе персональных компьютеров и программном обеспечении Novell NetWare. Файл-сервер в данном случае выполняет роль центрального хранилища данных.
Серверы прикладных систем и высокопроизводительные машины для среды "клиент-сервер" значительно отличаются требованиями к аппаратным и программным средствам.
При наличии одного сегмента сети и 10-20 рабочих станций пиковая пропускная способность сервера ограничивается максимальной пропускной способностью сети. В этом случае замена процессоров или дисковых
подсистем более мощными не увеличивает производительность, так как узким местом является сама сеть. Поэтому важно использовать хорошую плату сетевого интерфейса.
Для файл-серверов общего доступа, с которыми одновременно могут работать несколько десятков, а то и сотен человек, простой однопроцессорной платформы и программного обеспечения Novell может оказаться недостаточно. В этом случае используются мощные многопроцессорные серверы с возможностями наращивания оперативной памяти до нескольких гигабайт, дискового пространства до сотен гигабайт, оснащенные быстрыми интерфейсами дискового обмена (типа Fast SCSI-2, FastWide SCSI-2 и Fiber Channel) и несколькими сетевыми интерфейсами. Эти серверы используют операционную систему Unix, сетевой протокол TCP/IP.
На базе многопроцессорных Unix-серверов обычно строятся также серверы баз данных крупных информационных систем, так как на них ложится основная нагрузка по обработке информационных запросов. Подобного рода серверы получили название суперсерверов.
Как правило, суперсерверы работают под управлением операционных систем Unix, а также и Windows NT, которые обеспечивают многопотоковую многопроцессорную и многозадачную обработку. Суперсерверы должны иметь достаточные возможности наращивания дискового пространства и вычислительной мощности, средства обеспечения надежности хранения данных и защиты от несанкционированного доступа.
Кроме того, в условиях быстро растущей организации важной является возможность наращивания и расширения уже существующей системы.
Мэйнфрейм - это синоним понятия "большая универсальная ЭВМ". Мэйнфреймы и до сегодняшнего дня остаются наиболее мощными (не считая суперкомпьютеров) вычислительными системами общего назначения, обеспечивающими непрерывный круглосуточный режим эксплуатации. Они могут включать один или несколько процессоров, каждый из которых, в свою очередь, может оснащаться векторными сопроцессорами (ускорителями операций с суперкомпьютерной производительностью). В нашем сознании мэйнфреймы все еще ассоциируются с большими по габаритам машинами, требующими специально оборудованных помещений с системами водяного охлаждения и кондиционирования.
Однако это не совсем так. Прогресс в области элементно-конструкторской базы позволил существенно сократить габариты основных устройств.
Наряду со сверхмощными мэйнфреймами, требующими организации двухконтурной водяной системы охлаждения, имеются менее мощные модели, для охлаждения которых достаточно принудительной воздушной вентиляции, и модели, построенные по блочно-модульному принципу и не требующие специальных помещений и кондиционеров.
Основными поставщиками мэйнфреймов являются известные компьютерные компании IBM, Amdahl, ICL, Siemens Nixdorf и некоторые другие, но ведущая роль принадлежит, безусловно, компании IBM. Именно архитектура системы IBM/360, выпущенной в 1964 г., и ее последующие поколения стали образцом для подражания.
В нашей стране в течение многих лет выпускались машины ряда ЕС ЭВМ, являвшиеся отечественным аналогом этой системы.
В архитектурном плане мэйнфреймы представляют собой многопроцессорные системы, содержащие один или несколько центральных и периферийных процессоров с общей памятью, связанных между собой высокоскоростными магистралями передачи данных. При этом основная вычислительная нагрузка ложится на центральные процессоры, а периферийные процессоры (в терминологии IBM - селекторные, блок-мультиплексные, мультиплексные каналы и процессоры телеобработки) обеспечивают работу с широкой номенклатурой периферийных устройств.
Первоначально мэйнфреймы ориентировались на централизованную модель вычислений, работали под управлением патентованных операционных систем и имели ограниченные возможности для объединения в единую систему оборудования различных фирм-поставщиков. Однако повышенный интерес потребителей к открытым системам, построенным на базе международных стандартов и позволяющим достаточно эффективно использовать все преимущества такого подхода, заставил поставщиков мэйнфреймов существенно расширить возможности своих операционных систем в направлении совместимости.
В настоящее время они демонстрируют свою "открытость", обеспечивая соответствие со спецификациями POSIX 1003.3, возможность использования протоколов межсоединений OSI и TCP/IP или предоставляя возможность работы на своих компьютерах под управлением операционной системы Unix собственной разработки.
Стремительный рост производительности персональных компьютеров, рабочих станций и серверов создал тенденцию перехода с мэйнфреймов на компьютеры менее дорогих классов: миникомпьютеры и многопроцессорные серверы. Эта тенденция получила название "разукрупнение". Однако этот процесс в самое последнее время несколько замедлился.
Основной причиной возрождения интереса к мэйнфреймам эксперты считают сложность перехода к распределенной архитектуре клиент-сервер, которая оказалась выше, чем предполагалось. Кроме того, многие пользователи считают, что распределенная среда не обладает достаточной надежностью для наиболее ответственных приложений, которой обладают мэйнфреймы.
Очевидно, выбор центральной машины (сервера) для построения информационной системы предприятия возможен только после глубокого ана-
лиза проблем, условий и требований конкретного заказчика и долгосрочного прогнозирования развития этой системы.
Главным недостатком мэйнфреймов в настоящее время остается относительно низкое соотношение производительность/стоимость. Однако фирмами-поставщиками мэйнфреймов предпринимаются значительные усилия по улучшению этого показателя.
Следует также помнить, что в мире существует огромная инсталлированная база мэйнфреймов, на которой работают десятки тысяч прикладных программных систем. Отказаться от годами наработанного программного обеспечения просто не разумно. Поэтому ожидаемая продажа мэйнфреймов будет увеличиваться по крайней мере еще очень долго.
Эти системы, с одной стороны, позволят модернизировать существующие, обеспечив сокращение эксплуатационных расходов, с другой стороны, создадут новую базу для наиболее ответственных приложений.
МАТЕМАТИЧЕСКИЕ МЕТОДЫ ТЕОРИИ НАДЕЖНОСТИ
Основы математической статистики
Математическая статистика - наука об обработке результатов измерений случайных величин. Иногда математическую статистику рассматривают как науку о статистических решениях, дающую рекомендации выбора оптимальных способов управления в случайных ситуациях.
Предметом математической статистики является изучение случайных величин по результатам наблюдений. Для получения опытных данных необходимо провести обследование соответствующих объектов.
Так как число объектов может быть очень велико, то приходится из всей совокупности объектов для обследования отбирать только часть, т.е. проводить выборочное обследование. В некоторых случаях обследование объектов всей совокупности практически не имеет смысла, поскольку они разрушаются в результате обследования.
Совокупность всех мыслимых результатов наблюдений за АИС, проводимых в неизменных условиях, называется генеральной совокупностью. Часть отобранных результатов наблюдений из генеральной совокупности называется выборочной совокупностью, или выборкой. Как уже говорилось, о свойствах генеральной совокупности можно судить по данным наблюдений над отобранными объектами, т.е. по выборке.
Однако не всякая выборка может быть действительным представлением о генеральной совокупности.
Комплексная эффективность от использования АИС
Здесь сразу же возникают проблемы, которые делают DES уязвимым.
Учитывая это, правительство США использует и новый стандарт, называемый Commercial COMSEC Endorsement Program (ССЕР). Он призван заменить DES. Опубликовало ССЕР Агентство национальной безопасности США (National Security Agency, NSA). После соответствующей проверки на благонадежность оно позволяет производителям присоединиться к программе ССЕР.
Этим производителям дано право встраивать секретные алгоритмы в коммуникационные системы. NSA предполагает, что производители сами должны обеспечивать ключами конечных пользователей таких систем.
Опасные компьютерные вирусы достаточно редки, но все же встречаются. Поэтому при разработке системы защиты сети необходимо принимать во внимание и вирусы. К сожалению, ни одна антивирусная программа не может полностью устранить угрозу их проникновения; в основном
эти программы борются с последствиями вирусного "нашествия": предупреждают активацию вирусов; частично ликвидируют повреждения; сдерживают вирусы после их активации.
Лучший метод борьбы с вирусами - исключить возможность несанкционированного доступа. Администратор должен принять все меры предосторожности, а именно:
задать пароли (для уменьшения вероятности несанкционированного доступа);
- назначить соответствующие права и привилегии (всем пользователям без исключения);
- создать профили для настройки рабочей среды пользователей (включая сетевые подключения и программные элементы, появляющиеся при входе пользователя в сеть);
- определить, какое программное обеспечение может выполняться.
Определительные испытания на надежность АИС - испытания,
проводимые для определения показателей надежности АИС (компонентов) с заданными точностью и достоверностью.
ЭФФЕКТИВНОСТЬ АВТОМАТИЗИРОВАННЫХ ИНФОРМАЦИОННЫХ СИСТЕМ
Комплексная эффективность от использования АИС и особенности ее экономической эффективности
Эффективность АИС - свойство системы, заключающееся в выполнении ею предписанных функций, с учетом соотношения затрат с результатами. Эффективность АИС комплексное понятие, которое включает как количественные, так и качественные характеристики.
Эффективность АИС зависит от эффективности ее компонентов, но не является их простой суммой.
Критерий эффективности - наиболее общая качественная характеристика результативности целенаправленной деятельности.
Критерии эффективности иногда делят на два вида:
- прагматические критерии эффективности - выработанные практикой качественные или количественные характеристики;
- математические критерии эффективности, разработанные математиками и положенные в основу аналитических, графоаналитических, численных и машинных методов анализа.
Оценка эффективности использования АИС - установление преимущества (или недостатка) функционирования объекта после внедрения
АИС по сравнению с нормативными значениями заданных показателей или с показателями аналогичных действующих АИС.
Фактическая эффективность новой АИС - эффективность, которая проявляется в приросте прибыли, производительности и комфортности труда.
При оценке эффективности использования АИС рекомендуется учитывать синергетический эффект, который возникает в результате синтеза сложных систем из компонентов.
Фактическая эффективность новой АИС не всегда может быть рассчитана; в этих случаях используются различные модели экспертных оценок.
Для оценки экономического эффекта при внедрении АИС обычно используют аналог внедряемой системы.
Критерий оценки экономической эффективности внедрения новых автоматизированных систем определяется из соотношения:
экономический эффект;
К
м - единовременные затраты, связанные с разработкой и внедрением новых систем.
Условие экономической эффективности системы определяется как
Кз Енвт,
где Е
нвт - нормативный коэффициент экономической эффективности капитальных вложений для автоматизированных информационных систем (примем Е
нвт = 0,38).
Единовременные затраты на разработку и внедрение новых методов решения задачи включают:
где С
ти - затраты на теоретические исследования;
С
пр - затраты на разработку программ и программной документации. Затраты на теоретические исследования можно найти из формулы:
Сти = Сзп + С + Снос + Ссс,
где С
зп - основная и дополнительная заработная плата научно-технических работников - разработчиков программы;
С
у - стоимость услуг;
С
кос - косвенные (накладные) расходы;
С
сс - отчисления в социальные фонды.
Величина заработной платы определяется по формуле:
Сзп СдніПР iKdi, i=1
где C
dHi - средняя дневная ставка работника і-й категории, у.е./день; n
i - количество работников і-й категории, человек; t
i - продолжительность работы работника і-й категории, дни;
К
ді - коэффициент, учитывающий дополнительную заработную плату для і-й категории работников.
Стоимость услуг включает в себя затраты на аренду ЭВМ (стоимость работы ЭВМ):
где С
мч - стоимость одного машинного часа работы ЭВМ, у.е./ч; t
Mp - продолжительность работы ЭВМ (машинное время), ч. Стоимость одного машинного часа работы ЭВМ определяется из соотношения: где С
зкс - годовые эксплуатационные расходы на содержание ЭВМ;
F - действительный годовой фонд времени работы ЭВМ. Косвенные расходы на подготовку программы определяются из соотношения:
С = С к
Скос Сзпккр’
где К
кр - коэффициент косвенных расходов (К
кр 1).
Отчисления в социальные фонды определяются из соотношения C с к
cc '"'зпксс’
где К
сс - коэффициент, учитывающий отчисления в социальные фонды.
Затраты на разработку программ и программной документации включают затраты на разработку алгоритмов и программ, проведение тестовых расчетов, опытную эксплуатацию задачи, составление инструкций и других руководящих документов, необходимых при использовании разработанных методов решения задачи.
В общем виде их можно записать так:
С = V (Т Груч + t C
ип^ /Л1 поЛ^по/ 1 Lomnj^yM4j
+ Скос + Ссс )
j=1
где T
npj - трудоемкость описания j-ой задачи и составления алгоритма и программы (технологической схемы) ее решения, чел.-ч.;
Срр^ - стоимость 1 чел.-ч ручного труда решения задачи, у.е./чел.-ч; t
0mnj - продолжительность работы ЭВМ при отладке программы (машинное время), ч; n - число решаемых задач, или
с
пр = X (тіС
зп + іо
тлС
мч + С0
С + С
сс),
j=1
где m - число команд в программе;
t
K - трудоемкость работ по разработке программы на одну команду, определяемая в зависимости от группы сложности программы, нормо-ч;
0
ЗП,С
К0С,С
СС определяются аналогично вышеприведенным формулам.
Экономический эффект Э можно представить в виде экономии от снижения затрат, получаемой при внедрении новых автоматизированных систем. Количественно его можно определить по формуле
Э = СП- Ср
н?
н,
где Ср и Ср
н - соответственно затраты на решение задачи базовой и новой системой, у.е.;
v
s и ?
н - частота решения задачи соответственно базовой и новой системой.
Стоимость разового решения задачи 0Р с помощью АИС определяется по формуле:
0Р
С t + С t + С + С
'"'мчмр ^¦'зп'-прог.р ^кос ^сс’ где С
мч - стоимость одного машинного часа работы АИС, у.е./ч;
t
Mp - машинное время решения задачи, ч.;
С
зп - заработная плата оператора (пользователя) в единицу времени, у.е./ч;
t
np0s.
p - время оператора (пользователя), затрачиваемое на решение задачи с помощью АИС, ч.
Годовой экономический эффект - показатель, который определяется на основе сопоставления приведенных затрат по базовой и новой системам.
Срок окупаемости АИС - время, за которое капиталовложения в создание (приобретение) АИС полностью окупаются. Срок окупаемости АИС
не всегда может быть определен напрямую; в таких случаях затраты на ее приобретение просто включаются в себестоимость продукции или услуг.
Экономичность АИС имеет тенденцию к повышению, так как показатели эффективность/затраты ресурса программно-технических компонентов АИС постоянно уменьшаются.
Критерий эффективности системы обработки данных (программно-технических компонентов) имеет постоянную тенденцию к повышению. Повышение научно-технического уровня АИС не всегда способствует повышению экономичности АИС.
Уровень автоматизации АИС и научно-технический уровень АИС не находятся в прямой взаимосвязи.
Пользовательская эффективность АИС и ее эффективность с точки зрения разработчика.
Техническая эффективность компонентов АИС
При оценке эффективности АИС используются определенные понятия и термины.
Экономичность АИС - количество и степень занятости ресурсов: реализующей ЭВМ, АРМов пользователей, каналов сети и др.
Критерий эффективности системы обработки данных - совокупность показателей, включающая: потери за счет простоев; штрафы за задержку заявок; стоимость единицы простоя; штраф за единицу времени пребывания заявки в системе; среднее время пребывания заявки в АИС.
Внедрение современных информационных технологий - дело дорогостоящее. Хотя конечная цель - повышение конкурентоспособности предприятия - при толковом подходе оправдывает средства (в данном случае материальные).
Однако пора повального увлечения информатизацией прошла, и сегодня ни один мыслящий руководитель не будет заниматься информатизацией своего производства без просчета прямых выгод от ее внедрения и эксплуатации, что невозможно без тщательного анализа и определения их экономической эффективности и целесообразности. И это понятно - стоимость ошибки может составлять сотни тысяч долларов.
Встает вопрос о том, как же оценить эти выгоды или хотя бы сроки достижения безубыточности проекта по внедрению той или иной информационной системы? Эти вопросы непросты не только потому, что связаны с нематериальными активами предприятия (АИС - это прежде всего интеллектуальная собственность).
Сложность методик оценки экономического эффекта от внедрения и эксплуатации АИС непосредственно зависит от сложности и многообразия современных информационных технологий.
Научно-технический уровень АИС - степень использования в сис-
теме технических решений, отвечающих современным научно-техническим достижениям.
Уровень автоматизации АИС - степень использования автоматизированных информационных технологий при выполнении функций АИС.
Определение потребности в новой системе - анализ и обоснование необходимости создания новой (модернизации существующей) системы и принятие решения.
Во времена плановой экономики все новое на предприятии внедрялось исключительно при проработке технико-экономического обоснования проекта. Зачастую такие обоснования носили формальный и фиктивный характер.
Однако разработке методик оценки от внедрения новой техники и новых технологий уделялось значительное внимание. Этим занимались целые институты. Теперь не без труда можно найти солидные, хотя изрядно запыленные, труды научных коллективов на полках институтских библиотек.
Необходимо отдать должное былому творчеству ученых на этом поприще. Наработанные подходы во многом облегчают процесс разработки новых методик, учитывающих поистине революционные достижения информационных технологий.
В 1975 г. утверждается постановлением Государственного комитета Совета Министров СССР и Президиума Академии наук СССР "Методика определения экономической эффективности автоматизированных систем управления предприятиями и производственными объединениями", разработанная на основе "Временной методики определения экономической эффективности автоматизированных систем управления предприятиями" (1972 г.). Более поздние методики полностью основаны на этой с незначительными изменениями.
В начальный период появления АСУП (автоматизированная система управления предприятием) обоснование экономической целесообразности ее создания происходило по схеме, которая предназначалась для расчета экономической эффективности от внедрения новой техники в производство. Схема строилась на традиционном определении экономической эффективности капитальных вложений.
Рассчитывался годовой экономический эффект путем сравнения исходных показателей по себестоимости и затрат на увеличение производственных основных и оборотных фондов с показателями, полученными после внедрения мероприятия по новой технике, и умножения полученных результатов на годовой объем производства.
Однако практика внедрения АСУП показала, что для оценки экономической эффективности требуется своя методология и специфические подходы. Оказалось недостаточным рассматривать создание АСУ только как внедрение новой техники в производство. Внедрение новой техники подразумевает автоматизацию отдельных технологических операций, отдельных
производственных процедур, в то время как функционирование автоматизированной системы управления влияет на качество управления предприятием в целом.
В связи с этим возникает специфичность определения размера эффекта, который может быть получен от автоматизации управления. Основные отличия от задачи определения экономической эффективности использования новой техники сводились к четырем моментам:
1) неопределенности - трудоемкости определения количественных параметров использования АСУП в ряде областей производственно-хозяйственной деятельности предприятия, где возможна только качественная оценка;
2) широкой взаимозаменяемости технических средств и высокой вариантности комплектования технической базы АСУП;
3) большому влиянию выбора первоочередности решения проблем и задач на последующее развитие АСУ;
4) комплексности и взаимосвязи всех подсистем АСУ.
Были установлены факторы, действие которых определяло эффективность автоматизации управления. Считалось, что экономическая эффективность АСУ на базе ЭВМ обеспечивается за счет следующих факторов:
высокой скорости выполнения операций по сбору, передаче, обработке и выводу информации вследствие высокой производительности средств;
применения современных методов планирования, обеспечивающих рациональное использование производственных ресурсов;
непрерывного оперативного контроля за ходом выполнения плана на основе своевременной и достоверной информации о состоянии производства;
повышения качества учета, планирования, контроля и регулирования.
Экономическая оценка эффективности автоматизированных систем управления предприятиями тесно связана с определением источников экономической эффективности. Под источниками экономической эффективности понимаются реальные возможности улучшения производственно-хозяйственной и финансовой деятельности предприятия, повышения эффективности производства от совершенствования системы управления им.
Источники эффективности АСУП - это потенциально существующие на предприятии резервы производства и упущенные возможности.
При определении эффективности АСУП учитываются следующие направления повышения эффективности производства, поддающиеся количественной оценке:
увеличение выпуска продукции за счет более рационального использования производственных и трудовых ресурсов, оптимизации производ-
ственной программы предприятия;
повышение производительности труда производственных рабочих вследствие сокращения потерь рабочего времени и простоев производственного оборудования;
установление оптимального уровня запасов материальных ресурсов и объемов незавершенного производства;
повышение качества выпускаемой продукции (сокращение брака, повышение сортности) и экономия, получаемая потребителями;
снижение затрат на выпуск продукции от возможного сокращения административно-управленческого персонала, оптимизации технико-экономического и оперативно-календарного планирования, улучшения оперативного регулирования производства, экономии условно-постоянных расходов.
Использование перечисленных источников экономической эффективности автоматизации управления производством направлено на снижение себестоимости производимой продукции, что обеспечивает получение соответствующей прибыли на предприятии, внедрившем автоматизированную систему управления.
Однако методики, определяющие экономическую эффективность автоматизированных систем управления, не удовлетворяют требованиям современного производства и условиям рыночной экономики. В связи с этим возникает необходимость создания методики экономической оценки внедрения информационных технологий (ИТ).
Очевидно, что невозможно создать единую методику, которая подходила бы для оценки любого проекта внедрения ИТ.
УПРАВЛЕНИЕ НАДЕЖНОСТЬЮ И ЭФФЕКТИВНОСТЬЮ АИС
Анализ, оценка показателей надежности и эффективности создаваемой АИС. Комплексный план обеспечения качества АИС
Рассмотрим структуру жизненного цикла автоматизированной системы (рис. 5.1).
Основные составляющие жизненного цикла любого изделия следующие:
1) маркетинговые исследования потребностей рынка;
2) генерация идей и их фильтрация;
3) техническая и экономическая экспертиза проекта;
4) научно-исследовательские работы по тематике изделия;
5) опытно-конструкторская работа;
6) пробный маркетинг;
7) подготовка производства изделия на заводе-изготовителе серийной продукции;
8) собственно производство и сбыт;
9) эксплуатация изделий;
10) утилизация изделий.
Стадии 4-7 - предпроизводственные, их можно рассматривать как комплекс научно-технической подготовки производства.
Основные параметры, характеризующие границы стадий жизненного цикла изделия, приведены в табл. 2.
Основным содержанием целевых исследований в процессе управления жизненным циклом изделия являются: анализ прогнозируемого состояния объектов, определение ожидаемых и фактических результатов, оценка приоритетности в решении локальных задач, выявление предпочтительных направлений использования ресурсов. Как уже указывалось выше, при таком анализе возникают следующие вопросы:
Какие факторы, условия и на каких стадиях следует подвергать оценке?
Какой должна быть система критериев оценок?
Какие методологические подходы и приемы следует использовать в ходе оценки?
Целесообразно в ходе управления жизненным циклом изделия опираться на систему контрольных точек цикла. На всех контрольных точках анализируют отклонения качественных и количественных параметров изделия от проектных значений по техническим и экономическим критериям и вырабатывают соответствующие решения по критерию "эффект-затраты".
Количество контрольных точек (КТ) зависит от характера изделия. Можно рекомендовать следующие КТ в жизненном цикле изделия:
КТ-1 - решение о начале проекта;
КТ-2 - окончание технического проекта (решение о разработке рабочей документации и изготовлении опытного образца);
КТ-3 - окончание ОКР (решение об изготовлении опытного образца);
КТ-4 - окончание пробного маркетинга (принятие решения о начале серийного производства и коммерческой реализации изделия);
КТ-5 - оценка качества серийно выпускаемой продукции (решение о повышении качества и надежности);
КТ-6 - оценка необходимости обновления или модернизации продукции;
КТ-7 - оценка оптимальности методов сбыта продукции;
КТ-8 - оценка целесообразности и методов капитального ремонта изделий в процессе эксплуатации;
КТ-9 - оценка целесообразности снятия изделия с производства;
| Таблица 2 |
| Стадия |
Начало стадии |
Окончание стадии |
| Маркетинговые исследования рынка |
Заключение договора на проведение исследований |
Сдача отчета по результатам исследований |
| Генерация идей и их фильтрация |
Сбор и фиксирование предложений по проектам |
Окончание отбора проектов-конкурентов |
Техническая
и экономическая экспертиза проектов |
Комплектация групп оценки проектов |
Сдача отчета по экспертизе проектов, выбор проекта-победителя |
| НИР |
Утверждение ТЗ на НИР |
Утверждение акта об окончании НИР |
| ОКР |
Утверждение ТЗ на
ОКР |
Наличие комплекта конструкторской документации, откорректированной по результатам испытаний опытного образца |
Пробный
маркетинг |
Начало подготовки производства опытной партии |
Анализ отчета о результатах пробного маркетинга |
Подготовка производства на заводе-
изготовителе |
Принятие решения о серийном производстве и коммерческой реализации изделий |
Начало установившегося серийного производства |
| Собственно производство и сбыт |
Продажа первого серийного образца изделия |
Поставка потребителю последнего экземпляра изделия |
Эксплуата
ция |
Получение потребителем первого экземпляра изделия |
Снятие с эксплуатации последнего экземпляра изделия |
| Утилизация |
Момент списания первого экземпляра изделия с эксплуатации |
Завершение работ по утилизации последнего изделия, снятого с эксплуатации |
|
КТ-10 - снятие изделия с эксплуатации и передача его на утилизацию.
Проведение НИР можно рассматривать как научную подготовку производства (НПП), ОКР - как основную часть конструкторской подготовки
производства (КПП) и частично технологической (ТПП), а собственно подготовку производства на серийном заводе как окончание КПП, проведение в основном ТПП, а также организационной подготовки производства (ОПП). Влияние системы подготовки производства на формирование конечного эффекта разработки, производства и эксплуатации нового изделия показано на рис. 5.2.
Длительности всех стадий жизненного цикла изделия коренным образом влияют на его экономическую эффективность. Особое значение имеет сокращение сроков научно-технической подготовки производства, в том числе и обеспечение определенной параллельности выполнения отдельных этапов. Для этого необходимо:
- снизить до минимума все изменения, вносимые в изделие после передачи результатов от одного этапа к другому;
- определить и реализовать рациональную параллельность работ, фаз, стадий цикла;
- обеспечить сокращение затрат времени на выполнение отдельных этапов.
Решение первой задачи обеспечивается инженерно-техническими методами (стандартизацией, унификацией, обеспечением качества и надежности, применением САПР и т.д.).
Решение второй задачи осуществляется путем применения плановокоординационных методов.
Решение третьей задачи связано с первой и состоит в использовании организационных методов (развитие технического обеспечения, автоматизации, средств планирования, функционально-стоимостного анализа, опытного производства и т.д.).
При решении любых задач необходимо большое значение придавать качеству.
Качество АИС - система показателей, отражающих свойства АИС и определяющих возможность и эффективность применения АИС по прямому назначению, зафиксированному в техническом задании на разработку.
Комплексный план обеспечения качества АИС - взаимоувязанная по времени и исполнителям совокупность мероприятий обеспечения значений показателей качества АИС и ее компонентов, определенных в техническом задании. Комплексный план обеспечения качества АИС обязательно должен быть тесно взаимоувязан с планом работ по созданию и внедрению АИС.
Практически в большинстве контрольных точек жизненного цикла обеспечение и оценка качества изделия - одна из первоочередных задач. Поскольку качество определяет эффективность изделия и уровень рыночной цены на него, то огромное значение приобретает комплексный подход к обеспечению качества.
Качество продукции, согласно определению международного стандарта ISO 8402, - это совокупность свойств и характеристик изделия, которые придают ему способность удовлетворять обусловленные или предполагаемые потребности.
Методы статистической обработки испытаний
Чтобы по выборке можно было достаточно уверенно судить о случай-
ной величине, выборка должна быть репрезентативной (представительной). Репрезентативность выборки обеспечивается случайностью отбора и означает, что объекты выборки достаточно хорошо представляют генеральную совокупность.
Оценка параметра а - функция вида a = a(X
1,X
2,...,X
n), где n - число испытаний случайной величины X, a X
1,X
2,...,X„ - наблюдаемые значения этой величины. Оценка параметра должна быть эффективной, т.е. в среднем иметь минимальный разброс.
Оценка а - неизвестного параметра, получаемого при испытании, одним числом, называется "точечной". Для представления точности и надежности оценки параметра а в математической статистике используют понятия "доверительный интервал" и "доверительная вероятность".
Доверительный интервал - интервал значений параметра а, совместимых с опытными данными и не противоречащих им.
Функция надежности - функция распределения времени безотказной работы системы. Функцией распределения случайной величины X называется функция F(x), задающая вероятность того, что случайная величина X принимает значение, меньшее х, т.е.
F(x) = P(Xx).
Отказ - событие, состоящее в полной или частичной утрате работоспособности системы. Так как не всякая неисправность приводит к отказу, то на практике различают неисправности основные и второстепенные. Основные неисправности приводят к отказу.
Второстепенные неисправности не приводят к отказу, однако создают неудобства в эксплуатации и портят внешний вид АИС. Поэтому второстепенные неисправности целесообразно своевременно устранять.
Возникновение отказа во времени - случайное событие, что позволяет для оценки надежности ЭВМ использовать методы теории вероятности и математической статистики.
Интенсивность отказов - условная плотность вероятности отказа оборудования в момент времени t, если до этого момента объект находился в работоспособном состоянии. Плотностью распределения вероятности называется первая производная функции распределения.
Чтобы определить влияние на характеристики АИС отказов различного вида, целесообразно произвести их классификацию. По характеру изменения параметров до момента возникновения отказы делят на внезапные и постепенные.
Внезапные (катастрофические) отказы возникают в результате мгновенного изменения одного или нескольких параметров элементов, из которых построена АИС (обрыв или короткое замыкание). Устранение внезапного отказа производят заменой отказавшего элемента (блока, устройства) исправным или его ремонтом. Постепенные отказы возникают в результате постепенного изменения параметров элементов до тех пор, пока
значение одного из параметров не выйдет за некоторые пределы, определяющие нормальную работу элементов (старение элементов, воздействие окружающей среды, колебания температуры, влажности, давления, уровня радиации и т. п., механические воздействия - вибрации, удары, перегрузки). Устранение постепенного отказа связано либо с заменой, ремонтом, регулировкой параметров отказавшего элемента, либо с компенсацией за счет изменения параметров других элементов.
По характеру устранения отказы делят на устойчивые и самоустраняющиеся. Для устранения устойчивых отказов оператор, обслуживающий АИС, должен отрегулировать или заменить отказавший элемент. Самоустраняющиеся отказы исчезают без вмешательства оператора и проявляются в форме сбоя или перемежающего отказа. Сбой - однократно возникающий самоустраняющийся отказ.
Если несколько сбоев следуют друг за другом, то имеет место перемежающийся отказ. Отказ типа сбоя особенно характерен для ЭВМ и построенных на их основе АИС. Появление сбоев обусловливается внешними и внутренними факторами.
К внешним факторам относятся колебания напряжения питания, вибрации, температурные колебания. Специальными мерами (стабилизацией питания, амортизацией, термостатированием и др.) влияние этих факторов может быть значительно ослаблено.
К внутренним факторам относятся флуктуационные колебания параметров элементов, несинхронность работы отдельных устройств, внутренние шумы и наводки.
Если в АИС возникает сразу несколько отказов, то по их взаимной связи различают независимые отказы (возникновение их не связано с предшествующими отказами) и зависимые (появление их вызвано отказом в предыдущий момент времени).
По внешним проявлениям отказы делят на явные и неявные. Явные отказы обнаруживаются при внешнем осмотре, а неявные отказы - специальными методами контроля.
При обработке результатов эксперимента статистическими методами используются следующие понятия:
Закон больших чисел - теоремы, устанавливающие количественные соотношения для приближения средних характеристик большого числа опытов (испытаний) к математически точным характеристикам.
Теория оценок - раздел математической статистики, в котором рассматриваются методы определения числовых значений характеристик случайных величин на основании ограниченного числа испытаний. Теория оценок имеет дело с числовыми оценками случайных величин, а не с определением законов их распределения.
Оценка параметра должна быть несмещенной, т.е. не должна содержать систематических отклонений.
Проверка статистических гипотез - раздел математической статистики, в котором рассматриваются методы определения законов распределения случайных величин.
Методы статистической обработки испытаний
Развитие математической теории надежности является обязательным атрибутом современной технологии создания этих систем: выдача количественных рекомендаций (в терминах задач надежности - это априорные вероятностные расчеты на ранних стадиях создания; решение различных оптимизационных задач на этапах разработки и эксплуатации; проведение апостериорных статистических оценок по результатам специальных испытаний и реальной эксплуатации) - это основное условие обоснованных и грамотных с технико-экономической точки зрения инженерных решений.
Особенностью математических моделей надежности АИС является то, что эти модели имеют дело с вероятностными процессами и используют в качестве исходных данных достаточно недостоверную статистику, иногда эта статистика вообще отсутствует. Тем не менее, создание математических моделей, в конечном счете, направлено на количественное оценивание уровня надежности и эффективности функционирования систем информатики.
Модель позволяет формировать различные рекомендации по повышению надежности за счет правильного и обоснованного выбора структуры системы, правил ее использования, методов технического обслуживания. Если не всегда можно с полным основанием доверять абсолютным значениям вычисленных априорно или оцененных статистически тех или иных показателей надежности, то для сравнительного анализа надежности различных вариантов построения или использования технических систем математические методы расчета надежности являются поистине незаменимыми.
Чем сложнее система и принцип ее организации, тем эффективнее на любом этапе проектирования, разработки и эксплуатации использование математических методов анализа и синтеза.
Каждая математическая модель является, безусловно, лишь грубым абстрактным описанием реального объекта. Она отражает лишь те стороны реального явления, которые являются решающими в данном конкретном исследовании. Другие, менее существенные свойства явления могут быть полностью проигнорированы.
Это может привести к тому, что при более глубоком и всестороннем исследовании реального явления могут оказаться недостаточными взятые в исходной модели характеристики, параметры, свойства: модель может оказаться в определенном смысле несостоятельной.
Естественно, что та или иная математическая модель отображает степень нашего познания исследуемой технической системы. К сожалению, опыт показывает, что априорные представления даже о сравнительно общих принципах функционирования создаваемых сложных систем иногда весьма далеки от истины.
Так, в сложных сетях передачи данных протоколы сетевого уровня часто бывают столь трудными в смысле описания, что допускают лишь имитационные способы математического моделирования; отсутствие в настоящее время хороших критериев степени проверки программного обеспечения вычислительных систем не позволяет создавать адекватных математических моделей вычислительных процессов и т. д. Однако необходимость исследования созданной системы в целях устранения различных неполадок, отыскания путей ее улучшения, разработки методов рациональной эксплуатации и т. д. приводит к необходимости ее более глубокого изучения.
В этом смысле любая "наилучшая" математическая модель процессов функционирования сложной системы является лишь наиболее полным возможным приближением к исследуемому процессу на данном уровне его понимания. Уточнение математической модели возможно лишь при дальнейшем изучении реального объекта, при сравнении теоретических результатов с опытными данными.
Процесс создания адекватной математической модели в теории надежности заключается не только в теоретической разработке какой-либо гипотезы о реальном поведении объекта, но и в постоянной проверке соответствия принятой гипотезы имеющимся статистическим данным, получаемым опытным путем.
Итак, более глубокое исследование системы позволяет строить модель, точнее соответствующую реальной системе. Но более сложная математическая модель требует, как правило, более детальных исходных данных, с одной стороны, и более тонких методов математического исследования - с другой.
И хотя, казалось бы, подобное уточнение математической модели является желательным и даже необходимым для более точного изучения исследуемого объекта, возникает далеко не праздный вопрос: нужно ли стремиться к тому, чтобы математическая модель надежности системы была очень точной?
Чрезмерное уточнение математической модели не всегда имеет смысл. Дело в том, что сама по себе математическая модель решает далеко не все.
Как правило, для получения количественных результатов мы пользуемся исходными экспериментальными данными на основании достаточно ограниченного числа опытных данных, т. е. не являющихся достаточно достоверными. Кроме того, если математическая модель надежности сложна, приходится прибегать к различным вычислительным методам, приводящим к неизбежным погрешностям. Эти два фактора - недостоверность
(или неточность) исходных данных и погрешности вычислительных методов - могут свести на нет все те преимущества, которых мы пытаемся добиться, создавая очень точную математическую модель. Естественно, возникает вопрос о целесообразности создания точной математической модели исследуемой системы. Иными словами, сама по себе "чистая" модель надежности не является полностью определяющим средством исследования реальной системы и точность ее должна определяться конкретными условиями: требуемой точностью исследования, достоверностью различных исходных данных, возможной точностью численных расчетов и т. д.
Малая достоверность исходных статистических данных, неточность математической модели (невозможность учета всех факторов, идеализация отдельных процессов и т. д.) и, как следствие этого, погрешности в окончательных результатах могут зародить сомнение в полезности расчетов надежности. Поэтому крайне важно понять, когда и для чего нужны расчеты надежности.
Во-первых, расчеты надежности функционирования, безусловно, приносят большую пользу на ранних этапах проектирования, когда возникает вопрос о сравнении различных возможных вариантов построения системы, ее архитектуры, организации вычислительных и информационных процессов и выборе наилучших из них.
Во-вторых, расчеты надежности производятся на стадии технического проектирования, когда уже более детально известны состав системы, ее структура и принципы функционирования, что позволяет проверить правильность принятых решений, найти слабые места и выработать определенные рекомендации по повышению надежности эффективности функционирования.
В-третьих, расчетные методы часто оказываются незаменимыми, а порой и единственно возможными на этапе испытания сложных систем информатики. Очень часто большие и сложные системы приходится испытывать либо по частям (причем обычно в течение разного времени), либо даже не в полном штатном составе.
В обоих случаях единственным способом получить оценку показателей надежности является расчетно-экспериментальный метод.
В-четвертых, только расчетные и расчетно-экспериментальные методы надежности дают возможность обоснованно планировать и прогнозировать стратегию модернизации и развития больших систем информатики: систем передачи данных, вычислительных сетей и т. п.
В-пятых, именно расчетные методы (по организации контроля исправности, по проведению профилактического обслуживания и т. п.) могут обеспечить рациональный режим эксплуатации средств информатики.
Наконец, составление математических моделей структуры взаимодействия элементов системы, процессов функционирования, правил технического обслуживания приводит к необходимости все глубже вникать в суть создаваемой технической системы, все больше понимать ее специфические особенности и тем самым не только количественно оценивать характеристики надежности, но и вырабатывать "попутно" полезные качественные рекомендации по повышению надежности и обеспечению оптимальных режимов функционирования и обслуживания.
Следует подчеркнуть, что чем сложнее исследуемая система, тем эффективнее использование математических расчетных методов на всех этапах ее разработки и использования.
Общие требования для построения математических моделей:
1. Математическая модель должна отражать основные свойства исследуемого объекта с точки зрения интересующего параметра или группы параметров. Например, если рассматривается время доставки сообщений в системе с пакетной коммутацией, то подходящей математической моделью может быть сеть массового обслуживания с ненадежными обслуживающими устройствами (узлами коммутации, каналами связи).
Если же изучается вопрос живучести сети по отношению к различного рода внешним воздействиям, то при выборе в качестве основного показателя вероятности связности подходящей математической моделью может оказаться граф с сетевой структурой.
2. Математическая модель должна быть достаточно простой в содержательном смысле, т. е. результаты ее анализа должны быть легко интерпретируемы. Это означает, например, что слишком подробная модель, обеспечивающая одновременное получение большого числа взаимосвязанных параметров, может и не быть наилучшим вариантом.
Например, получение совместного распределения числа обслуживаемых заявок в сети связи в различных узлах коммутации может оказаться той информацией, которую исследователь не умеет принципиально использовать. Однако эта модель позволяет анализировать "узкие" места в сети связи, в которой используются гораздо меньшие и более обозримые объемы выходной информации.
3. Математическая модель должна быть "адаптированной" под имеющиеся исходные данные. Например, бессмысленно строить полумарковскую модель для описания процесса функционирования системы с восстановлением, если о распределениях известны лишь значения математических ожиданий.
Если при таких же исходных данных требуется оценить значения структурных параметров сети, то нужно иметь в виду, что могут быть получены лишь двусторонние оценки, а не точные значения соответствующих параметров.
4. Как правило, наличие неполных или слишком недостоверных дан-
ных (а именно это и является, к сожалению, отличительной особенностью данных о надежности) делает очень оправданным упрощение математических моделей.
5. Математическая модель должна быть легко модифицируемой при появлении новых исходных данных или новых сведений о внутренней природе системы. Например, статистическая модель системы передачи данных в режиме пакетной коммутации должна предусматривать возможность использования ее при различных протоколах верхнего уровня.
Математическая модель для статистического моделирования системы связи с коммутацией сообщений должна иметь общее программное ядро с математической моделью системы связи с коммутацией каналов.
6. Наконец, математическая модель системы информатики - объекта весьма сложного и содержащего огромное число входящих в ее состав подсистем и устройств - должна быть сформулирована так, чтобы размерность этой модели позволяла бы проводить достаточно конструктивным образом расчеты на доступной вычислительной технике в разумные сроки. В первую очередь это касается тех моделей, которые предназначены для использования в режиме советчика в реальном масштабе времени.
Вероятностные модели динамики надежности
Показатели надежности АИС: плотность распределения времени безотказной работы f(t), вероятность безотказной работы P(t), вероятность отказа Q(t), интенсивность отказов l(t), средняя наработка до первого отказа Г
ср.
Наиболее точная количественная мера надежности каждого изделия -его индивидуальная наработка до момента возникновения отказа. На практике же достаточно полная характеристика надежности - плотность распределения времени безотказной работы данного типа изделий f(t) и интенсивность отказов l(t). Для определения функций f(t) и l(t) используют экспериментальные данные по испытанию изделий на надежность. При этом опыт ставится следующим образом: испытанию подвергают большую партию изделий N
0, время наблюдения разбивают на n небольших отрезков Dt, на каждом из этих отрезков определяют число отказавших изделий DN. Отказавшие изделия либо не заменяют новыми (при определении f(t) и l(t) невосстанавливаемых элементов), либо заменяют новыми (для восстанавливаемых элементов). По полученным результатам значение вероятности безотказной работы изделия в момент времени t, характеризующее его надежность, может быть определено из следующих соображений.
Если в рассматриваемый момент времени t = t
x имеется N
x работающих изделий, a m
x = N
0 - N
x вышли из строя, то опытная статистическая
вероятность безотказной работы P* = N
x/N
0, а опытная статистическая вероятность отказов Q* = (N
0 - N
x) /N
0 = mJN
0, где P* и Q* характеризуют
частоту отказов в данном опыте и являются оценками соответствующих "математических" вероятностей, которые определяются как пределы:
Nq - N
x
Nq
Nx
Nq
lim m = Q,
Nq N
q
lim
Nq lim
Nq
P = 1 - Q.
"Математические" вероятности характеризуют не отдельную выборку, а всю генеральную совокупность изделий. Определим зависимость P* от времени, для чего рассмотрим приращение Dm на ограниченном отрезке времени Dt. Число элементов Dm
x, которое выйдет из строя за ограниченный промежуток времени Dt, будет пропорционально отрезку времени Dt и числу имеющихся в работе изделий N
x, т. е. коэффициент пропорциональности принимается постоянным на ограниченном отрезке времени.
Переходя к бесконечно малым приращениям dm и учитывая dm
x = -dN
x, получим dm
x = -dN
x = l
tM
xdt; dN
x / N
x = -l
tdt.
Интегрируя последнее выражение и имея в виду, что при t = 0 N
x = N
0 найдем,
In N = -jf
Qx l dt
или, если освободиться от логарифмов:
P = N
x/N
q = e4Qx1,dt.
Значение l
t, равное
Я =
- = d(m
x/m
0) 1 = dQ1 = _ dP 1
t = N
xdt ~ dt N
x/N
q ~ dt P ~ dt P’
называют интенсивностью (опасностью) отказов. Таким образом, интенсивность отказов в момент времени t представляет собой вероятность отказов в единицу времени при условии, что до момента времени t отказов не было.
Зависимость интенсивности отказов от времени может быть определена экспериментально (рис. 2.1).
Анализируя полученную кривую 1, снятую, допустим, при испытаниях в нормальных условиях, можно отметить три временных интервала: 1) от 0 до t
1, - время приработки (1-1,5%) всего времени испытаний, 2) от t
1, до t
2 - время нормальной работы, 3) от t
2 и далее -время старения. Время приработки характеризуется повышенным числом отказов и определяется проявлением технологических и производственных дефектов, время нормальной работы - высокой надежностью испытуемых изделий (интенсивность отказов на этом интервале практически постоянна).
При ослаблении (кривая 2) или ужесточении (кривая 3) условий испытаний зависимость l(t) изменится, но три характерных временных интервала сохранятся.
Полученные ранее зависимости вероятности безотказной работы P(t) от интенсивности отказов l(t) называют экспоненциальным законом изменения P(t), т.е.
P{t) = вчкт
или
P(t) = в-xt,
если l = const. Этот закон имеет место в случае учета внезапных отказов. Известны и другие законы изменения P(t):
1) нормальный закон, или распределение Гаусса (для постепенных
| ад л |
дисперсия среднего времени безотказной работы; Тср - среднее время безотказной работы;
Современный Гуманитарный Университет
2) закон Вейбулла (при определении надежности электромеханических элементов):
tklTcp .
P(t) = e
3) закон Эрланга (при определении надежности восстанавливаемых изделий):
P(t) = (1 + 2tlTcp)e-2ttTc .
Один из важнейших числовых параметров надежности - среднее время безотказной работы, который определяется как математическое ожидание случайной величины, т.е.
Tcp = MT=jtq(t)dt,
о
где q(t) - плотность вероятности отказа. Преобразуем этот интеграл к следующему виду, решив его по частям:
Tcp = ]tq(t)dt = -tP(t)\ 0~+J P(t)dt
0 0
или
Tcp = pP(t)dt = 111.
0
В общем случае интенсивность отказов 1t зависит как от времени t, так и от параметров, характеризующих режим работы (U, I, W) и условия эксплуатации аппаратуры (Q, z, а, ...), т. е.
1 = j(t,U,I,Q,...,a).
Исходя из анализа физических и физико-химических процессов, являющихся причинами возникновения отказов, определим зависимость lt, от режимов работы.
Число отказов при прерывистом режиме работы элементов зависит как от времени их действительной работы tp, так и от числа циклов работы N, т. е.
mx = j(tp,N).
Бесконечно малое приращение числа отказов определим как полный дифференциал:
dm, = jdtp IdN.
x dtp p dN N
Так как mx = N0 - Nx и, следовательно, dmx = -dNx, то после деления обеих частей на Nx имеем
N
Nx
¦p /V
J Idtp + J JdN
Обозначая
= 1t
dj J_
dtpNx
и учитывая, что при t = Q N = 0 и Nx = N получим
tp N
J Idtp JdN
ln(Nx/No) = -
0 0
Освободившись от логарифмов, имеем
Марковские модели надежности
Марковская модель системы - модель, при которой последующее состояние системы зависит только от текущего состояния и не зависит от предыдущих состояний.
Технология автоматизированного общего логико-вероятностного метода (ОЛВМ) построения марковских моделей систем первоначально была разработана для расчета условных законов живучести систем к воздействию на их элементы различных последовательностей поражающих факторов. Был автоматизирован самый громоздкий и трудоемкий процесс построения, на основе схемы функциональной целостности (СФЦ) и самой цепи Маркова, т.е. графа переходов состояний системы и всех допустимых переходов. В ОЛВМ множество марковских состояний работоспособности системы определяется путем автоматического преобразования логической функции работоспособности системы (ФРС) в совершенную дизъюнктивную нормальную форму (СДНФ). Затем, на основе специальных правил поразрядного сравнения пар конъюнкций полученной СДНФ, автоматичес-
ки определяются допустимые логические функции переходов (ЛФП) между марковскими состояниями системы и рассчитываются их параметры. Например, правила поразрядного сравнения переменных X (у) ^ X (k) конъюнкций СДНФ логической ФРС для определения переменных X, i = 1,2,...,H, ЛПФ между состояниями Sj ^ Sk цепи Маркова для невосстанавливаемых систем следующие:
Если Xi (j) ^ Xi (k), то Jj,k = Jj,kXi - не поражение элемента x;
Если Xi (j) ^ Xi (k), то Jj,k = Jj,kXi - поражение элемента Xi;
Если Xi (j) ^ Xi (k), то Jj,k = Jj,k * 1 - элемент Xi уже поражен;
Если Xi (j) ^ Xi (k), то Jj,k = Jj,k * 0 - элемент Xi не восстанавливается.
Построенная по указанным правилам марковская цепь системы, СФЦ которой приведена на рис. 2.2, характеризуется 13-ю комбинаторными марковскими состояниями безопасности и 70-ю допустимыми переходами между этими состояниями. Правила и соответствующие машинные программы разработаны для нескольких видов поражающих воздействий систем с восстановлением элементов. Технология ОЛВМ построения цепей Маркова позволяет полностью автоматизировать процессы построения практически всех известных видов и классов дискретных и непрерывных марковских и полумарковских моделей систем большой размерности, состояния которых описываются конъюнкциями простых логических переменных.
|
| модель системы, которая состоит из пяти компонентов: конечного списка входных символов; списка выходных символов; множества внутренних состояний; функции перехода; функции выхода. |
Надежность, человеческий фактор в надежности
- исследование дефектов и ошибок, динамики их изменения при отладке и сопровождении, а также влияния на показатели надежности программных средств;
- исследование и разработка методов структурного построения сложных ПС, обеспечивающих их необходимую надежность;
- исследование методов и средств контроля и защиты от искажений программ, вычислительного процесса и данных путем использования различных видов избыточности и помехозащиты;
- разработка методов и средств определения и прогнозирования характеристик надежности в жизненном цикле комплексов программ с учетом их функционального назначения, сложности, структурного построения и технологии разработки.
Результаты решения этих задач являются основой для создания современных сложных программных средств с заданными показателями надежности. Использование и объединение результатов экспериментальных и теоретических исследований надежности ПС позволили заложить основы теории и методов в этой области.
В жизненном цикле ПС значения показателей качества и надежности компонентов и комплексов программ в целом рекомендуется непрерывно анализировать и прогнозировать с целью гарантированного обеспечения заданных показателей надежности. В реальных проектах работы по исследованию и обеспечению надежности программ целесообразно выделять в отдельную группу под единым руководством со специальным планом.
В основе теории надежности программного обеспечения также лежат понятия о двух возможных состояниях объекта или системы: работоспособном и неработоспособном. В процессе функционирования возможен переход объекта из работоспособного состояния в неработоспособное и обратно.
С этим переходами связаны события отказа и восстановления.
Определение степени работоспособности системы предполагает наличие в ней средств, способных установить соответствие ее характеристик требованиям технической документации. Для этого должны использоваться методы и средства контроля и диагностики функционирования системы.
Глубина и полнота проверок, степень автоматизации контрольных операций, длительность и порядок их выполнения влияют на работоспособность системы и достоверность ее оценки. Методы и средства диагностического
контроля предназначены для установления степени работоспособности системы, локализации отказов, определения их характеристик и причин, скорейшего восстановления работоспособности, для накопления, обобщения и анализа данных, характеризующих работоспособность системы. Диагноз состояния системы принято делить на тестовый и функциональный.
При тестовом диагнозе используются специально подготовленные исходные данные и эталонные результаты, которые позволяют проверять работоспособность определенных компонентов системы. Функциональный диагноз организуется на базе реальных исходных данных, поступающих в систему при ее использовании по прямому назначению. Основные задачи технической диагностики включают в себя:
- контроль за исправностью системы и полным соответствием ее состояния и функций технической документации;
- проверку работоспособности системы и возможности выполнения всех функций в заданном режиме работы в любой момент времени с характеристиками, указанными в технической документации;
- поиск, выявление и локализацию источников и результатов сбоев, отказов и неисправностей в системе.
Формализации показателей качества программных средств посвящена группа нормативных документов. В международном стандарте ISO 9126:1991 при отборе минимума стандартизируемых показателей выдвигались и учитывались следующие принципы: ясность и измеряемость значений, отсутствие перекрытия между используемыми показателями, соответствие установившимся понятиям и терминологии, возможность последующего уточнения и детализации.
Выделены характеристики, которые позволяют оценивать ПС с позиции пользователя, разработчика и управляющего проектом. Рекомендуется шесть основных характеристик качества ПО, каждая из которых детализируется несколькими (всего 21) субхарактеристиками:
функциональная пригодность детализируется пригодностью для применения, точностью, защищенностью, способностью к взаимодействию и согласованностью со стандартами и правилами проектирования;
надежность рекомендуется характеризовать уровнем завершенности (отсутствия ошибок), устойчивостью к ошибкам и перезапускаемостью;
применимость предлагается описывать понятностью, обучаемостью и простотой использования;
эффективность рекомендуется характеризовать ресурсной и временной экономичностью;
сопровождаемость - удобством для анализа, изменяемостью, стабильностью и тестируемостью;
переносимость предлагается отражать адаптируемостью, структури-
рованностью, замещаемостью и внедряемостью.
Характеристики и субхарактеристики в стандарте определены очень кратко, без комментариев и рекомендаций по их применению к конкретным системам и проектам.
Надежность, человеческий фактор в надежности и помехозащищенность передачи данных. Методы надежности информационного обеспечения и испытание компонентов АИС
Надежность передачи данных - мера достоверности сообщения, т.е. соответствия принятого сообщения переданному.
Помехоустойчивость - способность системы передачи данных противостоять вредному действию помех. Чтобы повысить помехоустойчивость передачи данных, приходится вводить в сообщение избыточность.
Как правило, сокращение избыточности увеличивает эффективность передачи данных, но ухудшает надежность.
Надежность или помехоустойчивость передачи данных обратно пропорциональна вероятности появления ошибки.
Корректирующие коды - средство повышения помехоустойчивости передачи данных, которое заключается во введении в кодовую группу с полезной информацией избыточных символов, позволяющих обнаруживать и исправлять ошибки, возникающие в результате помех. В простейшем случае корректирующий код получают добавлением к кодовой комбинации единицы.
Выделение полезного сигнала из шумов - одна из основных проблем надежности передачи данных.
Не вдаваясь глубоко в теорию кодирования и помехозащищенности передачи информации, можно лишь констатировать, что избыточность -единственный реальный базис обнаружения и коррекции ошибок. Избыточность в широком смысле может быть "последовательной" в случаях применения любого из методов кодирования, т.е. передача дополнительной по отношению к "полезной" информации; либо "параллельной" в случаях как использования параллельных каналов связи (возможно, различной физической природы), так и применения информационной обратной связи, т.е. возврат (используя дуплексный канал) принятой информации для анализа передатчиком ее правильности.
Применение кодирования с решающей обратной связью - это пример комбинированной, "последовательно-параллельной" избыточности.
Степень избыточности определяет глубину и надежность обнаружения ошибок. Представляется очевидным, что чем больше дополнительной информации будет передано, тем большее количество ошибок и с большей
достоверностью может быть обнаружено и даже, возможно, исправлено. Но в то же время тем меньше доля полезной информации в общем потоке данных, тем меньше эффективная скорость приема/передачи и, в конечном счете, пропускная способность канала.
Выбор процедуры коррекции ошибок, таким образом, можно рассматривать как оптимизационную задачу, критерием которой является минимизация накладных расходов при заданной надежности приема/передачи информации.
При работе с модемом физическая природа канала передачи информации - коммутируемая телефонная сеть - определяет те факторы, вес которых оказывается наиболее значимым при решении поставленной оптимизационной задачи. Отсутствие дублирования канала (по крайней мере на абонентском участке линии) исключает из рассмотрения физическое параллельное дублирование.
В то же время применение обратной связи вполне допустимо вследствие того, что канал дуплексный.
Фактор "стоимость трафика" заставляет с большой осторожностью относиться к таким методам коррекции ошибок, как многократное дублирование передаваемой информации с мажоритарным выбором или применение информационной обратной связи. Объем передаваемой информации в первом случае возрастает как минимум втрое, а то и более.
Во втором случае гонять одну и ту же информацию в полном объеме в обе стороны только для обнаружения факта наличия ошибки с последующим повтором представляется также излишне расточительным.
Третьим фактором, оказывающим огромное влияние на выбор методов коррекции ошибок, является помеховая обстановка в канале передачи данных. А она такова, что ограничиться простым контролем четности, чего бывает достаточно для локальных сетей, не кажется удачным решением. Представляется на первый взгляд, что применение симплексного корректирующего кодирования - неплохое решение поставленной задачи.
Это кодирование позволяет не только обнаруживать ошибки, но и указывать на их местоположение, т.е. исправлять их, что дает возможность отказаться от обратной связи. Однако степень избыточности при этом весьма высока: объем дополнительной информации сравним с объемом "полезной". Для исправления только одиночной ошибки необходимы по крайней мере три дополнительных бита на байт.
И этот объем стремительно возрастает с ростом глубины коррекции ошибок, что в конечном счете может свести выигрыш от высокой надежности и отсутствия повторов к глобальному и стабильному проигрышу в стоимости "излишнего" трафика, который, к тому же, будет совершенно индифферентен к помеховой обстановке (возможно, неплохой).
Разумным компромиссом было сочтено применение циклического помехозащищенного кодирования с решающей обратной связью. Суть этого метода состоит в следующем. Вся "полезная" информация разбивается на
"порции" - кадры. Передача каждого кадра завершается передачей специальной контрольной последовательности кадра, подсчитанной по некоему, заранее определенному алгоритму. Этот рекуррентный алгоритм в процессе выдачи кадра модифицирует контрольную последовательность с помощью очередного выдаваемого байта.
Удаленная сторона, принимая кадр, также подсчитывает контрольную последовательность по известному алгоритму. По окончании приема кадра производится сравнение подсчитанной контрольной последовательности с принятым в конце кадра ее значением. По результатам сравнения приемник решает гамлетовский вопрос: правильно ли передан данный кадр или его следует повторить.
Результат решения этого вопроса приемник сообщает передатчику посредством некой "квитанции". Отсюда другое название этого метода: метод автоматического повтора запроса (ARQ, Automatic Repeat reQuest).
Основная ответственность за надежность обнаружения ошибок при этом методе лежит на алгоритме вычисления контрольной последовательности кадра. Здесь используется аппарат циклического избыточного контроля (CRC, Cyclic Redundancy Check). Циклическое кодирование базируется на математической теории групп, алгебре многочленов и теории колец.
Оставив для другого раза теоретические основы циклического кодирования, стоит отметить его свойства, обусловившие выбор циклических кодов.
Главное - это то, что циклические коды обладают высокой надежностью коррекции ошибок при весьма невысокой избыточности. Особенно они эффективны при обнаружении пакетов ошибок. Например, для кадра размером в 256 байт и контрольной последовательности в 16 бит (CRC-16) минимальное кодовое расстояние - 3, т.е. одна разрешенная кодовая комбинация отличается от другой, разрешенной же, минимум 3 битами, причем не любыми, а расположенными на вполне определенных местах во всей 2064-битовой последовательности.
Вероятность появления нераспознаваемой ошибки, т.е. того, что вследствие ошибок одна разрешенная комбинация перейдет в другую, не превосходит 10'14. При уменьшении размера кадра или при увеличении длины контрольной последовательности минимальное кодовое расстояние растет, что еще более уменьшит вероятность появления нераспознаваемой ошибки.
Другое немаловажное свойство - простота кодирования: рекуррентный характер алгоритма при минимальном расходе вычислительных ресурсов. Причем, существуют по крайней мере два алгоритма, дающих идентичный результат.
Один - битовый, модификация результата в котором производится по каждому биту. Его удобно реализовывать на аппаратном уровне с помощью сдвигового регистра. Другой - байтово-табличный, в котором модификация результата производится после приема/передачи целого бай-
та. Этот алгоритм больше подходит для реализации на программном уровне, поскольку требует некоторого объема памяти для хранения таблиц.
При работе в сетевой среде необходимо быть уверенным в том, что секретные данные таковыми и останутся, поскольку лишь пользователи, которые имеют соответствующие полномочия, смогут получить к ним доступ. Однако важно обеспечить защиту не только конфиденциальной информации, но и функционирования сети в целом. Каждая сеть нуждается в защите от преднамеренного или случайного повреждения. В то же время хороший администратор сети всегда помнит, что при обеспечении безопасности надо знать меру, надо строить защиту таким образом, чтобы люди не испытывали трудности при выполнении своей работы.
Пользователи не должны приходить в отчаяние, пытаясь получить доступ к собственным файлам.
Несмотря на то, что сети обрабатывают и весьма деликатную, и ценную деловую информацию, о ее защите часто думают в последнюю очередь. Наибольшую угрозу для безопасности сети представляют несанкционированный доступ, электронное подслушивание; кража; преднамеренное или неумышленное повреждение.
Задача администратора - гарантировать, что сеть будет надежным и безопасным инструментом.
Уровень защиты сети зависит от ее назначения. Например, сеть, которая хранит данные крупного банка, требует более мощной защиты, чем локальная сеть, соединяющая компьютеры небольшой общественной организации.
Для защиты сети необходимо проводить определенную политику, т.е. следовать набору правил и предписаний, - ничто нельзя отдавать на волю случая.
Выработка политики безопасности (security policy) - первый шаг, который должна сделать любая организация, обеспечивая защиту своих данных. Политика устанавливает "генеральную линию", опираясь на которую и администратор, и пользователи будут вносить изменения, находить выход из нештатных ситуаций при развитии сети.
Итак, разработка и принятие политики безопасности - важнейший шаг к успешному использованию сети.
Лучшая политика защиты данных имеет предупредительный характер. Предотвращая несанкционированный доступ или действия, администратор сохранит информацию.
Однако система, основанная на упреждении, требует, чтобы он в совершенстве владел средствами и методами, которые помогают сохранить данные в безопасности.
Перед тем как получить доступ к сети, нужно ввести правильные имя пользователя и пароль. Поскольку пароли связаны с учетными записями пользователей, система идентификации паролей является первой линией
обороны против несанкционированного доступа.
Маловероятно, что хорошо обученный пользователь сети непреднамеренно повредит данные.
Администратор должен научить пользователей сети всем тонкостям работы и методам безопасности. Для этого он может составить короткое, ясное руководство, а в случае необходимости - организовать обучение, особенно новых пользователей.
Обеспечение безопасности данных надо начинать с физической защиты оборудования. На степень физической защиты влияют размер компании, характер информации, доступные ресурсы.
В одноранговых системах организованная политика защиты оборудования часто отсутствует, так как пользователи сами отвечают за безопасность своих компьютеров и данных.
В больших централизованных системах, где число индивидуальных пользователей достаточно велико, а данные компании имеют важное значение, серверы должны быть физически защищены от случайного или преднамеренного вмешательства.
При возникновении проблем с серверами в каждой группе пользователей всегда найдутся желающие продемонстрировать свои технические способности. Одни могут знать, что делают, а другие и нет.
Поэтому самое лучшее - тактично удержать этих людей от самостоятельного "исправления" сервера.
Простейшее решение - запереть серверы в специальном помещении с ограниченным доступом. Но не все организации имеют такую возможность.
А вот закрыть серверы хотя бы в кабинете или в большом шкафу смогут все.
Медный кабель, например коаксиальный, подобен радиостанции: он излучает электромагнитные сигналы, которые содержат информацию о передаваемых по кабелю данных. Эту информацию с помощью специального оборудования легко перехватить.
Кроме того, к медному кабелю можно подключиться и похитить информацию непосредственно из сетевого кабеля. Поэтому доступ к кабельным трассам, по которым передаются важные данные, должен быть ограничен либо узким кругом уполномоченных на работу с кабелем лиц, либо прокладкой его внутри строительных конструкций (в перекрытиях и стенах).
Защитив физические компоненты сети, администратор должен гарантировать, что сетевые ресурсы находятся в безопасности от несанкционированного доступа и от случайного или преднамеренного уничтожения. Политика назначения привилегий и прав на доступ к сетевым ресурсам - основа для превращения сети в инструмент успешного ведения бизнеса.
Сейчас широко применяются две модели, которые обеспечивают бе-
зопасность информационных и аппаратных ресурсов: защита через пароль; защита через права доступа.
Эти модели называют также защитой на уровне совместно используемых ресурсов (resource level - защита через пароль) и защитой на уровне пользователя (user level - защита через права доступа).
Один из методов защиты совместно используемых ресурсов - присвоить пароль каждому общедоступному ресурсу. Таким образом, доступ к ресурсу осуществляется только в том случае, когда пользователь вводит правильный пароль.
Во многих системах ресурсы могут быть предоставлены в совместное использование с разными типами прав доступа. В Windows 95, например, к каталогам может быть доступ только для чтения, полный доступ и доступ в зависимости от пароля.
Если совместно используемый каталог предоставлен только для чтения, сотрудники, знающие пароль, будут читать в нем все файлы. Они могут просматривать документы, копировать их на свою машину, печатать, но не смогут изменить исходный документ.
В случае полного доступа к файлам в совместно используемом каталоге сотрудники, знающие пароль, могут просматривать, модифицировать и удалять в нем любые файлы.
Доступ в зависимости от пароля заключается в следующем. Совместно используемому каталогу присваивается пароль двух уровней: доступ только для чтения и полный доступ. Сотрудники, знающие пароль доступа для чтения, могут лишь читать данные, а те, кто знает пароль полного доступа, имеют соответственно полный доступ.
Защита совместно используемых ресурсов паролем - самый простой метод защиты, который позволяет любому, кто знает пароль, получить доступ к нужному ресурсу.
Защита через права доступа заключается в присвоении каждому пользователю определенного набора прав. При входе в сеть пользователь вводит пароль.
Сервер, проверяя комбинацию имени пользователя и пароля, т.е. проверяя права пользователя в базе данных безопасности, предоставляет или запрещает доступ к сетевым ресурсам.
Защита с применением прав доступа обеспечивает более высокий уровень управления доступом к совместно используемым ресурсам, а также более строгий режим безопасности, чем защита паролем. Имея защиту на уровне совместно используемых ресурсов, любой человек может с легкостью передать другому, например, пароль доступа к принтеру.
Гораздо менее вероятно, что этот пользователь сообщит кому-нибудь свой персональный пароль.
Так как защита на уровне пользователя более эффективна и может определять различные уровни безопасности, большие организации обыч-
но отдают предпочтение именно этой модели.
Проверив и подтвердив имя и пароль пользователя, система безопасности сети предоставляет ему доступ к соответствующим ресурсам.
Однако иметь пароль еще недостаточно - для доступа к ресурсам нужны права. Образно говоря, вокруг каждого ресурса возведена ограда безопасности.
Эта ограда имеет различные входы, через которые пользователи могут получить доступ к ресурсу. Причем, попав через один вход, пользователь выполнит гораздо больше операций, чем если бы он попал через другой.
Иными словами, некоторые входы предоставляют пользователю больше прав на ресурс.
Дело администратора определить, кто какими конкретными входами должен пользоваться. Один вход предоставляет пользователю полный доступ, или полный контроль над ресурсом.
Другие входы предоставляют пользователю ограниченный доступ.
Каждый разделяемый ресурс или файл хранится вместе со списком пользователей или групп, куда включены и их права (см. рис. 3.2).
присвоить каждому пользователю соответствующие права доступа к каждому ресурсу. Наиболее эффективный способ решить эту задачу - через группы, особенно в крупных организациях с большим количеством пользователей и ресурсов.
Windows NT Server для установки групповых прав доступа к каталогам и файлам использует File Manager.
Сначала администратор оценивает, какие права необходимы каждому пользователю, а затем включает пользователей в соответствующие группы. Этот метод назначения прав намного удобнее, чем присвоение отдельных прав каждому пользователю.
Рассмотрим другой пример. В университете все студенты имеют собственные файлы. Как организовать доступ к ним?
Членам академического наблюдательного совета требуется полный доступ к файлам студентов, тогда как остальным преподавателям необходим только доступ для чтения. Администратор может создать группу с названием Reviewers (наблюдатели), предоставить этой группе полные права доступа к файлам студентов и внести в нее пользователей - членов наблюдательного совета.
Другая группа, называемая Faculty (преподаватели), могла бы иметь доступ к файлам студентов только для чтения. Преподаватели, входящие в состав группы Faculty, будут только читать файлы студентов, но не изменять их.
Аудит (auditing) - это запись определенных событий в журнал безопасности (security log) сервера. Этот процесс отслеживает действия пользователей в сети.
Он выступает как часть защиты сети, поскольку в журнале безопасности отражены имена всех пользователей, которые работали с конкретными ресурсами или пытались получить к ним доступ. Кроме того, он предоставляет информацию для тех подразделений, которые хотят определить (и оплатить) затраты на использование некоторых ресурсов. Аудит фиксирует такие действия, как:
- попытки входа в сеть;
- подключение к указанным ресурсам и отключение от них;
- разрыв соединения; блокировка учетных записей;
- открытие и закрытие файлов;
- модификация файлов;
- создание и удаление каталогов;
- модификация каталогов;
- события на сервере и его модификация;
- изменение паролей;
- изменение параметров регистрации.
Аудит показывает, как работает сеть. Администратор может использовать журнал безопасности для подготовки отчетов, где отразит любые заданные действия, а также дату и время их совершения.
Например, повторяющиеся неудачные попытки входа в сеть (особенно в необычное время) могут указывать на то, что несанкционированный пользователь добивается доступа к сети.
Утилита шифрования (encryption) данных кодирует информацию перед тем, как передать ее по сети. Этот факт весьма затруднит чтение передаваемых по сети данных, если кто-то вдруг подключится к кабелю.
Когда данные поступят на соответствующий компьютер, они будут декодированы в понятную форму с помощью ключа - кода для дешифровки закодированной информации. Усовершенствованные схемы шифрования автоматизируют и шифрование, и дешифрование.
Лучшие системы шифрования основаны на специальной аппаратуре, их стоимость очень высока.
Традиционный стандарт шифрования - Data Encryption Standard (DES). Он описывает спецификации ключа и способ шифрования. В настоящее время стандарт DES используется правительством США. Как отправителю, так и получателю информации необходим доступ к ключу.
Существует только один способ передать ключ из одного места в другое - сообщить его.
Инновации: Менеджмент - Моделирование - Софт