Калинина В. - Надежность и эффективности АИС

ВВЕДЕНИЕ В ТЕОРИЮ НАДЕЖНОСТИ СЛОЖНЫХ СИСТЕМ

Современные требования к надежности сложных систем. Определение и измерение надежности

Одной из основных проблем построения вычислительных систем во все времена остается задача обеспечения их продолжительного функционирования. Эта задача имеет три составляющие: надежность, готовность и удобство обслуживания.
Все эти три составляющие предполагают, в первую очередь, борьбу с неисправностями системы, порождаемыми отказами и сбоями в ее работе. Эта борьба ведется по всем трем направлениям, которые взаимосвязаны и применяются совместно.
Надежность - свойство объекта сохранять во времени в установленных пределах значения всех параметров, характеризующих способность выполнять требуемые функции в заданных режимах и условиях применения, технического обслуживания, хранения и транспортировки. При необходимости в понятие "объект" могут быть включены информация и ее носители, а также человеческий фактор, например при рассмотрении надежности АИС.
Терминология по надежности в технике распространяется на любые технические объекты. Проблема надежности, возникшая много лет назад, заставила говорить о ней в первую очередь инженеров и экономистов, а затем и математиков как о проблеме номер один. Вначале речь шла не о низкой надежности технических средств в настоящем смысле слова. Безотказность и даже ремонтопригодность техники были вполне удовлетворительными, но затраты на восстановительные работы, замену отказавших деталей и различные технические профилактические мероприятия были слишком велики.
По известным источникам, в 1949 г. около 70% всей морской радиоэлектронной аппаратуры США находилось в состоянии ремонта. В конце Второй мировой войны около 60% самолетного оборудования, переброшенного на Дальний Восток, оказалось неисправным, при этом около 50% запасных комплектов и элементов вышли из строя в результате хранения.
В тот период радиосвязное оборудование находилось в неработоспособном состоянии 1/7 всего времени эксплуатации, радиолокационное - 5/6, гидроакустическое - около 1/2 этого времени. Перечисление можно
было бы продолжить для других видов техники, других стран и других периодов времени.
Прошло чуть более четверти века, и мир заговорил о научно-технической революции. Начали создаваться сверхсложные системы в информатике, энергетике, транспорте и в других отраслях народного хозяйства. Причем это были не просто системы, которые характеризовались большим числом входящих в их состав элементов, сложными структурой и алгоритмами функционирования. Это были системы, пронизывающие всю инфраструктуру современного общества на государственном уровне, а это приводило не только к чисто структурному и функциональному их усложнению, но и резкому повышению требований к надежности, живучести и безопасности функционирования.
Этот период развития техники характеризуется уже не только лозунгами о важности проблемы надежности, но и бурным развитием методов обеспечения высокой надежности систем на всех этапах - при проектировании, производстве, испытаниях и эксплуатации.
Действительно, проектирование и реализация сложных технических систем, на создание которых в течение многих лет затрачивались огромные людские и материальные ресурсы, уже невозможно было осуществлять "на глазок". Требовался строгий математический расчет всех технических параметров, включая различные показатели надежности, нужны были обоснованные технико-экономические решения.
При этом, учитывая огромную ответственность задач, решаемых техническими сверхсистемами на уровне национальной экономики, национальной безопасности, порою непредвидимые экономические и морально-политические последствия от возможных ошибок и отказов в этих системах, необходимо было не только обеспечить технические возможности этих систем вообще, но и, что самое главное, сохранить и поддержать работоспособность этих систем в течение очень длительного времени эксплуатации.
Повышение надежности основано на принципе предотвращения неисправностей путем снижения интенсивности отказов и сбоев за счет применения электронных схем и компонентов с высокой и сверхвысокой степенью интеграции, снижения уровня помех, облегченных режимов работы схем, обеспечения тепловых режимов их работы, а также за счет совершенствования методов сборки аппаратуры.
Показатель надежности - количественная характеристика одного или нескольких свойств, составляющих надежность объекта. К показателям надежности относят количественные характеристики надежности, которые вводят согласно правилам статистической теории надежности.
Показатели надежности вводят по отношению к определенным режимам и условиям эксплуатации.
Комплексный показатель надежности - показатель надежности, ха-
растеризующий несколько свойств, составляющих надежность объекта. Примером комплексного показателя надежности служит коэффициент готовности (см. п. 3.1).
Расчетный показатель надежности - показатель надежности, значения которого определяются расчетным методом.
Экспериментальный показатель надежности - показатель надежности, точечная или интервальная оценка которого определяются по данным испытаний.
Универсальной единицей измерения надежности является среднее время наработки на отказ (MTBF - Mean Time Between Failure).
Надежность - комплексное свойство, состоящее в общем случае из безотказности, долговечности, ремонтопригодности и сохраняемости.
Безотказность - свойство объекта непрерывно сохранять работоспособное состояние в течение некоторого времени. Безотказность в той или иной степени свойственна объекту в любом из возможных режимов его существования.
Работоспособное состояние (работоспособность) - состояние объекта, при котором значения всех параметров, характеризующих способность выполнять заданные функции, соответствуют требованиям нормативно-технической и (или) проектной документации.
Долговечность - свойство объекта сохранять работоспособное состояние до наступления предельного состояния при установленной системе технического обслуживания и ремонта.
Ремонтопригодность - свойство объекта, заключающееся в приспособленности к поддержанию и восстановлению работоспособного состояния путем технического обслуживания и ремонта. Термин "ремонтопригодность" традиционно трактуется в широком смысле, он эквивалентен международному термину "поддерживаемость".
Сохраняемость подразумевает под собой возможность хранения объекта в исправном состоянии при отсутствии эксплуатации.
Исправное состояние (исправность) - состояние объекта, при котором он соответствует всем требованиям нормативно-технической и (или) проектной документации.
Неисправное состояние (неисправность) - состояние объекта, при котором он не соответствует хотя бы одному из требований нормативнотехнической и (или) проектной документации.
Работоспособный объект может быть неисправным. Переход объекта из исправного состояния в неисправное работоспособное состояние происходит из-за повреждений.
Под критериями повреждений понимают признаки или совокупность признаков неисправного, но работоспособного состояния объекта.
Таким образом, основные эксплуатационные характеристики системы существенно зависят от удобства ее обслуживания, в частности от ремонтопригодности, контролепригодности и т.д.
Можно привести примеры многих современных технических систем, для которых решение проблемы надежности в самом прямом смысле означает, быть или не быть данной системе. К ним можно отнести различные системы информатики: региональные и отраслевые автоматизированные системы управления, включающие в свой состав большое число ЭВМ, системы управления воздушным движением для гражданской авиации, автоматизированные системы управления технологическими процессами, сеть центров управления и слежения за космическими объектами, сети и системы передачи данных.
Усложнение систем идет в различных направлениях. С одной стороны, в состав технических систем входит все большее число комплектующих элементов.
С другой стороны, усложняется их структура, определяющая соединение отдельных элементов и их взаимодействие в процессе функционирования и поддержания работоспособности. Понятно, что усложнение систем является прямым следствием постоянно возрастающей ответственности выполняемых ими функций, сложности и многообразия этих функций, что, в свою очередь, диктуется прогрессом науки и техники.
При прочих равных условиях система, состоящая из большого числа комплектующих элементов и имеющая более сложную структуру и сложный алгоритм функционирования, является менее надежной по сравнению с более простой системой. Это требует разработки специальных методов обеспечения, повышения и поддержания надежности таких систем, включая разработку математических методов априорных расчетов и экспериментальной оценки.
Инженеры, физики и математики приложили немало совместных усилий для разработки современной теории надежности. Были предприняты гигантские усилия для создания более надежных компонентов, более простых и надежных схем и конструкций, улучшения условий эксплуатации.
Были разработаны соответствующие методы, позволяющие осуществлять анализ и синтез разрабатываемых технических средств на этапе проектирования, проводить обоснованные оценки показателей надежности этих средств во время испытаний и эксплуатации.
Однако проблема надежности продолжает оставаться одной из основных для современной техники. Дело, видимо, объясняется не столько тем, что достигнутая надежность современных технических систем слишком низка, сколько тем, что непрерывно усложняются решаемые задачи и одновременно повышаются требования к надежности их выполнения.

Обслуживаемые и необслуживаемые объекты. Резервирование

Обслуживаемый объект - объект, для которого проведение технического обслуживания предусмотрено нормативно-технической и (или) проектной документацией.
Надежность обслуживаемого объекта возрастает за счет повышения интенсивности устранения неисправностей.
Необслуживаемый объект - объект, для которого проведение технического обслуживания не предусмотрено нормативно-технической и (или) проектной документацией
Пусть, например, имеет место многоканальная система передачи с частотным и временным разделением каналов - сложный комплекс технических средств, включающий в себя оконечную аппаратуру, устанавливаемую на оконечных пунктах (ОП), промежуточную аппаратуру, размещаемую в обслуживаемых (ОУП) или необслуживаемых (НУП) усилительных пунктах, а также линий связи (рис. 1.1).
за того, что в цепи теряется часть энергии передаваемого сигнала. Конкретные электрические параметры цепи и чувствительность приемного устройства определяют допустимую дальность связи. Например, при передаче речи мощность сигнала на выходе микрофона телефонного аппарата Р_пер = 1 мВт, а чувствительность телефона приемного аппарата Р_пр = 0,001 мВт.
Таким образом, максимально допустимое затухание цепи не должно быть больше 3max = 10 Ід(Рпер/ Рпр) = 10 lg(1/0,001) = 30 дБ. Зная затухание a_max и коэффициент затухания на 1 км длины линии связи а, можно определить дальности передачи І = a_max/a.
В системах передачи применяется способ компенсации затухания сигналов повышением мощности сигнала в нескольких равномерно расположенных точках тракта. Часть канала связи между соседними промежуточными усилителями называется усилительным участком.
Изменение уровней сигнала вдоль магистрали описывается диаграммой уровней, приведенной на рис. 1.2.
Аппаратура ОУП и НУП служит не только для усиления аналогового сигнала, но и для коррекции (выравнивания) амплитудно-частотных и фазочастотных характеристик линейного тракта. Аппаратура НРП и ОРП предназначена для восстановления амплитуды, длительности и временного интервала между импульсами сигнала цифровых систем.
Расстояние между НУП (НРП) меняется в широких пределах для различных систем передачи и может составлять от единиц до десятков (иногда сотни) километров. Как правило, НУП (НРП) представляет собой металлическую камеру, имеющую подземную и наземную части. В камере размещаются вводно-коммутационное и усилительное (регенерационное) оборудование.
Аппаратура ОП и ОУП (ОРП) размещается в зданиях, где постоянно находится технический персонал для ее обслуживания.
Резервирование - способ обеспечения надежности объекта за счет использования дополнительных средств и (или) возможностей, избыточных по отношению к минимально необходимым для выполнения требуемых функций. Резервирование используется для достижения заданного уровня надежности сложного объекта при недостаточно надежных компонентах и там, где требуется обеспечить безотказную работу системы при наличии внешних дестабилизирующих факторов (например, в системах управления войсками и оружием).
Для необслуживаемых объектов более выгодным является резервирование на низком уровне. В этом случае с целью обеспечения надежности подвергаются дублированию те компоненты устройства, выход из строя которых во время эксплуатации наиболее вероятен.

Надежность системы и ее элементов.

Методы испытаний надежности систем

Надежность АИС целиком и полностью зависит от надежности входящих в нее компонентов. В простейшем случае для определения вероятности безотказной работы системы, т.е. ее надежности, достаточно воспользоваться теоремой умножения вероятностей. Например, если система содержит два элемента, вероятности безотказной работы которых в течение определенного промежутка времени равны соответственно 0,95 и 0,98, то вероятность безотказной работы системы в течение этого промежутка времени составит 0,950,98 = 0,931. В более сложных случаях для определения надежности системы приходится использовать более сложный математический аппарат, а иногда рассчитать вероятность безотказной работы аналитическими методами просто не представляется возможным.
Тогда для определения надежности автоматизированных систем (АС) проводят испытания.
Испытания АС представляют собой процесс проверки выполнения заданных функций системы, определения и проверки соответствия требованиям технического задания (ТЗ) количественных и (или) качественных характеристик системы, выявления и устранения недостатков в действиях системы, в разработанной документации. Для АС устанавливают следующие основные виды испытаний:
1) предварительные;
2) опытная эксплуатация;
3) приемочные.
От того, какие взаимосвязи в испытываемых в АС объектов, испытания могут быть автономные или комплексные.
Автономные испытания охватывают части АС. Их проводят по мере готовности частей АС к сдаче в опытную эксплуатацию.
Комплексные испытания проводят для групп, взаимосвязанных частей АС или для АС в целом.
Для планирования проведения всех видов испытаний разрабатывают документ "Программа и методика испытаний". Программа и методика испытаний должны устанавливать необходимый и достаточный объем испытаний, обеспечивающий заданную достоверность получаемых результатов. Программа и методика испытаний может разрабатываться на AC в целом,
на части АС. В качестве приложения могут включаться тесты (контрольные примеры).
Предварительные испытания АС проводят для определения ее работоспособности и решения вопроса о возможности приемки AC в опытную эксплуатацию. Предварительные испытания следует выполнять после проведения разработчиком отладки и тестирования поставляемых программных и технических средств системы и представления им соответствующих документов о их готовности к испытаниям, а также после ознакомления персонала АС с эксплуатационной документацией.
Опытную эксплуатацию АС проводят с целью определения фактических значений количественных и качественных характеристик АС и готовности персонала к работе в условиях функционирования АС, определения фактической эффективности АС, корректировки (при необходимости) документации.
Приемочные испытания АС проводят для определения соответствия АС техническому заданию, оценки качества опытной эксплуатации и решения вопроса о возможности приемки АС в постоянную эксплуатацию. Приемочным испытаниям АС должна предшествовать ее опытная эксплуатация на объекте.
В зависимости от вида требований, предъявляемых к АС на испытаниях, проверке или аттестации в ней подвергают:
1) комплекс программных и технических средств;
2) персонал;
3) эксплуатационную документацию, регламентирующую деятельность персонала при функционировании АС;
4) АС в целом.
При испытаниях АС проверяют:
1) качество выполнения комплексом программных и технических средств автоматических функций во всех режимах функционирования АС согласно ТЗ на создание АС;
2) знание персоналом эксплуатационной документации и наличие у него навыков, необходимых для выполнения установленных функций во всех режимах функционирования АС согласно ТЗ на создание АС;
3) полноту содержащихся в эксплуатационной документации указаний персоналу по выполнению им функций во всех режимах функционирования АС согласно ТЗ на создание АС;
4) количественные и (или) качественные характеристики выполнения автоматических и автоматизированных функций АС в соответствии с ТЗ;
5) другие свойства АС, которым она должна соответствовать по ТЗ.
Испытания АС следует проводить на объекте заказчика. По согласованию между заказчиком и разработчиком предварительные испытания и
приемку программных средств АС допускается проводить на технических средствах разработчика при создании условий получения достоверных результатов испытаний.
Допускается последовательное проведение испытаний и сдача частей АС в опытную и постоянную эксплуатацию при соблюдении установленной в ТЗ очередности ввода АС в действие.
Автономные испытания АС следует проводить в соответствии с программой и методикой автономных испытаний, разрабатываемых для каждой части АС. В программе автономных испытаний указывают:
1) перечень функций, подлежащих испытаниям;
2) описание взаимосвязей объекта испытаний с другими частями АС;
3) условия, порядок и методы проведения испытаний и обработки результатов;
4) критерии приемки частей по результатам испытаний.
К программе автономных испытаний следует прилагать график проведения автономных испытаний. Подготовленные и согласованные тесты (контрольные примеры) на этапе автономных испытаний должны обеспечить:
1) полную проверку функций и процедур по перечню, согласованному с заказчиком;
2) необходимую точность вычислений, установленную в ТЗ;
3) проверку основных временных характеристик функционирования программных средств (в тех случаях, когда это является существенным);
4) проверку надежности и устойчивости функционирования программных и технических средств.
В качестве исходной информации для теста рекомендуется использовать фрагмент реальной информации организации-заказчика в объеме, достаточном для обеспечения необходимой достоверности испытаний. Результаты автономных испытаний частей АС следует фиксировать в протоколах испытаний. Протокол должен содержать заключение о возможности (невозможности) допуска части АС к комплексным испытаниям.
В случае если проведенные автономные испытания будут признаны недостаточными, либо будет выявлено нарушение требований регламентирующих документов по составу или содержанию документации, указанная часть АС может быть возвращена на доработку и назначен новый срок испытаний.
Комплексные испытания АС проводят путем выполнения комплексных тестов. Результаты испытаний отражают в протоколе.
Работу завершают оформлением акта приемки в опытную эксплуатацию. В программе комплексных испытаний АС или частей АС указывают:
1) перечень объектов испытания;
2) состав предъявляемой документации;
3) описание проверяемых взаимосвязей между объектами испытаний;
4) очередность испытаний частей АС;
5) порядок и методы испытаний, в том числе состав программных средств и оборудования, необходимых для проведения испытаний, включая специальные стенды и полигоны.
Для проведения комплексных испытаний должны быть представлены:
1) программа комплексных испытаний;
2) заключение по автономным испытаниям соответствующих частей АС и устранение ошибок и замечаний, выявленных при автономных испытаниях;
3) комплексные тесты;
4) программные и технические средства и соответствующая им эксплуатационная документация.
При комплексных испытаниях допускается использовать в качестве исходной информацию, полученную на автономных испытаниях частей АС. Комплексный тест должен:
1) быть логически увязанным;
2) обеспечивать проверку выполнения функций частей АС во всех режимах функционирования, установленных в ТЗ на АС, в том числе всех связей между ними;
3) обеспечивать проверку реакции системы на некорректную информацию и аварийные ситуации.
Протокол комплексных испытаний должен содержать заключение о возможности (невозможности) приемки АС в опытную эксплуатацию, а также перечень необходимых доработок и рекомендуемые сроки их выполнения. После устранения недостатков проводят повторные комплексные испытания в необходимом объеме.
Опытную эксплуатацию проводят в соответствии с программой, в которой указывают:
1) условия и порядок функционирования частей АС и АС в целом;
2) продолжительность опытной эксплуатации, достаточную для проверки правильности функционирования АС при выполнении каждой функции системы и готовности персонала к работе в условиях функционирования АС;
3) порядок устранения недостатков, выявленных в процессе опытной эксплуатации.
Во время опытной эксплуатации АС ведут рабочий журнал, в который заносят сведения о продолжительности функционирования АС, отказах, сбоях, аварийных ситуациях, изменениях параметров объекта автоматизации, проводимых корректировках документации и программных средств, наладке технических средств. Сведения фиксируют в журнале с указанием даты и ответственного лица. В журнал могут быть занесены замечания
персонала по удобству эксплуатации АС. По результатам опытной эксплуатации принимают решение о возможности (или невозможности) предъявления частей АС и системы в целом на приемочные испытания.
Работа завершается оформлением акта об окончании опытной эксплуатации и допуске системы к приемочным испытаниям.
Приемочные испытания проводят в соответствии с программой, в которой указывают:
1) перечень объектов, выделенных в системе для испытаний, и перечень требований, которым должны соответствовать объекты (со ссылкой на пункты ТЗ);
2) критерии приемки системы и ее частей;
3) условия и сроки проведения испытаний;
4) средства для проведения испытаний;
5) фамилии лиц, ответственных за проведение испытаний;
6) методику испытаний и обработки их результатов;
7) перечень оформляемой документации.
Для проведения приемочных испытаний должна быть предъявлена следующая документация:
1) техническое задание на создание АС;
2) акт приемки в опытную эксплуатацию;
3) рабочие журналы опытной эксплуатации;
4) акт завершения опытной эксплуатации и допуска АС к приемочным испытаниям;
5) программа и методика испытаний.
Приемочные испытания следует проводить на функционирующем объекте. В первую очередь они должны включать проверку:
1) полноты и качества реализации функций при штатных, предельных, критических значениях параметров объекта автоматизации и в других условиях функционирования АС, указанных в ТЗ;
2) выполнения каждого требования, относящегося к интерфейсу системы;
3) работы персонала в диалоговом режиме;
4) средств и методов восстановления работоспособности АС после отказов;
5) комплектности и качества эксплуатационной документации.
Проверку полноты и качества выполнения функций АС рекомендуется
проводить в два этапа. На первом этапе проводят испытания отдельных функций (задач, комплексов задач). При этом проверяют выполнение требований ТЗ к функциям (задачам, комплексам задач).
На втором этапе проводят проверку взаимодействия задач в системе и выполнение требований ТЗ к системе в целом. По согласованию с заказчиком проверка задач в
зависимости от их специфики может проводиться автономно или в составе комплекса. Объединение задач при проверке в комплексах целесообразно проводить с учетом общности используемой информации и внутренних связей.
Проверку работы персонала в диалоговом режиме проводят с учетом полноты и качества выполнения функций системы в целом.
Проверке подлежат:
1) полнота сообщений, директив, запросов, доступных оператору, и их достаточность для эксплуатации системы;

Анализ и контроль покупных и повторно используемых компонентов

технические (метрологические, технологические, конструкторские);
- экономические (финансовые, нормативные, материальные);
- социальные (организационные, правовые, кадровые).
Комплексное использование всех этих факторов и их компонентов -
основное условие успешного функционирования системы управления качеством продукции. Этот опыт обобщен в серии международных стандартов ISO 9000, на основе которых издана серия отечественных стандартов ГОСТ 40.9000.
В соответствии с этими стандартами существует тесная связь стадий жизненного цикла и качества. Это отражается в так называемой петле качества (рис.
5.5).
Под уровнем качества изделия понимаются относительные характеристики качества (или его обобщенная характеристика) по сравнению с со- Маркетинговые
исследования
Утилизация
изделия
Техпомощь и обслуживание
Монтаж и эксплуатация
Реализация и распределение методы количественной обработки качественных экспертных оценок. Разработка требований к надежности АИС и показателям качества АИС на этапе системного анализа проекта проводится в основном с использованием моделей экспертных оценок.
Экспертная система качества - программная система, которая использует экспертные знания и модели экспертных оценок для обеспечения высокоэффективного решения задач в предметной области управления качеством. При разработке экспертных систем качества широко используются методы, наработанные в исследованиях по искусственному интеллекту.
Типовая схема оценки уровня качества изделия приведена на рис. 5.6.
безотказность (свойство изделия сохранять работоспособность в течение некоторого времени наработки без вынужденных перерывов);
- долговечность (свойство изделия сохранять работоспособность до
предельного состояния с необходимыми перерывами для технического обслуживания);
- сохраняемость (свойство изделия сохранять обусловленные эксплуатационные показатели в течение и после срока хранения и транспортировки).
Показатели надежности, по существу, дополняют характеристику технического эффекта, так как предопределяют длительность и вероятность или полноту появления этого эффекта при эксплуатации изделия. Например, суммарный эффект Э от изделия у потребителя за срок службы Т_сл (в годах) при годовом эффекте в случае безотказной работы Эг составит
Э = ЭгТ_слК_эф,
где К_эф - коэффициент сохраняемости, учитывающий степень безотказности изделия в эксплуатации.
Таким образом, надежность изделия - это свойство, безусловно, одно из важнейших для него на всех этапах его жизненного цикла (кроме утилизации). С другой стороны, оно имеет четкую технико-экономическую природу. Необходимая надежность конкретного изделия определяется его назначением, и мера надежности - одна из тех характеристик, за которую платит потребитель.
В то же время обеспечение необходимого уровня надежности может быть решено многими техническими приемами, реализация каждого из которых требует определенных затрат. В такой постановке возникает задача технико-экономической оптимизации надежности изделия и затрат на ее обеспечение.
Критерием выбора оптимального решения при определении уровня надежности изделия служит минимум суммы приведенных затрат в комплексе "изделие-потребители-смежные звенья":
Е_нXК + ХС ® min’
j j
где j - число объектов комплекса, по которым инвестиции (K) или (и) текущие затраты (С) различны в зависимости от вариантов выполнения изделия;
Е_н - внутренний темп окупаемости инвестиций.
Это выражение равносильно следующему:
Е_НКо + С + У_тс + У_п + У_а ® min,
где К₀ - капитальные затраты на повышение надежности (снижение вероятности отказов) изделия;
С0 - текущие затраты на повышение надежности;
У_тс - годовой ущерб от отказов изделия у потребителя (ремонт, обслуживание);
У_п - годовой ущерб в основной деятельности потребителя от отказов изделия;
У_сз - годовой ущерб в смежных звеньях от отказов изделия.
Предположим, таким изделием является генератор электроэнергии, поставляемый фирмой для районных электростанций. При его отказах потребителю наносится ущерб не только из-за дополнительного обслуживания и ремонта генератора, но и из-за снижения качества продукции (напряжение, частота в электросетях), недовыпуска продукции, непроизводительного расхода ресурсов при простое, необходимости иметь резервное оборудование и дополнительные запасы. В свою очередь ущерб в смежных звеньях (у потребителей электроэнергии) может быть особенно велик (им необходимо иметь соответствующие средства защиты, аварийное автономное резервное питание, запас предметов труда и т.д.). Типичная ситуация отображена на графиках (рис.
5.7). Предположим, что в исходном варианте изделия показатели его надежности были на уровне Н,, а цена потребления изделия (инвестиции в него и текущие расходы) была З_п1. Изготовителем разработан модифицированный вариант изделия с повышенной надежностью H_opt, но цена его потребления З_п._0| З_п1.
В отраженной на графике рис. 5.7 ситуации потребителю изделия будет выгодно заплатить большую сумму за изделие с повышенной надежностью, так как при этом цена потребления изделия за
вычетом суммы ущерба от отказов изделия будет минимальной. Дальнейшее повышение надежности и, следовательно, цены изделия будет невыгодно потребителю. Задача производителя изделия состоит в таком проектировании модифицированного изделия и организации его производства, чтобы обеспечить привлекательную для фирмы-изготовителя норму прибыли.
Таким образом, мы еще раз убеждаемся в том, что изготовитель должен системно подойти к ценообразованию на продукцию, изучив экономические характеристики эксплуатации изделия потребителем.
Технически возможны различные методы повышения надежности изделия:
- применение более прочных материалов с более высокими нагрузочными характеристиками, изменение конструктивных решений;
- поэлементное или поканальное резервирование;
- повышение схемной надежности;
- совершенствование технологии изготовления;
- совершенствование системы ремонтов, обслуживания и эксплуатации.
По каждому из этих вариантов технологических решений должны быть
рассчитаны затраты, а далее целесообразно построить диаграммы "затраты-надежность", аналогичные приведенным на рис. 5.7.
Анализ таких диаграмм позволяет принять решение о методах реализации экономически оптимальной надежности изделия.
Определение потребности в новой системе в значительной степени является творческой задачей, и аналитические методы на этом этапе системотехнических работ носят вспомогательный характер.
Системотехника - научное направление, использующее методы системного анализа для создания, испытания и эксплуатации сложных технических и организационно-технических систем.

Анализ и контроль покупных и повторно используемых компонентов (ПИК). Комплексные испытания АИС

Единичному и мелкосерийному производству изделий, каким зачастую является производство АИС, свойственны особенности, существенно влияющие на качество выпускаемой продукции. К таким особенностям можно отнести частую переналадку технологического оборудования, обусловленную изменением номенклатуры выпускаемых изделий и перерывами в производстве, что в свою очередь приводит к консервации и расконсервации этого оборудования; частичную потерю навыков и квалификации производственного персонала, нестабильность производственных условий; нерентабельность производства из-за больших затрат на требуемые испытания и т.д.
В составе нового комплекса стандартов разработан стандарт ГОСТ РВ 20.57.418-98 (срок введения с 1 июля 1999 г.), в котором установлены дополнительные к регламентированным действующими стандартами требования к обеспечению, контролю качества и правилам приемки, например электрорадиоизделий для указанных "неординарных" условий производства.
На стадии разработки изделий должны быть проработаны вопросы обеспечения качества составляющих конструктивных элементов, узлов изделий. Поэтому выделяются критичные конструктивные элементы, для которых определяются информативные параметры, соответствие которых установленным критериям свидетельствует о сохранении требуемых свойств изделия. Разрабатываются и опробоваются методики контроля информативных параметров. Учитывая, что создать полностью управляемый технологический процесс невозможно, остаются слабо или практически не управляемые технологические операции, на которых высока вероятность возникновения дефектов.
Поэтому после таких операций необходимы расширенный диагностический неразрушающий контроль и отбраковочные испытания с жесткими критериями забракования.
Рекомендуется также создание необходимых конструктивно-технологических и производственных запасов по параметрам, установленным в конструкторской и технологической документации соответственно.
На стадии производства целесообразно больше внимание уделить вопросам обеспечения качества в ходе технологического процесса, включая вопросы оптимизации организации производства, а также усилению входного контроля покупных материалов, полуфабрикатов и повторно используемых компонентов; дополнительному инструктажу и аттестации производственного персонала; усилению контроля технологической дисциплины со стороны службы контроля качества и представителя заказчика; внеочередной аттестации испытательного оборудования, технологического процесса по точности и настроенности. В самом технологическом процессе необходимо расширить состав и ужесточить критерии операционного контроля и статистического регулирования технического процесса; ввести дополнительные контрольные операции со стороны ОТК и представителя заказчика, включая сплошной контроль информативных параметров, инспекционный контроль за отбраковочными испытаниями и проведением диагностического неразрушающего контроля.
Целесообразно дополнительно проводить ускоренные испытания на надежность критичных конструктивных элементов, проверку сохранения конструктивно-технологических и производственных запасов по параметрам. Следует расширить объем информации о результатах контроля, вносимой в сопроводительные листы изготавливаемой партии изделий, с целью ее анализа и выработки, а при необходимости давать рекомендации по проведению корректирующих воз-
действий для последующих партий изделий аналогичных типов.
После длительного перерыва в производстве изделий необходимо провести дополнительные мероприятия по обеспечению готовности производства к нормальному функционированию, в том числе:
- ремонтные и пусконаладочные работы;
- оценку технического состояния средств технологического оснащения;
- внеочередную аттестацию испытательного оборудования, технологического процесса по точности и настроенности;
-дополнительный инструктаж и (или) аттестацию производственного персонала;
- инспекционный контроль или сертификацию системы качества.
В связи с уменьшением объема выпуска возникают ситуации, когда объем выборок для полноценных испытаний становится сопоставимым с объемом годового выпуска изделий. Бывают случаи заказа изделий небольшими партиями, изготавливаемыми на заводах в течение месяца или квартала. В этих случаях целесообразно сокращать объем периодических испытаний с одновременным ужесточением приемо-сдаточных испытаний путем введения:
- сплошного контроля при проведении неразрушающих видов испытаний;
- усиленных планов выборочного контроля;
- кратковременных механических, климатических испытаний, испытаний на безотказность в течение 48, 96 или 168 ч;
- контроля параметров, отнесенных в ТУ к категории периодических испытаний;
- контроля дополнительных параметров-критериев годности в процессе и в конце механических, климатических испытаний и испытаний на безотказность, в том числе контроля информативных параметров.
В соответствии с требованиями ГОСТ РВ 20.57.418 в зависимости от характера производства допускается существенно изменять состав и объем периодических испытаний.
Для изделий единичного и мелкосерийного производства допускается для проведения определенных подгрупп испытаний включать типы изделий, выпускаемых по разным ТУ, имеющих однотипную конструкцию, близкие технологии и применяемые материалы. При этом оценку результатов испытаний распространяют на все типы изделий, входящих в единую конструктивно-технологическую группу. При получении отрицательных результатов испытаний смешанной выборки допускается проводить испытания отдельно на каждом из типов изделий, входящих в конструктивно-технологическую группу, по правилам первичных испытаний.
Приемку и отгрузку в этом случае производят по положительным результатам испытаний.
Для изделий единичного неритмичного и прерывистого производства в состав периодических испытаний не включают виды испытаний, которыми контролируют требования, подтвержденные контролем информативных параметров.
Испытания проводят на одной укрупненной подгруппе, объединяющей механические, климатические и конструктивные испытания, или последовательно по каждой из этих групп на одной выборке изделий. При испытаниях применяют фиксированные одноступенчатые планы контроля при минимальном объеме выборки с приемочным числом, равным нулю.
Приемку и отгрузку изделий осуществляют по результатам приемо-сдаточных и периодических испытаний соответственно.
Для изделий узкоцелевого применения, предназначенных для конкретной аппаратуры, допускается не проводить отдельных видов испытаний при условии осуществления подконтрольной эксплуатации со стороны предприятия-изготовителя таких изделий. Для изделий мелкосерийного неритмичного и прерывистого производства допускается также увеличивать периодичность испытаний, сохраняя при этом планы контроля в соответствии с ТУ.
После перерыва производства более чем на 9 месяцев (если иного не установлено в ОТУ) все основные виды периодических испытаний проводятся на первых партиях.
Типовые испытания осуществляют для изделий прерывистого производства, если за период перерыва произошли существенные изменения в области применяемых материалов, технологического оборудования, условий производства, технологических сред, а также при существенном снижении качества. В их состав включают те виды испытаний, которые не проведены при очередных периодических испытаниях, а также испытания из состава квалификационных.
Представляется, что регламентированный стандартом ГОСТ РВ 20.57.418 порядок сокращения объема разрушающих и дорогостоящих испытаний готовых изделий при усилении мер по обеспечению качества в процессе разработки и производства позволит сократить затраты на приемку изделий, выпускаемых в условиях единичного и мелкосерийного производства, с сохранением достигнутого уровня качества.

Организация эксплуатационного обслуживания АИС

Любая АИС в процессе работы требует эксплуатационного обслуживания. Как правило, комплексное эксплуатационное обслуживание включает в себя:
- настройку и регламентное эксплуатационное обслуживание на объек-
тах программно-технических комплексов автоматизированных информационных систем;
- инсталляцию, настройку и обслуживание системного, инструментального и прикладного программного обеспечения АИС;
- выбор методов и средств измерения эксплуатационных характеристик и функциональных подсистем АИС;
- анализ эксплуатационных характеристик АИС с целью выработки требований по их модификации.
Как показывает статистика, на эксплуатационное обслуживание вычислительной техники в Англии ежегодно расходуется 1,6 млрд. фунтов стерлингов. Развивающейся при этом тенденцией является обеспечение обслуживания не основными производителями и поставщиками вычислительной техники, а фирмами, специализирующимися только на обслуживании. Так, доля универсальных специализированных фирм, обслуживающих самую разнообразную и разнотипную вычислительную технику, составляет сейчас 10% в общем объеме эксплуатационного обслуживания ЭВМ. К числу преимуществ такой формы обслуживания относят повышение качества и оперативности ремонта, сокращение расходов, а также численности обслуживающего персонала.
Так, фирма "Бритойл" (отделение фирмы "Бритиш петролеум", Глазго), располагающая 1300 ЭВМ и сопутствующей периферийной аппаратурой 30 различных поставщиков, привлекла к их обслуживанию фирмы "АТМ". В результате уменьшились расходы на обслуживание, упростилось управление им, а вместо командируемых ремонтных бригад в составе 10-15 инженеров на предприятие направлен один инженер-ремонтник, находящийся там постоянно. Со своей стороны основные поставщики стремятся заключать контакты на ремонт и обслуживание всей вычислительной техники данного предприятия или организации, преследуя, в частности, небескорыстную цель продажи им только своей продукции.
Они также пытаются мешать деятельности специализированных эксплуатационных фирм, не продавая им запасных частей и документацию на свою вычислительную технику или не давая им доступа к своему специализированному испытательно-диагностическому оборудованию и специальному программному обеспечению.
Тем не менее эксплуатационные и сервисные фирмы успешно работают благодаря оперативности и более высокому качеству выполнения ремонтно-профилактических работ. Например, в типовом контракте с эксплуатационной фирмой оговаривается требование принятия мер по отказам и неисправностям вычислительной техники в течение не более чем четырех часов, а при необеспечении ремонта на месте предусматривается замена отказавшего блока или устройства (клавиатуры, носителя на магнитных дисках и т.п.) с его эвакуацией для ремонта в специальных мастерских.
Практика эксплуатационного обслуживания показывает, что наиболее ненадежными являются не сами ЭВМ, а периферийная аппаратура, имеющая движущиеся части и компоненты. Так, чаще всего выходят из строя печатающие аппараты, причем 20% отказов происходит из-за неумелого или небрежного обращения, в том числе из-за проливания кофе на клавиатуры. Наряду с этим отмечается устойчивая тенденция повышения надежности работы вычислительной техники. Например, хотя расходы на ее эксплуатационное обслуживание возрастают ежегодно на 10%, это ниже роста общих расходов на компьютерный сервис.
Фирма "АТМ" составила и непрерывно ведет специальную таблицу со статистическими данными о надежности вычислительной техники разных поставщиков. Эта таблица используется в частном порядке для консультаций, в том числе фирмой "Бри-тойл", которая в результате прекратила закупки одного из графических видеоиндикаторов в силу его низкой отказоустойчивости.
Фирма "Харуэлл компьютер пауэр" разработала комплект машинных программ "Статус IQ" для оперативного поиска и вывода информации из базовых массивов данных. В отличие от существующих средств аналогичного назначения вместо ключевых слов в новых программах поиск производится путем постановки вопросов на обычном английском языке.
Так, в вопросе "Какие стандарты по выхлопным газам распространяются на контроль загрязнения среды, создаваемого автотранспортом на шоссе М6?", выделяются такие отправные понятия, как "стандарты на выхлопные газы", "контроль", "загрязнение среды" и "автотранспорт", с помощью которых в базовом массиве ищется относящаяся к делу информация. Вывод последней осуществляется в порядке наиболее вероятного правдоподобия.

ЗАДАНИЯ ДЛЯ САМОСТОЯТЕЛЬНОЙ РАБОТЫ

1. Составьте логическую схему базы знаний по теме юниты.
2. Перечислите основные виды испытаний для автоматизированных систем:
1)
2)
3)
3. Перечислите общие требования для построения математических моделей:
1)
2)
3)
4)
5)
6)
4. Запишите формулу нормального закона изменения вероятности отказов P(t), или распределение Гаусса (для постепенных отказов).
5. Перечислите способы описания конечных автоматов:
1)
2)

ТРЕНИНГУМЕНИЙ

Пример выполнения упражнения тренинга на умение 1

Задание
Построить и проанализировать диаграмму состояний конечного автомата, заданного следующей таблицей переходов:

Текущее состояние	Следующее состояние	Выход
	Вход	Вход
	j	0	1	f	0	1
So		S2	So		1	0
Si		Si	S2		0	1
So		So	S2		0	1

Решение
(пример выполнения задания)
i недостижимо, если автомат начинает работу из состояния s₀ или S2.
Выполните самостоятельно следующие задания:
Задание 1.1
Построить и проанализировать диаграмму состояний конечного автомата, заданного следующей таблицей переходов:

Текущее состояние	Следующее состояние	Выход
	Вход	Вход
	j	0	1	f	0	i
So		S2	So		0	i
Si		Si	So		0	i
S2		Si	Si		0	i

Задание 1.2
Построить и проанализировать диаграмму состояний конечного автомата, заданного следующей таблицей переходов:

Текущее состояние	Следующее состояние	Выход
	Вход	Вход
	j	0	1	f	0	1
So		S2	So		0	1
S		S3	So		1	1
S2		Si	S3		0	1
S3		Si	S2		1	0

Задание 1.3
Построить и проанализировать диаграмму состояний конечного автомата, заданного следующей таблицей переходов:

Текущее состояние	Следующее состояние	Выход
	Вход	Вход
	j	0	1	f	0	1
So		Si	So		0	1
Si		S3	So		1	0
S2		S4	S3		1	0
S3		Si	S4		1	1
S4		So	S2		0	1

Пример выполнения упражнения тренинга на умение 2

Задание
Определить коэффициент экономической эффективности внедряемой АИС при заданных начальных условиях:
С_ти - затраты на теоретические исследования;
С_пр - затраты на разработку программ и программной документации;
С_мч - стоимость одного машинного часа работы ЭВМ, у.е./ч.;
t_Mp - машинное время решения задачи, ч.;
С_зп - заработная плата программиста в единицу времени, у.е./ч.;
t_npoz.p - время программиста, затрачиваемое на решение задачи с помощью ЭВМ, ч;
С_кос - накладные (косвенные) расходы;
С_сс - затраты на социальное страхование;
С? и Ср_н - соответственно затраты на базовое решение задачи базовым и новым способом;
Vs и ?_н - частота решения задачи соответственно базовым и новым способом.
Решение
(пример выполнения задания)

п/п	Алгоритм	Конкретное соответствие данной ситуации предложенному алгоритму
1.	Определение единовременных затрат	Единовременные затраты на разработку и внедрение новых методов решения задачи включают: Км = Сти + Спр
2.	Определение суммы затрат на решение поставленной задачи с помощью новой АИС	Стоимость разового решения задачи определяется из следующего соотношения: Ср = С t + С t + С + С Смч1мрг Сзп1прог.р ' СкосГ Ссс
3.	Определение снижения издержек при решении задачи новым способом по сравнению со старым способом	Экономический эффект определяется по следующей формуле: Э = Ср?₅- СрПн
4.	Определение коэффициента экономической эффективности	Критерий оценки экономической эффективности внедрения новых методов решения задач определяется из соотношения: Кэ = Км

Выполните самостоятельно следующие задания:
Задание 2.1
Определить коэффициент экономической эффективности внедряемой АИС при заданных начальных условиях:
С_ти = 2000 у.е.; С_пр = 900 у.е.; С_мч = 2 У-е./ч .; t_Mp = 0,5 ч.;
С_зп = 10 у.е./ч.;
tnpos.p = 0 ,5 ч.;
Скос = 90 у-е.; С_сс = 70 у.е.;
С = 80 у.е.; Срр = 50 у.е.; ?_р = 100;
Пн = 10.
Задание 2.2
Определить коэффициент экономической эффективности внедряемой АИС при заданных начальных условиях:
С_кос = 70 у-е.; С₀₀ = 60 у.е.; Ср₈ = 25 у.е.; Ср_н = 23 у.е.; v_d = 100;
?н = 150.
С_ти = 3000 у.е.; С_пр = 10000 у.е.;
С_мч = 3 у-е./ч.;
К,р = 0,7 ч.;
С_зп = 11 у.е./ч.;
Ьірог.р = 0,6 ч.;

Имитационное моделирование надежности

Конечный автомат "в чистом виде" - это математическая модель устройства с конечной памятью, преобразующего дискретную информацию. Конечный автомат является одним из важнейших видов управляющих систем.
Содержательно конечный автомат можно охарактеризовать как устройство, имеющее входной и выходной каналы и находящееся в каждый из моментов дискретного времени, называемых тактовыми моментами, в одном из состояний. По входному каналу в каждый тактовый момент в устройство поступают сигналы a - буквы входного алфавита A; в те же моменты по выходному каналу устройство выдает сигналы b - буквы выходного алфавита B, причем b определяется состоянием s из алфавита состояний S и буквой а; внутреннее состояние яСв следующий тактовый момент также определяется состоянием s и буквой а из предыдущего момента. Таким образом, для некоторых функций j и f имеет место:
b = j (a,s), sC= f(a,s).
Эти функции называются соответственно выходной и переходной функциями; они определяют закон "переработки" слов в алфавите A, подаваемых побуквенно на входной канал устройства при условии задания начального состояния устройства.
Полное описание конечного автомата - описание, при котором функции перехода и выхода всюду определены.
Для конечных автоматов предполагается конечность алфавитов A, S, B. Если считать указанную "переработку" слов главной характеристикой устройства, то его можно отождествить с набором (A, S, B, j, f), который и называют конечным автоматом. Для этой формы описания конечного автомата характерно отношение исследователя к устройству как внешнего наблюдателя.
Само задание конечного автомата называется при этом абстрактным конечным автоматом. В случае, когда устройство рассматривается с учетом того, что оно собрано по некоторым композиционным правилам из абстрактных конечных автоматов, приходят к понятию структурного конечного автомата, который в итоге также реализует некоторый абстрактный конечный автомат.
Автомат вообще (от греческого automatoz - самодействующий) - управляющая система, являющаяся конечным автоматом или некоторой его модификацией, полученной путем изменения его компонентов или функционирования. Основное понятие - конечный автомат - возникло в середине XX в. в связи с попытками описать на математическом языке функционирование нервных систем, универсальных вычислительных машин и других реальных автоматов.
Характерной особенностью такого описания является дискретность соответствующих математических моделей и конечность областей значений их параметров, что приводит к понятию конечного автомата.
Наряду с понятием конечного автомата рассматриваются различные его обобщения и модификации, отражающие те или иные особенности реальных устройств. Для конечного автомата (A, S, B, j, f) существующие модификации можно разбить на следующие три основные группы.
К первой группе относятся автоматы, у которых некоторые из алфавитов A (входной), S (состояний) или B (выходной) бесконечны, в связи с чем такие автоматы называются бесконечными. Ко второй группе относятся автоматы, у которых вместо выходной и переходной функций j и f допускаются произвольные отношения или случайные функции. Таковы частичные, недетерминированные, вероятностные и другие автоматы. К третьей группе относятся автоматы со специфическими множествами входных объектов.
Таковы, например, автоматы с переменной структурой. Существуют автоматы, принадлежащие одновременно разным группам. Наряду с этим большую роль играют специальные подклассы конечных автоматов, например, автоматы без памяти. Кроме того, использование понятий и методов из других разделов математики также приводит к появлению специфических классов автоматов и связанных с ними задач.
Например, при применении алгебраических средств возникают понятия автоматов: линейного, группового, свободного и других автоматов; вопросы теории кодирования порождают понятия самонастраивающихся, обратимых автоматов и других.
Пример. Рассмотрим следующий конкретный конечный автомат M = [A, S, B, j, f]. Входной алфавит A = {0, 1}; выходной алфавит B = {0, 1}; три внутренних состояния S = {s₀, s₁, s₂}; функции выхода и перехода задаются предписаниями:

ф:	f:
(so, 0) a si	(so, 0) a 0
(so, 1) a so	(so, 1) a 1
(si, 0) a s2	(si, 0) a 1
(si, 1) a si	(s1, 1) a 0
(s2, 0) a so	(s2, 0) a 1
(s2, 1) a s2	(s2, 1) a 0

Подадим на вход последовательность 0, 1, 0, 1. Если автомат находился сначала в состоянии s₀, то, прочитав первый символ 0, он перейдет в состояние s₁ и напечатает 0. Прочитав затем 1, он останется в состоянии s₁ и напечатает 0. Прочитав следующий 0, он перейдет в состояние s₂ и напечатает 1. Наконец, прочитав последний символ 1, автомат закончит
работу в состоянии s₂, имея на выходной ленте последовательность 0, 0, 1, О.Таким образом, автомат преобразовал вход 0, 1,0, 1 (или, короче, 0101) в 0, 0, 1, 0 (или 0010).
Есть два удобных способа описать этот автомат. Прежде всего можно построить диаграмму состояния автомата - описание конечного автомата с помощью помеченного ориентированного графа (рис.
2.3) - орграфа.
Вершины этого орграфа помечены символами, обозначающими внутренние состояния. Каждая дуга помечена парой символов a, b, где a - входной символ, вызывающий переход в следующее состояние, отвечающее этому ребру, а b - выходной символ, который автомат выпечатывает. таблица состояний и табличное представление функций j и f (табл. 1):

Таблица 1

Текущее состояние	Следующее состояние	Выход
	Вход	Вход
	j	0	1	f	0	1
So		Si	So		0	1
S		S2	Si		1	0
S		So	S2		1	0

Оба способа имеют свои преимущества и недостатки. Таблица обычно удобнее при вычислениях, диаграмма нагляднее. Например, по диаграмме легче обнаружить состояния, недостижимые из других состояний. На следующем рис. 2.4 показана диаграмма состояний автомата, у которого состояние s, недостижимо, если автомат начинает работу из состояния s₀или s₂: 0,0 1,1
это раздел теории управляющих систем, изучающий математические модели преобразователей дискретной информации, называемых автоматами. С определенной точки зрения такими преобразователями являются как реальные устройства (вычислительные машины, автоматы, живые организмы и т.д.), так и абстрактные системы (например, формальная система, аксиоматические теории и т.д.). Наиболее тесно теория автоматов связана с теорией алгоритмов.
Большинство задач теории автоматов - общие для основных видов управляющих систем. К ним относятся задачи анализа и синтеза автоматов, задачи полноты, минимизации, эквивалентных преобразований автоматов и другие. Задача анализа состоит в том, чтобы по заданному автомату описать его поведение или по неполным данным об автомате и его функционированию установить те или иные его свойства. Задача синтеза автоматов состоит в построении автомата с наперед заданным поведением или функционированием. Задача полноты состоит в выяснении, обладает ли подмножество МФавтоматов свойством полноты, т.е. совпадает ли с М множество всех автоматов, которые получаются путем конечного числа применений некоторых операций к автоматам из заданного подмножества автоматов МФ Задача эквивалентных преобразований в общем виде состоит в том, чтобы найти систему правил преобразований (так называемую полную систему правил) автоматов, которые удовлетворяют опреде-
ленным условиям и позволяют преобразовать произвольный автомат в любой эквивалентный ему автомат (два автомата эквивалентны, если они имеют одинаковое поведение автомата. Поведение автомата - математическое понятие, описывающее взаимодействие автомата с внешней средой. Примером внешней среды конечного автомата является множество входных слов, а поведением - словарная функция, реализуемая автоматом, или событие, представимое автоматом).
Помимо перечисленных, в теории автоматов имеются специфические проблемы, характерные для автоматов. Так, в зависимости от условий задачи поведение автомата удобно задавать на разных языках, в связи с чем важными являются выбор достаточно удобного адекватного языка и перевод с одного языка на другой. В тесной связи с задачами синтеза и эквивалентных преобразований находится задача минимизации числа состояний автомата, а также получение соответствующих оценок. Близкий круг вопросов возникает в связи с моделированием поведения автоматов одного класса с автоматами другого класса. Здесь также представляют интерес вопросы минимизации моделирующих автоматов и оценки их сложности. Специальный раздел теории автоматов связан с так называемыми экспериментами с автоматами (т.е. способами получения информации о внутренней структуре автоматов по их поведению). Основная задача здесь состоит в том, чтобы получить определенные сведения о строении автомата путем наблюдения за его реакцией на те или иные внешние воздействия. При этом возникает большой круг задач, связанный с классификацией экспериментов и с вопросами разрешимости задач определенными видами экспериментов, а также с оценками длин минимальных экспериментов, достаточных для решения тех или иных задач. Понятие эксперимента с автоматами используется также в задачах надежности управляющих систем и их контроля, в частности автоматов.
Модель надежности на основе конечных автоматов - модель работоспособных состояний объекта, основанная на описании и (или) диаграмме состояния конечного автомата. Многие из перечисленных выше задач могут рассматриваться как алгоритмические проблемы. Для конечных автоматов большинство из них имеют положительное решение.

Имитационное моделирование надежности

На протяжении XX в. в СССР и России при разработке проблем теоретико-интерпретационного плана формировалось все более ясное и четкое понимание роли и значения имитационного моделирования - как при оценке эффективности существующих и предлагаемых новых методов решения задач, возникающих в рамках интерпретационного процесса, так и при оценке
надежности и точности решений задач, получаемых на практике по конкретным данным; вместе с тем следует признать, что имитационное моделирование все еще используется в недостаточном объеме. Этот вывод легко получить из анализа специальной литературы; он имеет важное ориентирующее значение.
Имитационная модель надежности - модель, отображающая состояния и функционирование объекта, в которой переменные, принятые в качестве характеристик исследуемого объекта, характеризуют свойства, составляющие надежность объекта.
В тех случаях, когда решаемые задачи допускают строгую математическую формулировку, задачи имитационного моделирования всегда оказываются некорректно поставленными, т.е. фактически требующими использования не только строгих математических методов, но также и использования дополнительных процедур эвристического характера (типа процедур распознавания образов).
Построение интерпретационных моделей всегда осуществляется по двум линиям:
а) сбора имеющихся данных, относящихся ко всем элементам интерпретационной модели, прежде всего о строении изучаемого объекта, а также к характеристикам, определяющим его работоспособность, и связанных с ними априорных ограничений;
б) проведения специальных расчетов (решения вспомогательных задач), позволяющих внутренними средствами уточнить модельные представления об объекте, характеристиках и связях между характеристиками и объектом.
Как правило, на этапе построения интерпретационных моделей основное значение имеют задачи нахождения (явных) аппроксимаций изучаемых свойств и специальные обработки построенных аппроксимаций (чаще всего, хотя и не обязательно, линейных). Что касается этапа собственно нахождения интерпретаций в рамках принятых интерпретационных моделей, то здесь основное значение имеют процедуры аппроксимационной оптимизации (параметров изучаемого объекта по экспериментальным данным о характеристиках); при этом с очевидностью должны использоваться регулярные (регуляризующие) алгоритмы.
После нахождения интерпретации по необходимости используются процедуры - обычно эвристические, типа распознавания образов, а также (но далеко не всегда!) имитационное моделирование в целях нахождения оценок точности и надежности построенной интерпретации.

НАДЕЖНОСТЬ АВТОМАТИЗИРОВАННЫХ ИНФОРМАЦИОННЫХ СИСТЕМ

Комплексные показатели надежности АИС.

Надежность компонентов АИС и технических средств

Комплексные показатели надежности АИС - показатели, которые обеспечивают достижение основных целей функционирования АИС, определенных в нормативно-технической и (или) проектной документации. Комплексные показатели надежности АИС разрабатываются на этапе формирования технического задания.
Коэффициент готовности АИС - вероятность того, что АИС и все ее компоненты окажутся в работоспособном состоянии в произвольный момент времени, кроме планируемых периодов, в течение которых применение АИС или отдельных компонентов по назначению не предусматривается.
Повышение готовности АИС предполагает подавление в определенных пределах влияния отказов и сбоев на работу системы с помощью средств контроля и коррекции ошибок, а также средств автоматического восстановления вычислительного процесса после проявления неисправности, включая аппаратурную и программную избыточность, на основе которой реализуются различные варианты отказоустойчивых архитектур. Повышение готовности - есть способ борьбы за снижение времени простоя системы.
Единицей измерения здесь является коэффициент готовности, который определяет вероятность пребывания системы в работоспособном состоянии в любой произвольный момент времени. Статистически коэффициент готовности определяется как MTBF/(MTBF+MTTR), где MTTR (Mean Time To Repair) - среднее время восстановления (ремонта), т.е. среднее время между моментом обнаружения неисправности и моментом возврата системы к полноценному функционированию.
В последние годы в литературе по вычислительной технике все чаще употребляются термины "системы высокой готовности", "системы высокой степени готовности", "системы с высоким коэффициентом готовности". Все эти термины по существу являются синонимами, однако как и многие термины в области вычислительной техники, термин "высокая готовность" понимается по-разному отдельными поставщиками и потребителями вычислительных систем. Совершенно аналогично некоторые слова, связанные с термином "высокая готовность", такие, например, как "кластеризация", также употребляются в различных значениях.
Важно иметь стандартный набор определений для того, чтобы предложения различных поставщиков можно было сравнивать между собой на основе одинаковых терминов.
Ниже приведены общепринятые в настоящее время определения, которые мы будем использовать для различных типов систем, свойством которых является та или иная форма снижения планового и непланового времени простоя:
- Высокая готовность (High Availability). Настоящие конструкции с высоким коэффициентом готовности для минимизации планового и непланового времени простоя используют обычную компьютерную технологию. При этом конфигурация системы обеспечивает ее быстрое восстановление после обнаружения неисправности, для чего в ряде мест используются избыточные аппаратные и программные средства.
Длительность задержки, в течение которой программа, отдельный компонент или система простаивает, может находиться в диапазоне от нескольких секунд до нескольких часов, но более часто в диапазоне от 2 до 20 мин. Обычно системы высокой готовности хорошо масштабируются, предлагая пользователям большую гибкость, чем другие типы избыточности.
- Эластичность к отказам (Fault Resiliency). Ряд поставщиков компьютерного оборудования делит весь диапазон систем высокой готовности на две части, при этом в верхней его части оказываются системы эластичные к отказам.
Ключевым моментом в определении эластичности к отказам является более короткое время восстановления, которое позволяет системе быстро откатиться назад после обнаружения неисправности.
- Устойчивость к отказам (Fault Tolerance). Отказоустойчивые системы имеют в своем составе избыточную аппаратуру для всех функциональных блоков, включая процессоры, источники питания, подсистемы ввода/вывода и подсистемы дисковой памяти. Если соответствующий функциональный блок неправильно функционирует, всегда имеется горячий резерв.
В наиболее продвинутых отказоустойчивых системах избыточные аппаратные средства можно использовать для распараллеливания обычных работ. Время восстановления после обнаружения неисправности для переключения отказавших компонентов на избыточные для таких систем обычно меньше одной секунды.
- Непрерывная готовность (Continuous Availability). Вершиной линии отказоустойчивых систем являются системы, обеспечивающие непрерывную готовность.
Продукт с непрерывной готовностью, если он работает корректно, устраняет любое время простоя (как плановое, так и неплановое). Разработка такой системы охватывает как аппаратные средства, так и программное обеспечение и позволяет проводить модернизацию (upgrade) и обслуживание в режиме on-line.
Дополнительным требованием к таким системам является отсутствие деградации в случае отказа. Время восстановления после отказа не превышает одной секунды.
- Устойчивость к стихийным бедствиям (Disaster Tolerance). Широ-
кий ряд продуктов и услуг связан с обеспечением устойчивости к стихийным бедствиям. Иногда устойчивость к стихийным бедствиям рассматривается в контексте систем высокой готовности.
Смысл этого термина в действительности означает возможность рестарта или продолжения операций на другой площадке, если основное месторасположение системы оказывается в нерабочем состоянии из-за наводнения, пожара или землетрясения. В простейшем случае продукты, устойчивые к стихийным бедствиям, могут просто представлять собой резервные компьютеры, расположенные вне основного местоположения системы, сконфигурированные по спецификациям пользователя и доступные для использования в случае стихийного бедствия на основной площадке.
В более сложных случаях устойчивость к стихийным бедствиям может означать полное (зеркальное) дублирование системы вне основного местоположения, позволяющее принять на себя работу немедленно после отказа системы на основной площадке.
Все упомянутые типы систем высокой готовности имеют общую цель - минимизацию времени простоя. Имеются два типа времени простоя компьютера: плановое и неплановое. Минимизация каждого из них требует различной стратегии и технологии.
Плановое время простоя обычно включает время, принятое руководством, для проведения работ по модернизации системы и для ее обслуживания. Неплановое время простоя является результатом отказа системы или компонента.
Хотя системы высокой готовности возможно больше ассоциируются с минимизацией неплановых простоев, они оказываются также полезными для уменьшения планового времени простоя.
Современные АИС строятся или, скорее, будут строиться из компонентов. (Компонент - самостоятельный программный или аппаратный продукт, поддерживающий объектную парадигму, реализующий отдельную область логики и умеющий взаимодействовать с другими компонентами с помощью открытых интерфейсов.) Такая технология позволит ответить на самые острые проблемы компьютерного мира - сокращение времени разработки автоматизированной системы, облегчение процесса внедрения и поддержка гибкости внедренного решения. На рис.
3.1 изображены этапы жизненного цикла АИС.
требования к надежности автоматизированных систем, описываемые в техническом задании на систему, включают в себя:
1) состав и количественные значения показателей надежности для системы в целом или ее подсистем;
2) перечень аварийных ситуаций, по которым должны быть регламентированы требования к надежности, и значения соответствующих показателей;
3) требования к надежности технических средств и программного обеспечения;
4) требования к методам оценки показателей надежности и их контролю на разных стадиях создания системы в соответствии с действующими нормативно-техническими документами.
Перечисленные требования позволяют обеспечить необходимый (заложенный при проектировании) для АИС в целом уровень надежности.

Методы надежности программного обеспечения

Надежность сложных программных средств определяется теми же факторами, что и надежность любых технических объектов, однако доминирующими являются дефекты и ошибки проектирования, так как физическое хранение программ на магнитных носителях характеризуется очень высокой надежностью. Программа любой сложности и назначения при строго фиксированных исходных данных и абсолютно надежной аппаратуре исполняется по однозначно определенному маршруту и дает на выходе строго определенный результат. Однако случайное изменение исходных данных и накопленной при обработке информации, а также множество условных переходов в программе создают огромное число различных маршрутов исполнения каждого сложного ПС. Источниками ненадежности являются непроверенные сочетания исходных данных, при которых функционирующее ПС дает неверные результаты или отказы. В результате комплекс программ не соответствует требованиям функциональной пригодности и работоспособности.
При применении понятий надежности к программным средствам следует учитывать особенности и отличия этих объектов от традиционных технических систем, для которых первоначально разрабатывалась теория на-
дежности:
- не для всех видов программ применимы понятия и методы теории надежности - их можно использовать только к программным средствам, функционирующим в реальном времени и непосредственно взаимодействующим с внешней средой;
- при разработке и оценке качества программных компонентов к ним не применимы понятия надежности функционирования, если при обработке информации они не используют значения реального времени и не взаимодействуют непосредственно с внешней средой;
- доминирующими факторами, определяющими надежность программ, является количество дефектов и ошибок проектирования и разработки; второстепенное значение имеет физическое разрушение программных компонентов при внешних воздействиях;
- относительно редкое разрушение программных компонентов и необходимость их физической замены приводят к принципиальному изменению понятий сбоя и отказа программ и к разделению их по длительности восстановления относительно некоторого допустимого времени простоя для функционирования информационной системы;
- для повышения надежности комплексов программ особое значение имеют методы автоматического сокращения длительности восстановления и преобразования отказов в кратковременные сбои путем введения в программные средства временной, программной и информационной избыточности;
- непредсказуемость места, времени и вероятности проявления дефектов и ошибок, а также их редкое обнаружение при реальной эксплуатации достаточно надежных программных средств не позволяют эффективно использовать традиционные методы априорного расчета показателей надежности сложных систем, ориентированные на стабильные, измеряемые значения надежности составляющих компонентов;
- традиционные методы форсированных испытаний надежности систем путем физического воздействия на их компоненты не применимы для программных средств и их следует заменять на методы форсированного воздействия информационных потоков внешней среды.
С учетом перечисленных особенностей применение основных понятий теории надежности сложных систем к жизненному циклу и оценке качества комплексов программ позволяет адаптировать и развивать эту теорию в особом направлении - надежности программных средств. Предметом изучения теории надежности комплексов программ (Software Reliability) является работоспособность сложных программ обработки информации в реальном времени. К задачам теории и анализа надежности сложных программных средств можно отнести следующие:
- формулирование основных понятий, используемых при исследовании и применении показателей надежности программных средств;
- выявление и исследование основных факторов, определяющих характеристики надежности сложных программных комплексов;
- выбор и обоснование критериев надежности для комплексов программ различного типа и назначения;

Калинина В. - Надежность и эффективности АИС

ВВЕДЕНИЕ В ТЕОРИЮ НАДЕЖНОСТИ СЛОЖНЫХ СИСТЕМ

Современные требования к надежности сложных систем. Определение и измерение надежности

Обслуживаемые и необслуживаемые объекты. Резервирование

Надежность системы и ее элементов.

Методы испытаний надежности систем

Анализ и контроль покупных и повторно используемых компонентов

Анализ и контроль покупных и повторно используемых компонентов (ПИК). Комплексные испытания АИС

Организация эксплуатационного обслуживания АИС

ЗАДАНИЯ ДЛЯ САМОСТОЯТЕЛЬНОЙ РАБОТЫ

ТРЕНИНГУМЕНИЙ

Пример выполнения упражнения тренинга на умение 1

Пример выполнения упражнения тренинга на умение 2

Имитационное моделирование надежности

Имитационное моделирование надежности

НАДЕЖНОСТЬ АВТОМАТИЗИРОВАННЫХ ИНФОРМАЦИОННЫХ СИСТЕМ

Комплексные показатели надежности АИС.

Надежность компонентов АИС и технических средств

Методы надежности программного обеспечения

Экспертиза и прогнозирование отказов

Экспертиза и прогнозирование отказов.

Эксплуатационный контроль надежности систем

Роль ЭВМ в обеспечении надежности систем

МАТЕМАТИЧЕСКИЕ МЕТОДЫ ТЕОРИИ НАДЕЖНОСТИ

Основы математической статистики

Комплексная эффективность от использования АИС

ЭФФЕКТИВНОСТЬ АВТОМАТИЗИРОВАННЫХ ИНФОРМАЦИОННЫХ СИСТЕМ

Комплексная эффективность от использования АИС и особенности ее экономической эффективности

Пользовательская эффективность АИС и ее эффективность с точки зрения разработчика.

Техническая эффективность компонентов АИС

УПРАВЛЕНИЕ НАДЕЖНОСТЬЮ И ЭФФЕКТИВНОСТЬЮ АИС

Анализ, оценка показателей надежности и эффективности создаваемой АИС. Комплексный план обеспечения качества АИС

Методы статистической обработки испытаний

Методы статистической обработки испытаний

Вероятностные модели динамики надежности

Марковские модели надежности

Надежность, человеческий фактор в надежности

Надежность, человеческий фактор в надежности и помехозащищенность передачи данных. Методы надежности информационного обеспечения и испытание компонентов АИС