Составители:
бутов необязательно соответствует понятию первичного ключа.
Ключевые атрибуты в записях обозначаются через p(i), где I – номер запи-
си, общее число записей в массиве обозначается через М.
Записи массива могут быть упорядоченными или неупорядоченными по
значениям ключевого атрибута (ключа), имя которого одинаково во всех запи-
сях. Ключевой атрибут обычно является атрибутом-признаком. Часто требует-
ся поддерживать упорядоченность записей по нескольким именам ключевых
признаков. В этом случае среди признаков устанавливается старшинство. Усло-
вие упорядоченности записей в массиве (и вообще для линейной организации
данных) выглядит следующим образом:
p(i) < = p(i+1) – упорядоченность по возрастанию,
p(i) > = p(i+1) – упорядоченность по убыванию.
Наиболее важными и часто применяемыми алгоритмами обработки дан-
ных являются формирование данных, их поиск и корректировка, а также после-
довательная обработка. Эти алгоритмы могут быть реализованы с использова-
нием достаточно большого количества методов организации данных. Здесь мы
рассмотрим выбор наилучшего метода организации данных для названных ал-
горитмов. Сами методы организации данных будут представлены в их про-
стейшей форме.
Данные обычно возникают в неупорядоченной форме. Перед обработкой,
как правило, целесообразно упорядочить их по значениям ключевых атрибутов,
что составляет одну из основных работ по формированию (подготовке) данных.
Процедуру упорядочения файла часто называют сортировкой.
Упорядоченные данные эффективны для организации быстрого поиска
информации. Выходные документы, выводимые на печать, полученные на ос-
нове отсортированных данных, удобны для дальнейшего использования. Мно-
гие алгоритмы задач управления вообще рассчитаны на использование только
упорядоченных данных. Отсортированные данные позволяют организовать бы-
струю обработку нескольких массивов. (Далее будем считать все массивы упо-
рядоченными по возрастанию значений одного атрибута, когда для ключа i–й
записи p(i) справедливо условие p(i) < = p(i+1).)
Критерии эффективности алгоритмов
Естественной характеристикой эффективности того или иного алгоритма
служит время его выполнения в зависимости от ряда параметров хранимой ин-
формации. Поэтому для каждого метода организации данных требуется анали-
зировать следующие величины:
• время формирования данных, т.е. время создания данных в памяти
ЭВМ так или иначе упорядоченного представления данных (упорядочение спо-
собно ускорить выполнение алгоритмов поиска данных);
• время поиска данных. Как известно, условия поиска (выборки) на прак-
тике могут быть достаточно разнообразные. Анализируется обычно простейший
и наиболее распространенный случай (поиск по совпадению) – найти записи, у
28
бутов необязательно соответствует понятию первичного ключа. Ключевые атрибуты в записях обозначаются через p(i), где I – номер запи- си, общее число записей в массиве обозначается через М. Записи массива могут быть упорядоченными или неупорядоченными по значениям ключевого атрибута (ключа), имя которого одинаково во всех запи- сях. Ключевой атрибут обычно является атрибутом-признаком. Часто требует- ся поддерживать упорядоченность записей по нескольким именам ключевых признаков. В этом случае среди признаков устанавливается старшинство. Усло- вие упорядоченности записей в массиве (и вообще для линейной организации данных) выглядит следующим образом: p(i) < = p(i+1) – упорядоченность по возрастанию, p(i) > = p(i+1) – упорядоченность по убыванию. Наиболее важными и часто применяемыми алгоритмами обработки дан- ных являются формирование данных, их поиск и корректировка, а также после- довательная обработка. Эти алгоритмы могут быть реализованы с использова- нием достаточно большого количества методов организации данных. Здесь мы рассмотрим выбор наилучшего метода организации данных для названных ал- горитмов. Сами методы организации данных будут представлены в их про- стейшей форме. Данные обычно возникают в неупорядоченной форме. Перед обработкой, как правило, целесообразно упорядочить их по значениям ключевых атрибутов, что составляет одну из основных работ по формированию (подготовке) данных. Процедуру упорядочения файла часто называют сортировкой. Упорядоченные данные эффективны для организации быстрого поиска информации. Выходные документы, выводимые на печать, полученные на ос- нове отсортированных данных, удобны для дальнейшего использования. Мно- гие алгоритмы задач управления вообще рассчитаны на использование только упорядоченных данных. Отсортированные данные позволяют организовать бы- струю обработку нескольких массивов. (Далее будем считать все массивы упо- рядоченными по возрастанию значений одного атрибута, когда для ключа i–й записи p(i) справедливо условие p(i) < = p(i+1).) Критерии эффективности алгоритмов Естественной характеристикой эффективности того или иного алгоритма служит время его выполнения в зависимости от ряда параметров хранимой ин- формации. Поэтому для каждого метода организации данных требуется анали- зировать следующие величины: • время формирования данных, т.е. время создания данных в памяти ЭВМ так или иначе упорядоченного представления данных (упорядочение спо- собно ускорить выполнение алгоритмов поиска данных); • время поиска данных. Как известно, условия поиска (выборки) на прак- тике могут быть достаточно разнообразные. Анализируется обычно простейший и наиболее распространенный случай (поиск по совпадению) – найти записи, у 28
Страницы
- « первая
- ‹ предыдущая
- …
- 26
- 27
- 28
- 29
- 30
- …
- следующая ›
- последняя »