Решение сложных задач
Большинство практических задач обработки данных относится к числу сложных. Сложность задач оценивается сложностью обрабатываемых данных и сложностью алгоритмов их решения. Сложность данных обычно оценивается их количеством. Сложность алгоритмов оценивается объемом вычислений, необходимых для получения требуемых результатов.
При решении сложных задач, требующих составления сложных алгоритмов, особенно сказываются преимущества доказательного программирования. Для этого программы решения сложных задач составляются из вспомогательных алгоритмов и подпрограмм, решающих более простые подзадачи.
Анализ правильности сложных алгоритмов и программ распадается на анализ правильности каждого из вспомогательных алгоритмов и на анализ правильности программ в целом. Необходимым условием для этого является составление спецификаций для каждого из вспомогательных алгоритмов и каждой подпрограммы,
При таком подходе доказательство правильности
сложных алгоритмов и программ подразделяется на доказательство ряда лемм о правильности вспомогательных алгоритмов и подпрограмм и доказательство правильности программ в целом.
В качестве иллюстрации рассмотрим две задачи, которые можно отнести к сложным проблемам обработки данных. Для каждой из этих задач приведем спецификации, алгоритмы и доказательства правильности.
Первая задача: упорядочение массивов данных. Пример, для чисел 3, 7, 9, 1, 4 упорядоченная последовательность имеет вид: 1, 3, 4, 7, 9.
Существует несколько способов и методов упорядочения массивов и последовательностей. Простейший из них называется методом «пузырька».
Метод «пузырька» состоит в нахождении в массиве наименьшего числа и перестановке его на первое место. Это как бы «пузырек», поднимающийся к началу массива. Затем в остатке массива находится наименьшее число, которое перемещается на второе место, и так далее - до исчерпания всего массива.
Для рассматриваемых чисел метод «пузырька» дает следующие перестановки:
исходные числа: 3, 7, 9, 1, 4.
перестановка1: 1, 7, 9, 3, 4.
перестановка2: 1, 3, 9, 7, 4.
перестановка3: 1, 3, 4, 7, 9. ¬ упорядочено.
Приведем точную математическую постановку задачи.
Постановка задачи
Упорядочение последовательности чисел.
Дано:
x1, х2, ..., хN - исходные числа.
Треб.: x1', x2', ..., хN' - упорядоченные числа.
Где: х1' £
х2' £
... £ хN'.
При: N > 0.
Упорядочение чисел по методу «пузырька» в общей форме имеет вид:
Способ «упорядочение чисел»
нач
от k=1 до N-1 цикл
хтп := xk
imn := k
от i=k+1 до N цикл
если xi < хтп то
хтп := xi
imn : = i
кесли
кцикл
xmn = Min (хk, ..., хN)
xk' = хтп
ximn ' = xk
кцикл хk¢ = Min (хk, ..., хN)
кон x1 < х2
< ... < хk¢
Приведенный алгоритм можно рассматривать как алгоритм, сложенный из нескольких фрагментов - вспомогательных алгоритмов, решающих определенные подзадачи.
Первый фрагмент (внутренний цикл) решает подзадачу нахождения минимального значения в подмассиве x[k:N]. Второй фрагмент решает подзадачу перемещения k-го минимального значения на k-e место в массиве.
Лемма 1. Для вспомогательного алгоритма
алг «поиск минимума»
нач
хтп
:= xk
imn := k
от i
= k + 1 до N цикл
если
xi < хтп то
хтп
:= xi
imn := i
кесли
кцикл { xmn = Min (хk, ..., х1) }
кон
конечным результатом вычислений будет значение
xmn = Min (хk, ..., хN).
Доказательство. Применим индуктивную схему рассуждений. Первое присваивание дает
xmnk =
xk.
Далее на первом шаге цикла при i = k + 1 будет получен минимум первых двух чисел:
xk+1 при xk+1 < xmnk,
xmnk+l =
xmnk при xk+1
³ xmnk.
На втором шаге цикла будет получен минимум первых трех чисел:
xmnk+2
= min (xk+2, min (хk+1, хk)) = Min (хk+2,
хk+1, хk).
Теперь можно утверждать, что на третьем и последующих шагах цикла результатом будет минимальное значение среди чисел xk , ..., xi
хmni = Min (хk, ..., хi).
Данное утверждение доказывается с помощью математической индукции. На первых двух шагах при i = k + 1, k + 2 оно уже установлено. Покажем, что оно будет выполняться на (i + 1)-м шаге. Действительно, на следующем шаге цикла результатом будет:
xi+1
при хi+1 < xmni = min(xi+1, хmni)
хmni+1
=
хmni при хi+1 ³ хmni = min(xi+1, xmni)
= min (xi+1, Min (хk , ..., хi)) = Min (хk, ..., хi, xi+1).
Что и требовалось показать. Следовательно, в силу принципа математической индукции конечным результатом выполнения рассматриваемого цикла будет значение:
xmnN
= Min (xk, ...,
хN)
Что и требовалось доказать.
Лемма 2. Для вспомогательного алгоритма
алг «перестановки»
нач { xmn = Min (хk, ..., хN) }
xi¢mn= xk
кон
конечным результатом будет значение хk' = Min (хk, ..., хN).
Доказательство. В силу леммы 1 xmn = Min (xk, ..., хN). А так как в этом алгоритме хk' =
xmn, то в итоге получим
хk' = xmn = Min (хk, ..., хN).
Что и требовалось.
Утверждение. Конечным результатом выполнения алгоритма будет упорядоченная последовательность чисел х1', ..., хN', удовлетворяющая условию х1' £ х2' £ ... £ хN'.
Доказательство проводится по индуктивной схеме рассуждений. Рассмотрим результаты выполнения основного цикла основного алгоритма:
алг «упорядочение чисел»
нач
от k = 1 до N - 1 цикл
xmn
:= хk
............... { xmn = Min (хk, ..., хi) }
х¢k
= xmnN
хmп¢
= хk
кцикл { хk' = Min (хk, ..., хN) }
кон { х1' £ х2' £ ... £ хk' }
На первом шаге при k = 1 первый элемент последовательности
х1' = Min (x1, х2, ..., хN),
На втором шаге второй элемент последовательности
x2' = Min (х2, ..., хN).
В силу свойств минимума последовательности чисел будем иметь
х1' = Min(x1, x2, ..., хN) = min (x1, Min (х2, ..., хN) £ (Min (х2, ..., хN) = x2'.
Таким образом, при k = 2 результатом станут значения х1' и x2', такие что
х1' £ x2'
На третьем шаге выполнения основного цикла результатом станет
х3 = Мin(х3, ..., хN).
Опять же в силу свойств минимума последовательности имеем
х2' = Min (х2, х3, ..., хN) = min (x2, Min (x3, ..., хN)) £ Min (x3, ..., хN) = x2'.
Таким образом, после третьего шага при k = 3 первые три значения последовательности х1', x2', x3' будут удовлетворять условию
х1'£ x2'£ x3'
Из приведенных выкладок можно сделать индуктивное предположение, что на каждом очередном k-м шаге выполнения основного цикла первые k членов последовательности х1', x2', .... хk' будут удовлетворять условию
х1'£ x2'£ … £ xk'.
Данное предположение доказывается с помощью математической индукции. На начальных шагах при k == 2 и k = 3 оно уже показано. Покажем, что оно будет выполнено на (k + 1)-м шаге, если это условие выполнено на k-м. шаге.
В силу Леммы 2 на k-м и (k + 1)-м шагах выполнения основного цикла промежуточными результатами будут
хk' = Min(xk, xk+1, ..., хN),
хk+1' = Min (xk+1, ..., хN).
В силу свойств минимума последовательности чисел имеем
хk' = Min(xk, xk+1, ..., хN) = min (хk, Min (хk+1, ...,хN)) £ Min (xk+1, ..., хN) = хk+1'.
Таким образом, хk £ xk+1 и в силу индуктивного предположения получаем, что
x1' £ х2' £ ... £ хk' £ xk+'1.
Что и требовалось доказать.
Осталось уточнить результаты выполнения последнего шага цикла при k = N - 1. В силу Леммы 2 результатом будет значение
xN-'1 = Min (xN-1, xN) £
хN'.
Таким образом, после N - 1 шагов выполнения основного цикла для последовательности в целом будут выполнены соотношения упорядоченности
x1' £ x2' £ ... £ хN' .
Что и требовалось доказать. Следовательно, рассмотренный алгоритм упорядочения чисел правильный в целом.
Применим теперь данный способ упорядочения для решения задачи сортировки. Рассмотрим следующую задачу. Пусть дана некоторая партия товаров с заданной отпускной ценой, указана цена товаров и известны остатки от их продажи. Требуется подсчитать выручку от продажи и отсортировать товары по их остатку.
Данные о товарах представлены двумя таблицами:
товар стоим кол-во
яблоки |
500 |
200 |
огурцы |
400 |
250 |
арбузы |
200 |
600 |
товар цена остаток
яблоки |
2500 |
100 |
огурцы |
2000 |
150 |
арбузы |
1200 |
200 |
Приведем точную постановку задачи и сценарий диалога с компьютером для решения поставленной задачи.
Постановка задачи Сценарий
Сортировка товаров по остатку.
Дано: товары:
D = (d1, d2, .... dN) - данные товара, <товар1> <s1> < m 1> *
d = (товар, s, m), ...... ... ...
s - стоимость, m - кол-во, остатки:
R = (r1, r2, ..., rN) - данные об остатках, <товap1> <c1> < р1> *
г = (товар, с, р), ...... ... ...
с - цена, р - остаток.
Треб.:
S - сумма выручки, выручка = <S>
R' = (r1', ..., rN') - упорядоченные данные, сортировка:
Где: <товар1'> <с1'> <р1'> *
S = (c1-s1)×(m1-p1) +...+ (сN-sN)×(mN-рN), ............
р1' £
р2' £
... £ рN',
рk' = рi для k = 1 ... N и i = 1 ... N.
При:
N > 0.
Для представления исходных данных в программе примем операторы data:
tovs: 'товары: osts: 'остатки:
data «яблоки», 500, 200 data «яблоки», 2500, 100
data «огурцы», 400, 250 data «огурцы», 2000, 150
data «арбузы», 200, 600 data «арбузы», 1200, 200
data «персик», 800, 100 data «персик», 2000, 0
data «», 0, 0 data «», 0, 0
Приведем теперь алгоритм и программу решения поставленной задачи в соответствии с выбранным сценарием и рассмотренным выше способом упорядочения массивов методом «пузырька».
При составлении алгоритмов и программы решения этой задачи будем использовать принцип нисходящей разработки «сверху-вниз»: от основного алгоритма и основной части программы к алгоритмам и подпрограммам решения вспомогательных подзадач.
При решении сложных задач существенным становится организация и представление данных: подбор массивов и переменных для размещения и обработки данных в памяти ЭВМ, а при выделении подпрограмм - процедуры доступа к этим данным.
Для размещения исходных данных о товарах в поставленной задаче примем пять массивов: tv(l:N), s(l:N), m(l:N), с (1:N), p(l:N). Общий размер этих массивов ограничим числом N = 200, которое явно выделено в описании массивов с тем, чтобы в дальнейшем его можно было увеличить для большего количества данных без других изменений программы.
алг «выручка и остатки товаров» 'выручка и остатки товаров
N
= 100 N = 100
массив tv[1:N],s[1:N],m1l:N] dim tv$(N),s(N),m(N)
массив L[1:N],c[1:N],p[1:N] dim L(N),c(N),p(N)
нач сls
вывод («товары:») ? «товары:»
данные-товаров gosub tovar 'товары
вывод («остатки:») ? «остатки:»
данные-остатков gosub ostatok 'остатки
вывод («-----») ? «-----»
подсчет-выручки gosub vyruch 'выручка
вывод («выручка», S) ? «выручка=»;S
вывод («сортировка:») ? «сортировка:»
сортировка-товаров gosub sortdan 'сортировка
кон end
По приведенному алгоритму и основной части программы видно, что последовательность ввода-вывода данных о товарах и результатов обработки полностью соответствует выбранному сценарию. Загрузку исходных данных в выбранные массивы в соответствии с принятым представлением выполнят два следующих вспомогательных алгоритма
алг «данные товаров» tovar: 'данные товаров
нач '
загрузка-товаров restore tovs
от k = 1 до N цикл for k = 1 to N
чmeнue(tv(k),s(k),m(k)) read tv$(k),s(k),m(k)
при tv(k) = «» то if tv$(k) = «» then exit for
вывод (tv(k),s(k),m(k)) ? tv$(k);s(k);m(k)
кцикл next k
если k< Nmo N := k-1 if k < N then N = k-1
кон return
Последний условный оператор изменяет верхнюю границу N массивов в том случае, если фактическое число данных меньше числа мест в массивах, размещенных в памяти компьютера.
алг «данные остатков» ostatok: 'данные остатков
нач '
загрузка-остатков restore osts
от k = 1 до N цикл for k = 1 to N
чmeнue(tv(k),c(k),p(k)) read tv$(k),c(k),p(k)
при tv(k) = «» выход if tv$(k) = «» then exit for
вывод (tv(k),c(k),p(k)) ? tv$(k);c(k);p(k)
кцикл next k
если k < N mo N := k-1 if k < N then N = k-1
кон return
Подсчет выручки в соответствии с постановкой задачи по данным, введенным в эти массивы, выполнят следующие вспомогательный алгоритм и подпрограмма:
алг «подсчет выручки» vyruch: 'подсчет выручки
нач '
S := 0 S = 0
от k = 1 до N цикл for k = 1 to N
S := S+(c(k)-s(k)) *(m(k)-p(k)) S = S+(c(k)-s(k))*(m(k)-p(k))
кцикл next k
кон return
Лемма 3. Конечным результатом выполнения данного вспомогательного алгоритма будет сумма
SN
= (с(1) - s(l))×(m(l) - р(1)) + ... + (c(N) - s(N))×(m(N) - p(N)).
Доказательство проводится с помощью индуктивных рассуждений. Первое присваивание S := 0 обеспечивает начальное значение суммы S0 = 0.
О результатах k-го шага выполнения цикла можно сделать индуктивное утверждение
Sk = Sk-1
+ (c(k)-
s(k))-(m(k) - p(k)) = (с(1) - s(l))×(m(l) - p(l)) + ... + (c(k) - s(k))×(m(k) - p(k)).
Это утверждение доказывается с помощью математической индукции. На его основании можно сделать заключение о том, что конечным результатом выполнения цикла и алгоритма в целом будет сумма
SN
= (с(1) - s(l))×(m(l) - р(1)) + ... + (c(N) - s(N))×(m(N) - p(N)).
Что и требовалось доказать.
Для сортировки данных воспользуемся алгоритмом упорядочения чисел по методу «пузырька», предполагая, что исходная и упорядоченная последовательность чисел r1, r2, ..., rN будут записаны в массиве x[l:N].
Для формирования результирующих упорядоченных данных используется массив индексов L(1:N), в котором будут записаны номера элементов исходной последовательности так, что x(k) = p(L(k)) для всех k = 1, ..., N.
алг «сортировка данных» sortdan: 'сортировка данных
массив x[1:N] dim x(N)
нач '
от k = 1 до N цикл for k = 1 to N
L(k) = k L(k) = k
x(k)=p(L(k)) x(k)=p(L(k))
кцикл next k
сортировка-массива gosub sortmas 'сортировка
от k = 1 до N цикл for k = 1 to N
i := L(k) i = L(k)
вывод (tv(i),c(i),p(i)) ? tv$(i);c(i);p(i)
кцикл next k
кон return
Модификация алгоритма упорядочения чисел, размещаемых в массиве x[l:N], с учетом перестановок значений в массиве индексов L[1:N] получает следующий вид:
алг «сортировка массива» sortmas: 'сортировка массива
нач '
от k = 1 до N-1 цикл for k = 1 to N-1
xmn := x(k) xmn = x(k)
imn := k imn = k
от i = k + 1 до N цикл for i = k + 1 to N
если x(i) < xmn то if x(i) < xmn then
xmn := x(i) xmn = x(i)
imn := i imn = i
кесли end if
кцикл next i
Imn := L(imn) Imn = L(imn)
xmn := x(imn) xmn = x(imn)
L(imn) := L(k) L(imn) = L(k)
x(imn) := x(k) x(imn) = x(k)
L(k) :=Imn L(k) = Imn
x(k) := xmn x(k) = xmn
кцикл next k
кон return
Лемма 4. Результатами выполнения алгоритма сортировки массива будут последовательность чисел, упорядоченная по возрастанию
х(1)' £ х(2)' £ ... £ x(N)'
и последовательность индексов в массиве L[1:N], удовлетворяющих условиям
x(k)' = p(L(k)) для всех k = 1, .... N.
Доказательство. Первое утверждение об упорядоченности значений х(1)' £ х(2)' £... £ x(N)' массива x[l:N] по завершении алгоритма следует из доказательства правильности алгоритма упорядочения последовательности чисел. Для доказательства второго утверждения рассмотрим результаты перестановок значений элементов:
Imn := L(imn) Imn = L(imn)
xmn
:= x(imn) xmn = x(imn)
L(imn) := L(k) L(imn)' = L(k)
x(imn) := x(k) x(imn)' = x(k)
L(k) := Imn L(k)' = Imn = L(imn)
x(k) := xmn x(k)' = xmn = x(imn)
Перед началом выполнения алгоритма упорядочения массива в алгоритме сортировки данных массив индексов L[1:N] и упорядочиваемый массив x[l:N] получают значения, удовлетворяющие следующим соотношениям:
х(i)' = P(L(i) для всех i = 1, ..., N.
Покажем, что эти соотношения сохраняются после каждого шага цикла. Действительно, на каждом очередном k-м шаге цикла будут получены следующие результаты:
Imn = L(imn)
xmn = x(imn) == p(L(imn))
L(imn)' = L(k)
x(imn)' = x(k) = p(L(k)) = p(L(imn)')
L(k)' = Imn = L(imn)
x(k)' = xmn = x(imn) = p(L(imn)) = p(L(k)')
Следовательно, после каждого шага цикла для переставленных элементов массивов сохраняются соотношения
x(i)' = p(L(i)) для всех i = 1, ..., N.
Что и требовалось доказать.
Утверждение. Конечным результатом выполнения алгоритма и подпрограммы сортировки данных будет список данных, в котором последовательность значений р1', р2', ..., рN' будет упорядочена:
p1' £ р2' £ … £ pN'
Доказательство. В соответствии с доказанной выше леммой 4 значения в массиве x[l:N] после выполнения алгоритма упорядочения чисел будут удовлетворять условиям
х(1)' £ х(2)' £ ... £ x(N)'.
В силу этой же леммы 4 значения индексов в массиве
L[1:N] будут удовлетворять соотношениям x[k]' = p(L(k)) для всех k = 1, ..., N.
Конечным результатом алгоритма сортировки данных является вывод значений из массива p[l:N] в соответствии с массивом индексов L[1:N]. Таким образом, очередные значения последовательности p1', p2',... будут равны:
р1' = p(L(l)) = х(1)',
p2'= р(L (2)) = х(2)'и т. д.
В силу упорядоченности значений х(1)', х(2)', ...,
x(N)' получаем, что значения выходной последовательности будут также упорядочены:
p1' £ р2' £ … £ pN'
Что и требовалось доказать.
Следовательно, весь комплекс алгоритмов и подпрограмм полностью соответствует поставленной задаче и гарантирует получение правильных результатов, при любых допустимых исходных данных.
Проверка на ЭВМ программы сортировки товаров, составленной таким систематическим образом, при указанных исходных данных дает следующие результаты:
товары:
яблоки, 500, 200
огурцы, 400, 250
арбузы, 200, 600
персики, 800, 100
остатки:
яблоки, 2500, 100
огурцы, 2000, 150
арбузы, 1200, 200
персики, 2000, 0
выручка = 880000
сортировка:
персики, 2000, 0
яблоки, 2500, 100
огурцы, 2000, 150
арбузы, 1200, 200
Таким образом, выполнение программы подтверждает правильность составленного комплекса алгоритмов. Полное и исчерпывающее обоснование их правильности приведено выше.
В о п р о с ы
1. Что такое сложные алгоритмы и программы?
2. Что такое упорядоченная последовательность?
3. Что такое упорядочение методом «пузырька»?
4. Как доказывается правильность сложных программ?
5. Что такое разработка программ «сверху-вниз»?
З а д а ч и
1. Составьте алгоритм и программу обработки данных о товарах и постройте обоснование их правильности для следующих задач:
а) подсчет планируемых доходов от продажи товаров;
б) подсчет начальной суммы вложений реализации товаров;
в) подсчет планируемой прибыли от продажи товаров;
г) подсчет текущей задолженности.
2. Составьте алгоритм и программу сортировки данных о товарах и постройте обоснование их правильности для следующих задач:
а) сортировка данных по начальному количеству;
б) сортировка данных по остаточному количеству;
в) сортировка данных по начальной стоимости;
г) сортировка данных по продажной цене.
3. Составьте алгоритм и программу сортировки данных о товарах по следующим признакам и приведите обоснование их правильности:
а) по доле планируемых доходов от реализации товаров;
б) по доле прибыли от реализации товаров;
в) по доле убыточности реализации товаров.