Данная публикация представляет собой сокращенный перевод руководства Мирко Стожилковича Hands-On Linear Programming: Optimization With Python. Для удобства читателей текст перевода также адаптирован в виде Jupyter-блокнота.
Линейное программирование – это набор методов, используемых в математическом программировании, также называемых математической оптимизацией. Эти методы используются для решения систем линейных уравнений и неравенств, перед которыми стоит цель максимизации или минимизации некоторой линейной функции. Линейное программирование используется в научных вычислениях, экономике, технических науках, производстве, транспорте, военном деле, логистике, энергетике и т. д.
Экосистема Python включает несколько мощных инструментов линейного программирования. Из этого руководства вы узнаете:
- что такое линейное программирование и в чем его польза;
- какие инструменты Python подходят для линейного программирования;
- как построить модель и решить задачу линейного программирования на Python.
Что собой представляет линейное программирование
Системы линейных уравнений и неравенств часто имеют множество возможных решений.
Линейное программирование – это набор математических и вычислительных инструментов, позволяющих найти конкретное решение системы, которое соответствует максимуму или минимуму какой-либо другой линейной функции. Линейное программирование – это фундаментальный метод оптимизации, десятилетиями применяемый в областях, требующих большого объема математических вычислений. Эти методы точны, сравнительно быстры и подходят для множества практических приложений.
Смешанно-целочисленное линейное программирование – это вид линейного программирования, которое фокусируется на обработке задач, где хотя бы одна переменная принимает дискретные целые, а не непрерывно меняющиеся значения.
Целочисленные переменные важны для правильного представления количеств, естественным образом выражаемых целыми числами, таких как число выпущенных самолетов или количество обслуженных клиентов.
Особенно важным видом целочисленных переменных являются бинарные переменные, имеющие лишь значения 0
или 1
, и полезные при принятии решений вида «да»/«нет». Например, следует ли строить завод, включить или выключить машину. Также их можно использовать для имитации логических ограничений.
Смешанно-целочисленное линейное программирование позволяет преодолеть многие ограничения линейного программирования. Можно аппроксимировать нелинейные функции кусочно-линейными, использовать полунепрерывные переменные, логические ограничения модели. Это требовательный к ресурсам инструмент, но достижения в области компьютерного оборудования и программного обеспечения сделали его более доступным.
Линейное программирование на Python
Базовый метод решения задач линейного программирования называется симплекс-методом, другой популярный подход – метод внутренней точки. Задачи смешанного целочисленного линейного программирования решаются с помощью более сложных и ресурсоемких методов, таких как метод ветвей и границ.
Заметим, что почти все широко используемые библиотеки линейного программирования и смешанно-целочисленного линейного программирования написаны на языках Fortran, C или C++, так как линейное программирование требует интенсивной вычислительной работы с матрицами, часто очень большими. Соответствующие инструменты Python – это просто удобные интерфейсы для работы с низкоуровневыми библиотеками – солверами.
В этом руководстве для определения и решения задач линейного программирования мы будем использовать Python-библиотеки SciPy и PuLP.
1. Примеры задач линейного программирования
1.1. Небольшой показательный пример
Рассмотрим следующую задачу максимизации:
Нам нужно найти такие x
и y
, чтобы выполнялись «красное», «синее» и «желтое» неравенства, а также ограничения x ≥ 0
и y ≥ 0
. При этом решение должно соответствовать максимально возможному значению z
.
Независимые переменные, которые нужно найти (x
и y
) называют переменными решения (decision variables). Функция, которую необходимо максимизировать или минимизировать (z
), – это целевая функция (objective function), функция стоимости (cost function) или просто цель (goal). Неравенства (или уравнения), которым необходимо удовлетворять, называются ограничениями (inequality constraints или equality constraints для обычных уравнений).
Проблему можно визуализировать следующим образом.
Каждая точка серой области удовлетворяет всем ограничениям и является потенциальным решением задачи. Эта область называется областью допустимых решений (feasible region), а ее точки – допустимыми решениями (feasible solutions).
Мы хотим максимизировать z
. Решение, соответствующее максимальному значению z
, называют оптимальным решением.
Обратите внимание, что функция z
линейна. Оптимальное решение должно находиться в одной из вершин области допустимых решений. Иногда весь край допустимой области или даже вся область может соответствовать одному и тому же значению z
.
Представим, что в задачу введено дополнительное ограничение в виде равенства, окрашенного зеленым:
Его можно визуализировать, добавив соответствующую зеленую прямую:
Теперь область допустимых решений не соответствует всей серой зоне. Это лишь часть зеленой линии, проходящей через серую область от точки пересечения с синей линией до точки пересечения с красной.
Если добавить требование, что все значения x
должны быть целыми числами, то мы получим задачу смешанно-целочисленного линейного программирования, и набор возможных решений снова изменится:
Больше нет зеленой линии – только дискретные точки, где значение x
является целым числом. Возможные решения – это зеленые точки на сером фоне.
Эти три примера иллюстрируют задачи линейного программирования – они имеют ограниченные допустимые области решений и конечные решения.
Когда ни одно решение не может удовлетворить все ограничения сразу, задача в рамках линейного программирования неразрешима.
1.2. Задача о распределении ресурсов
В предыдущих разделах мы рассмотрели абстрактную задачу линейного программирования, не связанную с каким-либо реальным приложением. В этом разделе речь пойдет о более практической задачи оптимизации, связанной с распределением ресурсов на производстве.
Предположим, что фабрика производит четыре различных продукта, ежедневное количество первого продукта составляет x_1
, второго продукта – x_2
и т. д. Цель – определить максимальную прибыль ежедневного объема производства для каждого продукта с учетом следующих условий:
- Прибыль (profit) на единицу продукта составляет 20, 12, 40 и 25 долларов для каждого из четырех продуктов соответственно.
- Из-за нехватки рабочей силы (manpower) общее количество единиц, производимых в день, не может превышать 50.
- На каждую единицу 1-го продукта расходуется 3 единицы сырья A. Каждая единица 2-го продукта требует 2 единиц сырья A и 1 единицы сырья B. Каждой единице 3-го продукта требуется 1 единица A и 2 единицы B. Наконец, каждая единица 4-го продукта требует трех единиц. B.
- Из-за ограничений по транспортировке и хранению фабрика может потреблять до 100 единиц сырья A и 90 единиц B в день.
Математическую модель можно определить так:
Целевая функция (прибыль) определяется в условии 1. Ограничение рабочей силы следует из условия 2. Ограничения на сырье A и B могут быть получены из условий 3 и 4 путем суммирования потребностей в сырье для каждого продукта. Наконец, количество продуктов не может быть отрицательным.
В отличие от предыдущего примера, эту задачу не так удобно визуализировать, потому как она имеет четыре переменных. Однако принципы остаются теми же.
2. Линейное программирование на Python. Практическая реализация
В этом руководстве мы будем использовать для решения описанной выше задачи линейного программирования два пакета Python :
SciPy
– универсальный пакет для научных вычислений с Python. Его внутренний пакет scipy.optimize можно использовать как для линейной, так и для нелинейной оптимизации.PuLP
– API линейного программирования Python для определения задачи и вызова солверов. По умолчанию в качестве солвера используется COIN-OR Branch and Cut Solver (CBC). Еще один отличный солвер с открытым исходным кодом – GNU Linear Programming Kit (GLPK).
2.1. Установка SciPy и PuLP
Чтобы следовать этому руководству, вам необходимо установить SciPy и PuLP.
Возможно, вам потребуется запустить pulptest
или sudo pulptest
, чтобы включить солверы PuLP, особенно если вы используете Linux или Mac:
2.2. Использование SciPy
В этом разделе мы рассмотрим, как использовать библиотеку SciPy по оптимизации и поиску корней для линейного программирования. Начнём с импорта scipy.optimize.linprog()
:
2.3. Решение первого примера c помощью SciPy
Начнём с решения первого (дополненного) примера:
linprog()
решает только задачи минимизации (не максимизации) и не допускает ограничений-неравенств со знаком больше или равно (≥
). Чтобы обойти эти проблемы, нам необходимо изменить описание задачи перед запуском оптимизации:
- Вместо максимизации
z = x + 2y
минимизируем отрицательное значение (−z = −x − 2y
). - Вместо знака
≥
мы можем умножить «желтое» неравенство на-1
и получить противоположный знак (ограничения по осям рассмотрим далее).
На следующем шаге определяем входные значения:
Мы поместили значения из системы в соответствующие списки:
obj
содержит коэффициенты целевой функции,lhs_ineq
иrhs_ineq
содержат коэффициенты из ограничений-неравенств,lhs_eq
иrhs_eq
содержат коэффициенты из ограничивающего уравнения.
Следующим шагом является определение границ каждой переменной. В данном случае они находятся между нулем и положительной бесконечностью:
Однако эти границы совпадают с установленными по умолчанию в linprog()
.
Наконец, пришло время оптимизировать и решить интересующую нас проблему:
Параметр c
относится к коэффициентам из целевой функции. A_ub
и b_ub
соответственно связаны с коэффициентами из левой и правой частей ограничений-неравенств. Точно так же A_eq
и b_eq
относятся к ограничениям уравнений. Параметр bounds
служит для указания нижней и верхней границ переменных решения.
Параметр method
определяет используемый алгоритм линейного программирования. Доступны три варианта:
- по умолчанию используется метод внутренней точки: method = "inner-point",
- измененный двухфазный симплекс-метод method="revised simplex",
- симплекс-метод method="simplex"
linprog()
возвращает структуру данных со следующими атрибутами:
.con
– остатки ограничения-равенства;.fun
– оптимальное значение целевой функции (если найдено);.message
– словесный статус решения;.nit
– количество итераций, необходимых для завершения расчета;.slack
– значения так называемых дополнительных переменных – разниц между значениями левой и правой сторонами ограничений;.status
– целое число от 0 до 4, отражающих результат решения: например, 0, когда было найдено оптимальное решение;.success
– логическое значение, показывающее, найдено ли оптимальное решение;.x
– массив NumPy, содержащий оптимальные значения переменных решения.
Доступ к атрибутам можно получить по отдельности:
Графически результат можно отобразить следующим образом.
Вначале наша задача органичивалась только неравенствами. Если удалить параметры зеленого уравнения A_eq
и b_eq
из вызова linprog()
, получим следующий результат:
2.4. Решение задачи о производстве с помощью SciPy
Рассмотрим теперь решение второй задачи – о продуктах, рабочей силе и используемом сырье.
Как и в предыдущем примере, нам нужно извлечь необходимые векторы и матрицу из задачи, передать их в качестве аргументов в linprog()
:
Максимальная прибыль составляет 1900
и соответствует x_1 = 5
и x_3 = 45
. В данных условиях производить второй и четвертый продукты невыгодно. Результат позволяет сделать несколько интересных выводов:
- Третий продукт приносит наибольшую прибыль.
- Первая дополнительная переменная (
slack
) равна 0. Это означает, что равны значения левой и правой сторон ограничения для рабочей силы. Завод производит 50 единиц в день, и это его полная мощность. - Вторая дополнительная переменная равна 40: фабрика потребляет 60 единиц сырья A (15 единиц для первого продукта и 45 для третьего) из возможных 100 единиц.
- Третья дополнительная переменная равен 0: фабрика потребляет все 90 единиц сырья B. При этом все это количество потребляется для производства третьего продукта. Вот почему фабрика вообще не может производить второй или четвертый товар и не может произвести более 45 единиц третьего товара. Cырья B просто не хватает.
Возможности линейного программирования SciPy полезны в основном для небольших задач. Для более крупных и сложных проблем разумно использовать другие библиотеки:
- SciPy не поддерживает работу с целочисленными переменными решения.
- SciPy не подразумевает запуск внешних солверов.
- SciPy не предоставляет классы или функции для построения моделей. Определять массивы и матрицы вручную для крупных задач слишком утомительно.
- Также вручную приходится переопределять задачи, как мы это сделали выше.
2.5. Решение первой задачи на линейное программирование с помощью PuLP
Итак, PuLP имеет более удобный API линейного программирования, чем SciPy. Начнем с импорта.
Первый шаг – инициализировать экземпляр LpProblem
для описания модели:
Параметр sense
определяет, решаем ли мы задачу минимизации (параметр LpMinimize
или 1
, установлен по умолчанию) или максимизации (LpMaximize
или -1
).
Создав модель, мы можем определить переменные решения как экземпляры класса LpVariable
:
Значения границ по умолчанию – отрицательная и положительная бесконечности, поэтому в нашем случае необходимо указать нижнюю границу (lowBound = 0
).
Необязательный параметр cat
определяет категорию переменной решения. При работе с непрерывными переменными можно использовать значение по умолчанию "Continuous"
.
Переменные x
и y
теперь можно использовать для создания других PuLP-объектов, представляющих линейные выражения и ограничения:
Построив линейную комбинацию нескольких переменных решения, мы получаем экземпляр pulp.LpAffineExpression
, представляющий линейное выражение. Выражения можно комбинировать с операторами ==
, <=
и >=
и получать экземпляры pulp.LpConstraint
– линейные ограничения вашей модели.
Опишем теперь ограничения. В отличие от SciPy, с PuLP не нужно создавать списки и матрицы. Просто записываем выражения Python и добавляем в модель с помощью оператора +=
:
LpProblem
позволяет добавлять ограничения в модель, определяя их как кортежи. Первый элемент кортежа – экземпляр LpConstraint
, второй – его удобочитаемое имя.
Аналогично описывается целевая функция:
Теперь можно посмотреть полное определение модели:
Строковое представление модели содержит все соответствующие данные: цель, переменные, ограничения и их имена.
Теперь мы готовы решить задачу. Достаточно лишь вызвать метод .solve()
для объекта модели.
Метод .solve()
вызывает базовый солвер, изменяет объект модели и возвращает целочисленный статус решения, равный 1, если найден оптимум. Остальные коды состояний описаны в документации.
Результаты оптимизации доступны в виде атрибутов модели:
model.objective
содержит значение целевой функции, model.constraints
– значения дополнительных переменных, а объекты x
и y
имеют оптимальные значения переменных решения.
Результаты получились примерно такие же, как у SciPy.
Чтобы получить смешанно-целочисленное решение, достаточно обозначить это при помощи параметра cat
:
Теперь x
– целое число, как указано в модели. Этот факт меняет решение. Покажем это на графике:
Как видите, оптимальным решением является крайняя правая зеленая точка на сером фоне. Это решение с наибольшими значениями как x
, так и y
, дающее максимальное значение целевой функции.
2.6. Решение задачи о производстве с помощью PuLP
Подход к определению и решению второй задачи такой же, как и в предыдущем примере:
Как видите, решение согласуется с тем, что мы молучили с помощью SciPy. Наиболее выгодное решение – производить в день 5 единиц первого продукта и 45 единиц третьего.
Давайте сделаем задачу более интересной. Допустим, из-за проблем с оборудованием, фабрика не может производить первую и третью продукцию параллельно. Какое решение наиболее выгодно в этом случае?
Теперь у нас есть еще одно логическое ограничение: если x_1
положительно, то x_3
должно равняться нулю, и наоборот. Здесь пригодятся бинарные переменные решения. Введем две переменные y_1
и y_3
, которые будут обозначать, генерируются ли вообще первый или третий продукты:
При таких условиях оказывается, что оптимальный подход – исключить первый продукт вовсе и производить только третий.
Заключение
Теперь вы в общих чертах представляете, с какими задачами имеет дело линейное программирование и как использовать Python для решения подобных задач.
Теперь – после прохождения этого руководства – вы умеете:
- определить модель, которая описывает задачу в SciPy и PuLP;
- создать программу Python для оптимизационной задачи;
- запустить программу оптимизации, чтобы найти решение задачи;
- получить результат оптимизации.
Если вы хотите узнать больше о линейном программировании, вот несколько отправных точек, с которых можно начать:
- русскоязычная и анлоязычная вики-страницы о линейном программировании;
- русскоязычная и англоязычная вики-страницы о целочисленном программировании;
- туториал на Brilliant.org;
- вводный курс MIT о математическом программировании.
Следите за нашими тегами Python и Математика!
А как вы использовали линейное программирование?