Автоматизированное дешифрирование аэрокосмических снимков
Автоматизи́рованное дешифри́рование аэрокосми́ческих сни́мков, распознавание объектов путём компьютерной обработки цифровых изображений, на основе закодированных значений спектральной яркости каждого элемента пространственного разрешения (пиксела). Термин «автоматизированное дешифрирование» всё чаще заменяется или используется наравне с терминами «компьютерное дешифрирование» или «компьютерная обработка изображений» (хотя последний включает не только дешифрирование, но и обширный круг задач предварительной обработки). Совокупность методов автоматизированного дешифрирования относят к машинному обучению, использующему методы классификации разной сложности, машинное обучение, в свою очередь, – одно из применений искусственного интеллекта.
Классификация элементов изображения (пикселов цифрового снимка) предполагает разделение пространства признаков на области (классы) с определёнными схожими значениями признаков. Наиболее значимым и устойчивым дешифровочным признаком при автоматизированном дешифрировании служит относительная яркость объекта. Для панхроматических (чёрно-белых) снимков – это яркость во всём видимом диапазоне длин волн, а для многозональных – яркость в отдельных каналах, которая обусловлена спектральной отражательной способностью объекта. С появлением и всё более широким распространением снимков высокого и сверхвысокого пространственного разрешения начали развиваться методы и алгоритмы, использующие не только спектральные признаки. К их числу относятся, например, алгоритмы, основанные на текстуре изображения, методы объектно-ориентированной классификации и нейронных сетей, где, в частности, обеспечивается возможность использовать не отдельные пикселы изображения, а выделенные на предварительном этапе области, которые дешифрируются на основе базы эталонных изображений. Для алгоритмов распознавания рисунка изображения с использованием текстурных признаков первостепенное значение имеет пространственная изменчивость значений яркости пикселов в пределах изображения.
Задача автоматизированного дешифрирования формально сводится к классификации – последовательной сортировке всех пикселов цифрового снимка в соответствии со значениями яркости во всех каналах на несколько групп. При компьютерной классификации различают тематические (информационные) классы объектов и классы, формально выделяемые при обработке снимков на основе некоторого признака. Информационные классы – это категории, представляющие интерес для дешифровщика: например, различные виды лесов или сельскохозяйственных культур, виды землепользования, типы почвенного покрова и т. п. Спектральные классы – это группы пикселов, сходных по значениям яркости в нескольких спектральных каналах, выявляемые посредством автоматической сортировки. Автоматизированное дешифрирование цифрового снимка предполагает установление соответствия спектральных классов тематическим и получение итогового изображения с выделенными объектами.
Отнесение пикселов к тому или иному классу зависит от метода автоматизированного дешифрирования. Выделяется несколько групп методов.
1. Неконтролируемая классификация, или классификация без обучения, которую также часто называют кластерным анализом или кластеризацией, выполняет группировку элементов изображения (пикселов) на основе статистического анализа их яркостных характеристик без предварительного знания характеристик информационных классов объектов на местности. Исходная информация, задаваемая дешифровщиком для работы алгоритма, минимальна: количество классов, которые нужно получить; параметры, определяющие длительность работы. Изображение разделяется на сходные по спектральным характеристикам пикселов массивы – кластеры. Затем дешифровщик анализирует характеристики кластеров, сопоставляет их с характеристиками реальных географических объектов и определяет, каким объектам соответствуют сформированные кластеры. Наиболее известные методы неконтролируемой классификации – K-средних, ISODATA.
2. Контролируемая классификация, иногда называемая классификацией с обучением, основывается на признаках объектов, принадлежность которых к определённому информационному классу на местности известна (например, объекты на эталонных участках, определённых при полевом дешифрировании). В качестве начальных центров классов используются заранее определённые дешифровщиком эталонные значения спектральной яркости известных объектов. Обучение заключается в интерактивном присвоении этих значений соответствующим информационным классам. В процессе классификации значения яркости каждого пиксела сравниваются с эталонными, и пиксел относится к наиболее подходящему классу объектов. Качество обучения можно оценить по правильности классификации самих эталонных участков. Наиболее известны методы: параллелепипедов, минимальных расстояний, максимального правдоподобия, опорных векторов, «случайного леса».
3. Классификация на основе текстуры изображения предполагает анализ распределения яркостей пикселов снимка в пределах заданной области – «скользящего окна», которое передвигается по изображению, в результате чего центральному пикселу окна присваивается значение вычисленной характеристики. Хотя текстура – качественная характеристика, её выделяют с помощью математических операций. В результате анализа текстуры «скользящим окном» формируется новое изображение, где классы равны или пропорциональны рассчитанному параметру. Это изображение текстурных классов можно использовать как дополнительный слой (аналог спектральной зоны) при тематической классификации по другим (в том числе спектральным) признакам.
4. Классификация на основе нейронных сетей предполагает биологический подход к решению задачи распознавания образов. Нейронная сеть – математическая модель, имитирующая работу мозга в том, что обработка осуществляется с помощью многочисленных простых элементов сети – т. н. нейронов, дублирующих друг друга и работающих одновременно. Автоматизированное дешифрирование методом нейронных сетей опирается на предварительный анализ заранее классифицированных или отдешифрированных специалистом снимков с известными признаками разных объектов, в результате которого компьютером определяются закономерности или взаимосвязи исходных (обучающих) данных и их характеристик. Выявленные закономерности взаимосвязей объектов и характеристик (их называют маркированными, или размеченными, данными) используются затем для классификации массива неизвестных данных (например, многозональных снимков).
Ввиду постоянно возрастающих объёмов поступающих материалов съёмок применение компьютерных методов дешифрирования становится преобладающим. При этом наибольшее распространение получают разнообразные гибридные методы, предполагающие использование разных алгоритмов и их сочетаний. Роль эксперта-дешифровщика возрастает на этапах выбора оптимальных методов решения задачи классификации с учётом свойств исходных снимков, а также знаний территории и объектов исследования, подготовки обучающих выборок и оценки качества результатов обработки.