Лесная промышленность является важной отраслью экономики многих стран. На территорию России приходится 1/4 всех мировых запасов древесины. По данным за 2015 год общая лесная площадь превысила 885 млн га, что составляет 45 % всей площади страны. При этом объем запасов составлял порядка 82 млрд м³. Однако доля лесной промышленности в ВВП России составляет всего 2%.

Одной из проблем лесной промышленности являются заболевания деревьев. Ранее, чтобы оценить состояние древесного фонда, было необходимо выезжать на места и делать замеры. Однако с развитием технологий, в частности космической съемки Земли и ее обработки в геоинформационных системах, стало возможно обследование здоровья деревьев по данным дистанционного зондирования Земли (ДЗЗ).

Рассмотрим применение машинного обучения при дешифрировании космической съемки для оценки состояния пальм на островах Тонга:

Кокосы и кокосовые продукты являются важной статьей экспорта в экономике Королевства Тонги. На плантациях (например, близ города Коловаи) растут тысячи пальм. Инвентаризация каждого из этих деревьев требует большого количества времени и трудовых ресурсов. В целях сокращения затрачиваемых на исследование ресурсов целесообразно применение альтернативного метода оценки состояния здоровья и местоположения деревьев при помощи дистанционного зондирования с применением модели глубоко обучения.

Для дешифрирования объектов необходим космический снимок сверхвысокого пространственного разрешения. Модель сможет идентифицировать пальмы только в том случае, если размер пикселов достаточно мал, чтобы различать кроны пальм. Дополнительно, для вычисления состояния здоровья деревьев необходим космоснимок со спектральными каналами, обеспечивающими построение индекса здоровья растительности. 4-х канальные космические снимки со спутника WorldView-3 с пространственным разрешением 30 см прекрасно подойдут для решения таких задач.

Сначала подгрузим космический снимок в ПО ArcGIS:

Рис.1. Космический снимок WorldView-3, загруженный в программное обеспечение ArcGIS
Рис.1. Космический снимок WorldView-3, загруженный в программное обеспечение ArcGIS

На снимке видно большое количество кокосовых пальм. Чтобы посчитать, их на местности или по снимку, понадобится несколько дней. Для того, чтобы модель глубокого обучения сделала эту работу за вас, нужно создать модель для дальнейшего алгоритма действий модели.

Создание обучающих выборок

Для наполнения модели глубокого обучения или любых моделей классификации изображений необходимо создание хороших обучающих выборок. Зачастую, это самый затратный по времени шаг процесса. Для того, чтобы предоставить модели глубокого обучения информацию, необходимую для извлечения всех пальмовых деревьев на снимке, нужно создать объекты из некоторого числа пальм, чтобы «объяснить» модели, какие размер, форма и спектральная сигнатура могут соответствовать данной древесной породе.

Чтобы обеспечить репрезентативную выборку деревьев в каждой области, нужно оцифровать деревья по снимку с помощью функции «Менеджер обучения». Эти объекты записываются в модель в определенном формате, называемом «кусочками изображений». Кусочки изображения – это небольшие блоки изображений, вырезанные из основного изображения. После того, как созданы достаточное число объектов в Менеджере обучения, их нужно экспортировать при помощи инструмента геообработки как кусочки изображений с метаданными.

Создание выборки для обучения модели
Рис.2. и 3. Создание выборки для обучения модели

Около 100 единиц оцифрованных деревьев достаточно, чтобы обучить модель. Оцифровка обучающей выборки может занять время, но это окупается большим количеством выборок. Чем больше примеров вы предоставите модели в обучающих данных, тем более точный результат получится.

Выявление пальмовых деревьев при помощи модели глубокого обучения

Инструменты глубокого обучения в ArcGIS позволяют пользователям интегрировать платформу с внешней средой моделирования глубокого обучения, использующей свёрточную нейронную сеть. Аналогичный набор инструментов глубокого обучения в ArcGIS Pro позволяет обучать собственные данные во внешней модели глубокого обучения, а затем применять результаты модели для классификации изображения.
После внесения критериев выборки можно запускать автоматическое дешифрирование. Результатом станет новый векторный слой с обозначением всех найденных пальм (для наилучшего результата рекомендуется выполнить визуальный контроль):

Рис.4 Результат выполнения автоматического дешифрирования
Рис.4. Результат выполнения автоматического дешифрирования

Оценка здоровья растительности

Для получения сведений о здоровье растительности нужно вычислить Индекс устойчивости к видимой атмосфере (VARI), который был разработан как косвенный показатель индекса листовой поверхности (LAI) и доли растительности (VF) – подумать нужно ли про это что то написать, используя только значения отражения от видимой длины волны:

(Rg - Rr) / (Rg + Rr - R(Rg - Rb))

где Rr, Rg и Rb – значения отражения для красного, зеленого и синего каналов соответственно (Gitelson et al. 2002).

Вычисление индекса устойчивости к видимой атмосфере (VARI)

Для измерения VARI в качестве входных данных необходимы три канала растра (Red, Green, Blue). Для вычисления VARI нужно применить растровую функцию «Арифметика каналов». Растровые функции работают быстрее инструментов геообработки, так как они не создают новые наборы растровых данных. Вместо этого они выполняют анализ в реальном времени по пикселам, по мере перемещения и масштабирования.

После использования функции «Арифметика каналов» слой VARI добавлен в проект. Перемещаясь и масштабируя снимок, можно увидеть объекты береговой линии, дорог, зданий и полей.

Результат вычисления индекса устойчивости к видимой атмосфере (VARI)
Рис.5. Результат вычисления индекса устойчивости к видимой атмосфере (VARI)

Чтобы выяснить, какие деревья требуют внимания, необходимо знать среднее значение VARI для каждого отдельного дерева. Для того, чтобы найти среднее значение VARI для каждого дерева, нужно извлечь лежащее в основе среднее значение VARI и присвоить ему символы, чтобы увидеть, какие деревья «здоровы», а каким требуется помощь.

Ранее выделенные пальмы нужно преобразовать в полигональный слой. После этого можно извлечь среднее значение VARI для каждого полигона (оно будет в таблице атрибутов):

Рис. 6. Преобразование в полигональный слой
Рис.6. Преобразование в полигональный слой

После настройки отображения слоя на основе классификации индекса VARI получается карта с классами объектов, показывающая местоположение, состояние и достоверность модели для каждого пальмового дерева на снимке.

Карта растительности с классами объектов
Рис.7. Карта растительности с классами объектов: красным цветом выделены деревья, нуждающиеся в осмотре; оранжевым – c ухудшенным здоровьем, светло-зеленым – умеренно здоровые, зеленым – здоровые.