English
Некоммерческое партнёрство Прозрачный мир
О нас|Контакты|Карта сайта|
Поиск

Методика тематической верификации

Тематическая верификация данных, полученных на основе интепретации космических снимков.

Скачать

Очевидно, что время и средства в любом проекте не позволяют произвести тотальную проверку анализируемой территории. Следовательно, первая задача состоит в том, чтобы имелась в наличии репрезентативная выборка полевых данных для статистически достоверной верификации.
При создании такой выборки необходимо учитывать следующие аспекты:

- обоснованный выбор классов для верификации;
- наличие четких определений и описаний каждого верифицируемого класса;
- определение размера элемента выборки (sampling unit);
- определение необходимого количества таких элементов для верификации;
- определение схемы деления территории для репрезентативного отбора верификационных элементов (или, другими словами, определить алгоритм отбора)


Выбор классов для верификации.

Исходя из принципов целесообразности, при работе с картой, содержащей значительное количество классов, лучше уделить внимание тем, которые обладают большей вариабельностью. Применительно к нашему проекту, предлагаю провести верификацию для следующих классов:
1. еловые сообщества
2. сосновые зеленомошные
3. сосновые лишайниковые
4. сосновые сфагновые
5. лиственные
6. смешанные
7. болота сфагновые
8. болота осоковые
9. тундры


Четкое описание классов.

Поскольку в любом проекте существует собственное видение того, по каким критериям классифицировать изображения, необходимо правила выделения того или иного класса объектов выразить количественно или строго формализовать, чтобы избежать сомнений и разночтений при сборе полевых данных для верификации.
В нашем случае мы руководствовались следущими:
1. Тип сообщества определялся по доминирующему виду (сосна-ель) или типу (хвойные-лиственные). Доминирующим считался вид (или тип), площадь крон которого составляет более 50%. Таким образом отделялись друго от друга темнохвойные, сосновые и лиственные сообщества.
2. В том случае, если доминантов было более одного (сосна и ель, сосна и лиственные, ель и лиственные), сообщество относилось к смешанному классу.
3. Сухие разреженные сосновые сообщества с доминированием лишайников под пологом относилились соответсвенно к лишайниковым соснякам.
4. Влажные разреженные сосняки с доминированием сфагнума – к сфагновым.
5. Более густые, промежуточные по увлажнению, с зеленым мхом или смешанным мохово-лишайниковым покровом сосняки маркировались как зеленомошные.
6. Болота с доминированием (>50%) сфагнума, но без открытой воды относились к классу сфагновых болот.
7. Болота с доминированием (>50%) травяного покрова, но без открытой воды относились к классу травяных (осоковых).
8. Любые болота с доминироваем (>50%) участков с открытой водой относились к классу обводненных болот.
9. Участки с разреженной травяно-кустарничковой растительностью в Мурманской области или на морском побережье Архангельской области или на возвышенных учасках северной Карелии относились к тундре.

 

Размер элемента выборки.

Чтобы избежать ошибок, связанных с допустимой точностью привязки космических изображений, нецелесообразно брать в качестве единицы информации участок территории размером в пиксель. Общепринятой практикой является выбор в качестве такой единицы кластера однородных пикселей размером 3x3. Таким образом, в нашем случае в полевых условиях для описания желательно выбирать участок с однородной растительностью размером не меньше 1 га (90x90 метров).


Количество описаний.

Согласно общепринятой практике, минимально необходимое количество описаний для корректной верификации – 50 на класс.


Схема распределения описаний.

Существует несколько схем для организации сбора данных:
- случайная выборка;
- систематическая выборка;
- кластерная выборка;
- стратифицированная случайная выборка.

Все они имеют как преимущества, так и недостатки.
Случайная выборка обеспечивает независимость выбора точек и, как следствие, адекватную статистику. Но вместе с тем, такая схема может иметь трудности реализации в полевых условиях, поскольку генератор случайных чисел не учитывает особенности ландшафта, и случайные точки могут лежать вне пределов досягаемости ислледователей. Кроме то, такое случайное распределение точек может не покрыть какие-то небольшие, редко встречающиеся, но важные в статистическом отношении классы.
Систематическая выборка представляет собой охват территории на какой-то регулярной основе. Премущество такой схемы в унифицированном отборе точек со всей исследуемой территории. Однако, такой подход может не обеспечить должного уровня независимости выборки из-за т.н. периодичности. Другими словами, если территория равномерно покрыта сетью точек, из-за наличия протяженных участков однородной растительности, точек с такого участка соберется значительно больше, чем с тех классов, которые неоднородно разбросаны по территории. Что в результате может привести к переоценке статистической точности карты в целом.
Кластерная выборка представляет собой выбор ограниченной территории, на которой представлены все нуждающиеся в верификации классы. Очень удобна в плане практической реализации. Но такой алгоритм требует учета особенностей пространственной автокорреляции, при которой близко расположенные объекты имеет более схожие характристики, чем объекты, разнесенные в пространстве. Наличие пространственной автокорелляции приводит к тому, что отобранные точки не могут считаться независимыми.
Наиболее адекватным и сбалансированным на сегодняшний момент методом отбора является вариация случайной выборки – стратифицированная случайная выборка. Суть алгоритма заключается в случайном распределение точек независимо в каждом классе. Таким образом, каждый, даже самый редко встречающися класс, получает минимально необходимый репрезентативный набор точек для верификации. В практическом плане такой подход можно усовершенствовать, добавив в выборку заведомо большее количество точек, но ограничить территорию каким-то разумным расстоянием от дорог. Думаю, буфер в 1 км будет достаточным расстоянием.