Стерлигов Борис Васильевич
Автореферат диссертации на соискание ученой степени кандидата геолого-минералогических наук
|
содержание |
Изучение геологических объектов, как порождений процессов, показывает, что ситуация, в которой реализуется в природе процесс, такова, что его точное предсказание невозможно. Математические модели геологических объектов и процессов можно рассматривать как вероятностные (стохастические). В данном исследовании описывается стохастический принцип моделирования строения геологических объектов, при котором однотипные объекты геологической карты представлены как параметрические слои в соответствующей базе данных. Для каждого параметрического слоя строятся карты кратчайших расстояний до эталонных объектов слоя, которые, по определенному закону, преобразовываются в соответствующие карты вероятностных значений перспективности на золоторудную минерализацию. Итоговая карта участков, перспективных под поиски золоторудных месторождений, получается путем комбинации вероятностных карт каждого параметрического слоя. Первостепенное значение имеют два этапа: а) описание степени вклада каждого параметрического слоя на этапе объединения вероятностных карт, б) выбор одного из математических методов преобразований, используемого для пересчета карты расстояний до объектов параметрических слоев в карты вероятностных значений.
Перед автором стояла задача создания искусственных математических моделей, отражающих типичные геологические ситуации территорий, относящихся к золоторудным провинциям. При таком подходе в пределах определенной площади исследования необходимо задать пространственные координаты известных месторождений, которые можно рассматривать как точки, и участвующих в последующем анализе геологических объектов, которые мы аппроксимируем простыми геометрическими формами: эллипсами, линиями. Заметим, что многоугольники могут соответствовать контурам интрузий, а линии - зонам разрывных нарушений. Изобразив, таким образом, модель, мы можем исследовать пространственные связи расстоянием между положением золоторудных объектов: а) границами распространения интрузий; б) разломами. На рис. 1 проиллюстрирована методика вышеописанного подхода на примере одного из участков Енисейского Кряжа. Основным параметром, устанавливающим пространственно-корреляционные связи между положением месторождения и объектами геологической карты, является вид функции пространственного распределения расстояний до них.
Автором разработан и реализован новый алгоритм автоматизированного создания искусственных моделей типичных геологических ситуаций золоторудных провинций (Стерлигов, 2010).
В процессе создания искусственных моделей золоторудные месторождения рассматриваются как индивидуальные точки, с координатами положения центра (x0, y0), разрывные нарушения и др. (полилинии) аппроксимируются отрезками, интрузии и др. эллипсами (рис.1в). В разработанном программном обеспечении искусственная модель создается в два этапа: а) задаются топологические свойства объектов (характер распределения объектов на исследуемой области, задание азимута, размер и число сегментов, эллипсов), и б) задаются входные функции FY, описывающие пространственное распределение индивидуальных точек вокруг каждого типа объектов.
Искусственной модели состоит из двух параметрических слоев. Первый слой содержит множество отрезков = {l | A(l)}. Второй слой состоит из множества эллипсов = {e | B(e)} (рис. 1в). Для множества E эллипсов задается параметр p - отношение области, занятой эллипсами SE, к общей области исследования S:
. | (1) |
Другим важным параметром является NE - количество эллипсов. Координаты (xe;ye) центров эллипсов и a, b полуоси эллипса определяются автоматически.
Основными свойствами множества сегментов l является L - общая длина отрезков, и NL - общее число отрезков. Отрезки задаются координатами их начала (x1, y1) и конца (x2, y2), азимут отрезка задается углом β (Рис. 1в).
С помощью программного обеспечения можно создать 12 возможных конфигураций параметрического слоя, содержащего эллипсы е, и 6 для отрезков l, что дает в общей сложности 72 базовых класса искусственных моделей геологических карт с идентичным способом задания топологических параметров объектов.
Для выбора наиболее адаптированной искусственной модели для прогноза золоторудных зон, можно использовать понятие информационной энтропии, предложенной Шенноном (1948, 1963). Энтропия это мера неопределённости какого-либо опыта (испытания), который может иметь разные исходы, а значит и количество информации, содержащееся в модели. Для расчета энтропии необходимо определить функцию ожидаемого распределения расстояний до объектов через множество произвольных (всех) точек области. Такое множество точек q создается по регулярной сети; число точек NQ зависит от общей площади модели без площади, занятой эллипсами (рис. 1.в):
, | (2) |
где cellsizeX и cellsizeY - размер ячейки регулярной сети вдоль оси X и оси Y, соответственно. Для гарантии, что множество точек является представительным, использовалась регулярная сеть с размерами, минимум 50 на 50 точек. Энтропия H дискретной случайной величины XE с возможными значениями {X1..., XNE} и функцией плотности вероятности FX (ρ) равна:
, | (3) |
На следующем этапе определяется пространственное распределение индивидуальных точек m. Создается множество = {m | C(m)} индивидуальных точечных объектов m. Пространственное положение каждого точечного объекта m непосредственно определятся кратчайшим расстоянием до ближайшего эллипса ρf и кратчайшего расстояния до ближайшего отрезка ρu (рис. 1в). Входные функции плотности вероятности FY(ρ) и UY(ρ) пространственного распределения индивидуальных точек вокруг эллипсов и сегментов, соответственно, задаются пользователем. Для описания входных функций используется классический нормальный закон распределения:
, | (4) |
где σ2, дисперсия, и μ, математическое ожидание, задаются пользователем. Получается два различных распределения плотности вероятности для каждого типа объектов (эллипсы или отрезки): входное и выходное (рассчитанное после распределения индивидуальных точек) (рис. 2). Таким образом, индивидуальные точки распределяются вокруг геометрических объектов, с помощью входных функций плотности вероятности (4), FY(ρ) для эллипсов и UY(ρ) для отрезков.
Для выявления аномального пространственного распределения индивидуальных точек вокруг объектов оценивается статистическое различие между ожидаемым (FX) и выходным (FZ) функциями распределения вероятностей. Однако результаты проведенного стохастического моделирования показывают, что топологические свойства объектов параметрических слоев - линейного или поверхностного типа - не всегда позволяют однозначно восстановить входную функцию, имея выходную.
Ожидаемое распределение для всех точек карты рассчитывается либо теоретическим FX'(ρ), либо эмпирическим FX (?) путем, используя множество всех точек q. Рассматривая случайное распределение множества точек на плоскости, Кларк и Эванс, (1954) показали, что среднее расстояние между точками равно
, | (5) |
где δE - плотность точек (координат центров эллипсов) на единицу площади.
В таком случае, ожидаемое среднее расстояние между центрами эллипсов e также равно (5). При использовании уравнения (5) для определения среднего расстояния непосредственно между ближайшими эллипсами вводятся поправки, путем вычитания двух - "средних" радиусов эллипсов е из , то есть:
, | (6) |
где "средний" радиус произвольного эллипса получается из уравнения:
, | (7) |
где средняя площадь эллипсов:
, | (8) |
а SE общая площадь эллипсов.
Автором получено уравнение зависимости между количеством эллипсов и средним расстоянием между ними:
, | (9) |
Описанное вычисление среднего расстояния между эллипсами e основано на определении первого момента распределения и, следовательно, равняется математическому ожиданию теоретического распределения расстояний FX'(?) от произвольных точек карты до ближайших эллипсов. Для выведения "универсальных" кривых рассмотрим средний радиус эллипсов, зависящий от площади области p занятой эллипсами, полученный из уравнений (7) и (5). Тогда уравнение (9) примет следующий вид:
, | (10) |
График, показанный на рисунке 3a, построен, для случайного пространственного распределения эллипсов в пределах параметрического слоя. Однако пространственное распределение эллипсов может быть также групповым или равномерным. Для этого рассчитывается коэффициент кластеризации:
, | (11) |
где среднее кратчайшее расстояние между ближайшими эллипсами:
, | (12) |
а ρe расстояние между ближайшими эллипсами (Кларк и Эванс, 1954). Тогда, перепишем уравнение (10) в виде:
, | (13) |
и подставим в (10). Используя уравнения (10), (12) и (13) получим неравенство:
, | (14) |
В отличие от эллипсов, достаточно сложно использовать теоретический подход для описания пространственного распределения множества отрезков, поэтому, искомые параметры распределения получены эмпирическим путем. Для построения эмпирических кривых было рассчитано более 1000 моделей, вычисленных с помощью программного обеспечения, описанным выше. На рис. 3б представлены графики изменения математического ожидания в зависимости от средней и общей длины сегментов.
|
Рис. 3 Определение оптимальной геометрической конфигурации, позволяющей выявить аномальное пространственное распределение индивидуальных точек вокруг объектов.
a) для эллипсов; б) для отрезков (сегментов).
|
Важным моментом при использовании теоретических расчетов стохастического моделирования является ответ на вопрос: "Какое количество исходных данных по месторождениям необходимо (размер выборки) для надежного статистического анализа выявления пространственно-корреляционных связей между элементами геологической карты и положением золоторудных месторождений?" Для этого сравнивается входное FY(ρ) распределение расстояний между индивидуальными точками и геометрическими объектами и выходное FZ(ρ) полученное для каждого параметрического слоя эмпирическим путем (рис. 4).
|
Рис. 4 Результаты тестирования на минимальное число индивидуальных точек, необходимое для надежного статистического анализа.
|
В случае если выходное распределение расстояний FZ(ρ) соответствует входному распределению FY(ρ), можно полагать, что количество индивидуальных точек m достаточно для статистического анализа. Для каждой искусственной модели количество "наблюденных" индивидуальных точек m поэтапно уменьшалось до NM = 3. По результатам тестирования было установлено, что, имея выборку из NM = 42 индивидуальных точек, можно уверенно гарантировать, что выходная FZ функция распределения вероятностей не будет отличаться от входной функции FY с вероятностью 95%, на уровне значимости 5%.
Одно из возможных применений искусственных геологических моделей состоит в определении устойчивости решения обратной задачи (восстановления входного распределения FY) в зависимости от параметров модели. Устойчивость системы, определяется на основе "потери" некоторой части информации (объектов). Тестирование происходит в несколько этапов, и выполняется в следующей последовательности:
1. Построение оригинальной искусственной модели карты;
2. Определение местоположения индивидуальных точек m, используя входные функции распределений FY(ρ) и UY(ρ), заданных пользователем;
3. Проверка "пригодности" полученной модели для статистического анализа;
4. Удаление шаг за шагом и случайным способом, некоторого постоянного числа объектов (эллипсов или отрезков) из оригинальной искусственной модели;
5. На каждой стадии проводится оценка статистического различия между распределениями F'Z(ρ) и U'Z(ρ) вычисленными для новой ("модифицированной") модели и FZ(ρ), UZ(ρ) полученными для стартовой модели.
Автором, на искусственных моделях, были определены необходимые минимальные размеры выборок эллипсов е из множества , при котором надежно восстанавливается входная функция FY. Для каждой исходной модели был определен минимальный размер выборки эллипсов е из множества . По результатам тестирования, было установлено, что групповое пространственное распределение эллипсов е имеет некоторое преимущество по сравнению со случайным. Количественно, это можно оценить разницей (минимум в 5%) между необходимыми минимальными размерами выборок (Стерлигов Б.В., 2010). Схожим образом определяется минимальные необходимые размеры выборок отрезков l из множества L для различных типовых геологических моделей. Полученные зависимости учитывались при анализе реальных геолого-геофизических данных Енисейского кряжа.
Далее описывается способ классификации параметрических слоев, основанный на использовании значений энтропии, как "благоприятных", "неблагоприятных" или "опасных", для целей восстановления входной FY функции распределения расстояний. Для этого одновременно проводится, с одной стороны, сравнение выходных FZ и ожидаемых FX функций и, с другой стороны, входных FY и выходных FZ функций. Для определения статистического различия между двумя функциями использовалось расстояние DKL, в качестве статистической переменной, (Kullback и Leiber, 1951). Для решения проблемы масштаба, размеров изучаемой области, предлагается использовать фактор избыточности, вычисляемый как: W = 1 - Энтропия / (Максимальная Энтропия) (Шеннон, 1963).
На рис. 5 представлены результаты для двух различных входных функций: ƒN(ρ, μ=1.5, σ=2) и ƒN(ρ, μ=1.5, σ=4). Определены зависимости изменения DKL от значений фактора избыточности W, вычисленных при сравнении а) ожидаемой FX и выходной FZ функции (черные точки), и б) входной FY и выходной FZ функции (серые точки), также показаны линии тренда и кривые нормального отклонения (Рис. 5). Статистические тесты, показывают, что при фиксированной функции входного FY распределения значения расстояний DKL разница между выходным FZ и ожидаемым FX распределениями (черные кривые) уменьшается, при одновременном уменьшении энтропии или увеличении значения фактора избыточности (Рис. 5). Вторая кривая показывает различие между входным FY и выходным FZ распределениями. Показано, что, чем выше дисперсия входного распределения, тем больше будет различие между входными и выходными функциями (Рис. 5). Критическое значение фактора избыточности WCR вычисляется путем пересечения двух кривых (Рис. 5). Далее используя статистику Пирсона, для входной FY и выходной FZ функции определены предельные значения Winput и Woutput, при которых различие между каждой из функций и соответствующим ожидаемыми функциями незначительно (см. кривые соответствующие тесту ?? на рис. 5). Для достаточно большого количества объектов (>20) справедливо неравенство Woutput ≥ Winput. Параметрические слои со значением коэффициента избыточности, лежащим в интервале Woutput ≤ W < WCR, классифицируются как конфигурации "высокого риска", Winput ≤ W < Woutput, как "опасные" конфигурации и при W < Winput как "благоприятные" конфигурации.
|
Рис. 5 Определение "мощности" пространственных аномальных распределений.
графики a) и б) соответствуют двум различным входным функциям распределения.
|
Опираясь на результаты проведенного стохастического математического моделирования, автор предлагает использовать для решения практических задач следующую поэтапную методику статистического анализа геолого-геофизических данных для выделения участков, перспективных под поиски рудных месторождений.
На первом этапе геологические, геофизические и геохимические данные по форме их проекции на горизонтальную плоскость разделяются на три типа: полигональные (интрузивные, магматические образования и пр.), линейные (разрывные нарушения и пр.) и точечные (рудные месторождения). В связи с этим необходимо отметить, что данный вид статистического анализа целесообразно проводить только для тех типов рудных объектов, которые в масштабе исследования могут быть приняты в качестве точки. Каждый тип данных (полигональный, линейный и точечный) в свою очередь разделяется на "параметрические слои", содержащие однотипные объекты (либо по возрасту, либо по типу, либо по происхождению и т.д.).
Второй этап заключается в: а) определении общей площади исследования, в пределах которой рассматриваются проекции объектов каждого параметрического слоя на выбранную плоскость исследования, и б) определении геометрических параметров проекций объектов для каждого параметрического слоя.
На третьем этапе для объектов полигонального и линейного типа необходимо определить параметры "ожидаемых распределений" соответствующих параметрических слоев. На четвертом этапе для каждого параметрического слоя рассчитывается "энтропия слоя". На предпоследнем этапе параметрические слои классифицируются по степени влияния на положения рудных объектов. На последнем этапе рассчитываются карты так называемых "вероятностных очков" и выделяются участки, перспективные под поиски рудных месторождений.
|