Все о геологии :: на главную страницу! Геовикипедия 
wiki.web.ru 
Поиск  
  Rambler's Top100 Service
 Главная страница  Конференции: Календарь / Материалы  Каталог ссылок    Словарь       Форумы        В помощь студенту     Последние поступления
   Геология >> Общая и региональная геология | Научные статьи
 Обсудить в форуме  Добавить новое сообщение

ДОЛГОСРОЧНЫЙ ПРОГНОЗ РЕГИОНАЛЬНЫХ ЗЕМЛЕТРЯСЕНИЙ

Яков Гуральник
guralnik@bezeqint.net
17.09.2009

В работе рассматривается построение статистической модели для эмпирического массива данных - дат крупных землетрясений в районе разлома Сан-Андреас (Калифорния, США), которая позволяет оценить ожидаемую дату следующего землетрясения.

1. Введение

Первый и весьма обнадеживающий прогноз сильных землетрясений относится к середине 70-х годов прошлого века, когда китайские ученые за несколько дней до Хайченского землетрясения (4 февраля 1975, магнитуда 7.3) сообщили местным властям о прогнозе. В считанные часы население г. Хайчен было эвакуировано. Чуть больше года спустя в том же Китае произошло Таншаньское землетрясение (28 июля 1976, магнитуда 7.9), которое целиком разрушило г. Таншань с миллионным населением и унесло сотни тысяч жизней. Здесь также наблюдались многочисленные предвестники, однако отсутствие достаточных статистических данных об их достоверности и эффективности не позволило объявить тревогу. После Таншаньского землетрясения и неудавшегося многолетнего эксперимента по прогнозу землетрясения в Паркфилде (США, штат Калифорния) в середине 80-х годов прошлого века в прогнозных исследованиях наступил период "отлива" и скептического отношения к возможности решения этой проблемы. В конце 80-х годов ХХ века эпоха "отлива" сменилась устойчивым "приливом". Возможно, не последнюю роль в этом сыграло катастрофическое Спитакское землетрясение в Армении (7 декабря 1988, магнитуда 7.2) [1].

К двадцатой годовщине землетрясения в Спитаке на сайте Центра прогнозирования землетрясений "GeoQuake" был опубликован Бюллетень 001 по прогнозу землетрясений для различных регионов мира. В этом документе приведены сценарии развития сейсмической обстановки и прогнозы сильных землетрясений по состоянию на 2008 год, например: "Катастрофическое землетрясение с М=7.7-7.9 в южной Калифорнии ожидается с 2014 по 2016 гг. на сегменте разлома Сан-Андреас в Южной Калифорнии. В зону влияния прогнозируемого землетрясения попадает и Лос-Анджелес" [2].

В зависимости от развития сейсмических процессов результаты прогноза землетрясений постоянно корректируются, и все же удачное предсказание землетрясений - это, скорее, исключение, чем правило [3]. Тем не менее, изучение природы землетрясений продолжается, и хочется надеяться, что эти усилия не напрасны.

2. Исходные данные

Массив исходных данных, полностью представленный в таблице 1, содержит 37 записей, включая 36 датировок палеоземлетрясений силой не менее 7 баллов по шкале Рихтера в районе разлома Сан-Андреас (San Andreas Fault) на территории штата Калифорния в США и одно реальное землетрясение, которое произошло в том же месте в 1857 году. Общий интервал наблюдений составляет почти восемьсот лет, причем землетрясение 1857 года является последним землетрясением такой силы, наблюдаемым в данном районе. А потому вполне естественно возникает вопрос о дате следующего землетрясения. Для поиска содержательного ответа используется статистический анализ исходного массива данных, на основе которого делается попытка построить вероятностную модель ожидаемого землетрясения. Все расчеты выполняются с помощью системы программного обеспечения SAS [4], а необходимые сведения по статистике можно найти в справочнике [5].

Таблица 1. Исходные данные: номер записи - дата в годах (*)
1 - 1065.02 - 1065.03 - 1065.04 - 1095.05 - 1110.06 - 1160.0
7 - 1247.58 - 1250.09 - 1277.510 - 1290.011 - 1305.012 - 1305.0
13 - 1305.014 - 1335.015 - 1335.016 - 1335.017 - 1335.018 - 1335.0
19 - 1345.020 - 1345.021 - 1350.022 - 1350.023 - 1360.024 - 1432.5
25 - 1457.526 - 1460.027 - 1485.028 - 1490.029 - 1550.030 - 1555.0
31 - 1555.032 - 1555.033 - 1555.034 - 1555.035 - 1555.036 - 1585.0
37 - 1857.0(*) Данные представлены Бенни Гуральником benny.guralnik@gmail.com

3. Первичный анализ данных

3.1. Последовательность уникальных дат

Нетрудно заметить, что таблица 1 содержит кратные даты, что позволяет представить исходные данные в виде частотной диаграммы наблюдаемых дат (см. рис.1).

Оказалось, что исходный массив содержит 22 уникальные даты, которые образуют упорядоченную последовательность, где каждая дата встречается ровно один раз. Рассматривая уникальные даты, как выборку из массива наблюдений, можно показать, что эта выборка статистически однородна исходному массиву. В самом деле, согласно проверке, уникальные даты и даты исходного массива согласуются с нормальным распределением на стандартном уровне значимости α = 0.05 (см. табл. 2). Кроме того, их дисперсии и средние значения можно считать одинаковыми, и, следовательно, уникальные даты и исходный массив наблюдений взяты из одной нормальной совокупности. Это означает, что последовательность уникальных дат можно использовать в качестве статистической модели массива исходных данных.

Таблица 2. Проверка однородности исходного массива и уникальных дат
ГипотезаКритерийДанныеp-значение
Нормальность распределенияШапиро-Уилкаисходный массив0.0578
уникальные даты0.5223
Равенство дисперсийF-критерий0.7194
Равенство среднихt-критерий0.9763

3.2. Регулярные последовательности

Регулярные последовательности обычно используются в том случае, когда априорных сведений о природе наблюдаемых данных слишком мало для формирования первичной модели изучаемого явления. Наиболее известные регулярные последовательности - это последовательность с равномерным шагом (арифметическая прогрессия) и последовательность с равномерной скоростью роста (геометрическая прогрессия). Нетрудно убедиться, что с помощью этих прогрессий не удается получить приемлемое описание последовательности уникальных дат (см. рис. 2), однако геометрическая прогрессия является приближением с меньшей ошибкой. Таким образом, хорошее приближение к наблюдаемым датам следует искать среди нелинейных моделей.

3.3. Регрессионные модели

Регрессионный анализ позволяет найти полином третьей степени, отвечающий всем требованиям адекватного описания последовательности уникальных дат, а именно:

  • Распределение остатков, т.е. разностей между фактическими и модельными значениями, подчиняется нормальному закону с нулевым средним.
  • Разброс остатков не выходит за пределы трех стандартных отклонений (±3σ).
  • Остатки не зависят от номера последовательности.

    Гипотеза независимости проверяется по критерию хи-квадрат для стандартного уровня α = 0.05 на сгруппированных данных. Группировка выполняется с помощью медианы, позволяющей разделить первичные данные на две равновероятные группы так, чтобы каждая клетка итоговой таблицы содержала не менее пяти наблюдений в соответствии с требованием критерия хи-квадрат.

    Адекватность кубической модели сохраняется при удалении последнего элемента последовательности, что позволяет считать эту модель устойчивой к изменению длины последовательности, и, следовательно, кубическую модель можно использовать для экстраполяции найденной закономерности. Однако экстраполяция кубической модели на один шаг вперед не приводит к содержательному результату, поскольку ожидаемая дата 23-го землетрясения оказывается равной 1835, т.е. меньше реальной даты последнего землетрясения (см. рис. 3). Иначе говоря, кубическая модель является локально адекватным описанием исходных данных, которое не допускает расширения за пределы области наблюдений.

    Обычно для улучшения статистической модели используются два способа: повышение степени полинома или увеличение объема выборки. В нашем случае, когда есть всего 22 уникальные даты, повышать степень полинома уже нельзя, но можно попытаться улучшить модель, используя весь массив исходных данных. Поскольку каждой уникальной дате соответствует своя частота появления в массиве исходных данных, то использование реальной частоты наблюдений позволяет увеличить размер выборки с 22 до 37. Однако оказалось, что использование частоты наблюдений в качестве дополнительного параметра не приводит к улучшению модели.

    Можно получить еще один вариант модели, поставив в соответствие каждой уникальной дате размер локального массива, который содержит все наблюдения, не превосходящие рассматриваемую дату. Рассматривая число наблюдений в локальном массиве в качестве весовой характеристики, приходим к взвешенной регрессионной модели. Экстраполяция взвешенной модели позволяет получить ожидаемую дату следующего землетрясения в 1860 году, что больше конечной даты последнего землетрясения (1857), но не соответствует реальному состоянию на 2009 год. Повышая, без достаточных на то оснований, степень полинома взвешенной модели, находим, что ожидаемая дата следующего землетрясении начинает превышать 2009 год только при полиноме 5-ой степени. Столь высокая степень полинома свидетельствует о том, что возможности полиномиальной модели практически исчерпаны, и целесообразно перейти к моделям экспоненциального типа.

    3.4. Кратные даты

    Каждой наблюдаемой дате исходного массива данных соответствует определенная кратность (частота наблюдения), причем средняя кратность равна 37/22 = 1.68 (см. рис. 4).

    Распределение кратности заметно отличается от нормального, а потому для проверки статистической значимости этой величины необходимо использовать свободные от формы распределения непараметрические критерии: критерий знаков или ранговый критерий Вилкоксона. Гипотеза о равенстве средней кратности единице отклоняется для стандартного уровня значимости α = 0.05, поскольку p-значение для обоих критериев равно 0.031, и, следовательно, частота наблюдений является существенным статистическим фактором.

    Предположение о равенстве частот себя не оправдывает, поскольку замена реальной частоты наблюдений на среднее значение приводит к ошибке, не подчиняющейся нормальному распределению с выбросами за пределы трех стандартных отклонений. Учитывая различную частоту наблюдений, исходный массив можно разделить на две группы: одиночные наблюдения с кратностью равной единице и кратные наблюдения, у которых кратность больше единицы. Оказалось, что обе группы статистически однородны, а потому их можно не различать (см. табл. 3):

    Таблица 3. Однородность одиночных и кратных наблюдений
    ГипотезаКритерийДанныеp-значение
    Нормальность распределенияШапиро-Уилкаодиночные даты0.4997
    кратные даты0.2916
    Равенство дисперсийF-критерий0.6230
    Равенство среднихt-критерий0.5441

    Итак, все даты исходного массива взяты из одной статистической совокупности, что позволяет считать дату землетрясения случайной величиной, каждое значение которой наблюдается с некоторой частотой.

    4. Дата землетрясения как случайная величина

    4. 1. Статистическое описание

    Описание даты землетрясения как случайной величины, включая основные статистики и гистограмму, представлено на рисунке 5.

    Постоянный шаг гистограммы выбирается так, чтобы он примерно соответствовал стандартному отклонению, т.е. интервал наблюдения должен содержать, по меньшей мере, шесть равных отрезков. Нетрудно заметить, что эмпирическое распределение имеет один достаточно крутой пик, расположенный в окрестности среднего значения слева от середины интервала наблюдения (эксцесс = 0.46), и, кроме того, по отношению к медиане правая половина распределения больше левой. Другими словами, это одномодальное распределение с положительной асимметрией (асимметрия = 0.23).

    Для получения закона распределения даты землетрясений использовался весь набор стандартных распределений, предлагаемый в процедуре UNIVARIATE системы SAS [4], который включает следующие распределения: бета, экспоненциальное, гамма, логнормальное, нормальное и Вейбулла. Параметры стандартных распределений вычисляются по методу максимального правдоподобия, а качество подгонки оценивается по трем критериям согласия: Колмогорова-Смирнова, Крамера-фон Мизеса и Андерсона-Дарлинга. Проверка показала, что только три распределения согласуются с исходными данными на стандартном уровне значимости α = 0.05, а именно: нормальное, логнормальное и Вейбулла (см. рис. 5), причем эти описания настолько незначительно отличаются друг от друга, что для обоснованного выбора лучшей модели нужны дополнительные исследования.

    4.2. Выбор закона распределения

    Учитывая, что ожидаемая дата следующего землетрясения находится за пределами интервала наблюдения, для выбора лучшего распределения предлагается использовать устойчивость распределения, т.е. его способность оставаться допустимым описанием исходных данных при изменении объема выборки.

    Выборку меньшего объема легко получить удалением максимального значения переменной из исходного массива данных до тех пор, пока это возможно. Для увеличения объема выборки к исходному массиву нужно добавить одно или несколько наблюдений. Одиночные наблюдения встречаются в исходном массиве 16 раз, а кратные только 6. Поскольку соотношение 16/6 не согласуется с гипотезой равных вероятностей 0.5/0.5 (критерий хи-квадрат, p-значение = 0.033), то наиболее вероятным расширением массива исходных данных является одиночное наблюдение, значение которого можно последовательно увеличивать до тех пор, пока это позволяют используемые критерии. Результаты расчетов сведены в таблицу 4, откуда следует, что наибольшей устойчивостью обладает логнормальное распределение (см. отмеченные ячейки), которое согласуется с исходными данными при изменении объема выборки от 35 до 38 в диапазоне от 1555 до 2054 года, т.е. на протяжении почти пятисот лет.

    Таблица 4. Устойчивость допустимых распределений
    Объем выборкиКонечная датаРаспределение, критерий согласия(*) и p-значение
    НормальноеЛогнормальноеВейбулла
    "K-S""C-M""A-D""K-S""C-M""A-D""K-S""C-M""A-D"
    2814900.0350.0050.0060.0010.0010.001
    2915500.0720.0130.0170.0030.0010.0010.0400.0110.013
    3515550.1500.0450.0200.0650.0060.0010.0120.0140.004
    3615850.1500.0440.0200.0920.0070.0020.0090.0110.004
    3718570.0680.0650.0490.0830.0090.0040.1410.0210.010
    3818580.0330.0580.0430.0890.0120.0060.1400.0210.011
    19000.0280.0500.0390.0810.0110.0060.1140.0180.010
    19500.0240.0440.0320.0710.0090.0050.0880.0150.008
    20540.0210.0270.0190.0500.0070.004
    20550.0200.0270.0190.0490.0070.004
    (*) "K-S" - Колмогорова-Смирнова, "C-M" - Крамера-фон Мизеса, "A-D" - Андерсона-Дарлинга

    Таким образом, для прогностической модели выбор логнормального распределения становится предпочтительным.

    4.3. Логарифмическое преобразование

    В общем случае логнормальное распределение определяется тремя параметрами: порога (threshold), масштаба (scale) и формы (shape), которые подбирались методом максимального правдоподобия. Кроме того, известно, что логарифм случайной величины, распределенной по логнормальному закону, имеет нормальное распределение [6], а потому можно перейти к работе с нормальным распределением, используя преобразование x = log(date - theta), где theta - величина порога. Величина порога, найденная по методу максимального правдоподобия равна 423.86, однако выбор новой переменной с таким порогом не выдерживает проверки по критерию Шапиро-Уилка (p-значение = 0.0385), как наиболее мощному среди известных критериев нормальности [5]. Согласно расчетам, p-значение по критерию Шапиро-Уилка растет при уменьшении порога, достигая почти стационарного состояния при значениях порога близких к нулю (см. рис. 6).

    Если в качестве эталона выбрать распределение, полученное по методу максимального правдоподобия, то сумма квадратов отклонений от этого эталона позволяет оценить целесообразность уменьшения порога. Как видно из рисунка 6, достаточно хорошим решением можно считать theta = 0, поскольку в этом случае распределение практически не отличается от оптимального, а p-значение по критерию нормальности Шапиро-Уилка равно 0.057.

    Кумулятивная функция распределения логарифма даты представлена на рисунке 7, где для наглядности показаны её доверительные границы на основе D-статистики Колмогорова (D = 0.115, p-значение > 0.15).

    Итак, массив исходных данных согласуется с нормальным распределением логарифма даты

    p(X) = cdf("normal", X, mean(X), std(X)),

    где cdf - кумулятивная функция распределения [4], mean - среднее значение, а std - стандартное отклонение случайной величины X = {x=log(di), 1065 ≤ di ≤ 1857; i=1,..., 37}.

    5. Прогнозирование

    5.1. Расширение массива исходных данных

    Проверка устойчивости позволяет установить, что согласие с нормальным распределением логарифма даты по критерию Шапиро-Уилка сохраняется (т.е. p-значение ≥ 0.05) при добавлении 38-го наблюдения с конечной датой вплоть до 2055 года. Это означает, что исходный массив допускает расширение в ограниченных пределах, а именно:

    X1 = {(X, log(d38)), 1858 ≤ d38 ≤ 2055}, p(X1) = cdf("normal", X1, mean(X1), std(X1)).

    Статистическое описание расширенного массива с неизвестным значением d38 зависит от среднего значения и стандартного отклонения случайной величины X1, которые можно оценить, опираясь на опыт прошлого. В самом деле, если удалить из массива исходных данных конечную дату, то получим новый массив меньшего размера, у которого есть свои выборочные значения среднего и стандартного отклонения. Продолжая этот процесс до тех пор, пока это возможно, получим ретроспективную картину изменения выборочных характеристик в зависимости от объема выборки (см. рис. 8). Нетрудно заметить устойчивую тенденцию роста обеих характеристик, а высокие значения коэффициентов корреляции: r(mean, N) = 0.986 и r(std, N) = 0.890, свидетельствуют о возможности использования линейных регрессионных моделей для выявления статистических закономерностей.

    5.2. Экстраполяция тенденций

    Линейные регрессионные модели, отражающие тенденции изменения основных статистических характеристик рассматриваемой случайной величины в зависимости от объема выборки, получены с помощью традиционного метода наименьших квадратов.

    Согласно проверке, эти модели являются адекватным описанием исходных данных, поскольку распределение остатков (разностей между фактическими и модельными значениями) подчиняются нормальному закону с нулевым средним, разброс остатков не выходит за пределы ±3σ, а величина остатков не зависит от объема выборки. Более того, увеличивая объем выборки до N = 38, можно проверить, что расширенная выборка сохраняет однородность по отношению к массиву исходных данных.

    Таким образом, линейные регрессионные модели позволяют оценить неизвестные параметры расширенного массива:

    meanr(38) = 7.23301 и stdr(38) = 0.13176.

    Теперь следует убедиться в том, что существует допустимое распределение с такими параметрами. Последовательно изменяя величину d38 с шагом в один год в пределах от 1858 до 2055, находим допустимые границы для среднего значения и стандартного отклонения логарифма даты, которые представлены в таблице 5.

    Таблица 5. Сравнение параметров
    ПараметрДопустимые границыРегрессионная модель
    минимуммаксимум
    Среднее значение (mean) 7.221317.223967.23301
    Стандартное отклонение (std) 0.136680.143580.13176

    Оказалось, что оба параметра, полученные с помощью регрессионной модели, выходят за пределы принятых ранее ограничений, и, следовательно, нужно искать другое решение.

    5.3. Оптимальное приближение

    Расширение массива в пределах допустимых ограничений не позволяет получить распределение с параметрами регрессионной модели

    pr(X1) = cdf("normal", X1, meanr(38) = 7.23301, stdr(38) = 0.13176).

    Однако распределение с регрессионными параметрами можно рассматривать как недостижимый эталон для оценки качества приближенного решения. Тогда среди допустимых распределений найдется такое, у которого сумма квадратов отклонений от эталона будет наименьшей, т.е.

    \begin {displaymath} SSD(X_1 = {X, \log(d_{38}) \brace }) = min_{d_{38}} \sum_{x \in X_1} (p_r(X_1) - p(X_1))^2, \end{displaymath}

    где сумма берется по всем значениям расширенного массива данных, а минимум - по всем целочисленным значениям d38 в пределах от 1858 до 2055 года. Согласно расчетам, наилучшее приближение к эталону достигается для d38 = 2040 (см. рис. 9), что позволяет рассматривать 2040 год в качестве ожидаемой даты (прогноза) следующего землетрясения.

    5.4. Прогностическая модель

    Рассмотрим расширенный массив данных, содержащий 2040 год в качестве ожидаемой даты следующего землетрясения, который описывается нормальным распределением со следующими параметрами:

    p(X2) = cdf("normal", X2, mean(X2) = 7.22377, std(X2) = 0.14302), где X2 = {X, log(2040)}.

    Каждой наблюдаемой дате d соответствует квантиль q1 = log(d) с эмпирической вероятностью p(q1 = log(d)) = p (см. рис. 10), по которой можно найти гипотетический квантиль q2 из нормального распределения случайной величины X2

    q2 = q2(p) = quantile("normal", p, mean(X2) = 7.22377, std(X2) = 0.14302). [4]

    Затем, используя экспоненту для обратного преобразования, находим гипотетическую дату в годах

    dateh = exp(q2) = exp(quantile("normal", p, mean(X2) = 7.22377, std(X2) = 0.14302)).

    В итоге, каждой эмпирической дате можно поставить в соответствие гипотетическую дату, полученную с помощью прогностической модели. Сравнение исходных данных с гипотетическими позволяет сделать следующий вывод: оба массива являются однородными выборками из одной и той же нормальной совокупности или, другими словами, они статистически эквивалентны (табл.6).

    Таблица 6. Однородность эмпирических и гипотетических данных
    ГипотезаКритерийДанныеp-значение
    Нормальность распределенияШапиро-Уилкаэмпирические даты0.0578
    гипотетические даты0.0583
    Равенство дисперсийF-критерий0.3737
    Равенство среднихt-критерий0.1364

    Величина разности между эмпирической и гипотетической датами определяет ошибку моделирования (см. рис. 11), исследование которой приводит к следующим результатам:

  • Распределение ошибки подчиняется нормальному закону с нулевым средним при разбросе в пределах трех стандартных отклонений.
  • Ошибка не зависит как от объема выборки, так и от гипотетической даты (см. табл.7). Следует отметить, что проверка гипотезы независимости ошибки от гипотетической даты выполняется с помощью точного критерия Фишера, поскольку в проверочной таблице оказываются частоты меньше 5, и критерий хи-квадрат применять нельзя [4].

    Таким образом, нормальное распределение логарифма даты представляет адекватную прогностическую модель крупных региональных землетрясений в районе разлома Сан-Анреас.

    Максимальная относительная ошибка используемого описания достигает 9.1%, и, следовательно, предлагаемая модель относится к моделям с низкой точностью порядка 10%, что вполне естественно для столь малого массива исходных данных.

    Таблица 7. Оценка ошибки
    Гипотеза Критерий Данные p-значение(min, max)
    Нормальности Шапиро-Уилка первичные 0.1328
    Средние = 0 t-критерийпервичные 0.0829
    Отсутствия выбросов< 3σ (стандартных отклонений)приведенные (среднее = 0, σ = 1)(-2.39, 1.31)
    Независимости от объема выборки хи-квадратсгруппированные0.3918
    Независимости от гипотетической датыточный критерий Фишера сгруппированные0.2972

    5.5. Оценка прогноза

    Независимость ошибки моделирования от гипотетической даты позволяет перенести центр распределения ошибки в точку, соответствующую прогнозируемой дате. Нормальное распределение ошибки с центром в 2040 году, должно быть ограниченно допустимыми пределами моделирования 1858-2055, и, следовательно, становится усеченным нормальным распределением. Учитывая, что на момент завершения работы (2009) новое крупное землетрясение пока еще не произошло, усеченное нормальное распределение требует коррекции, соответствующей реальному пределу слева. Окончательный вариант распределения ожидаемой даты следующего землетрясения в пределах 2009-2055 представлен на рисунке 12.

    Оказалось, что полученное распределение хорошо согласуется с равномерным распределением (критерий хи-квадрат: статистика = 0.2979, число степеней свободы = 8, p-значение = 1.0). Используя квантили равномерного распределения как массив гипотетических дат, находим, что полученный массив статистически однороден массиву исходных данных. Проверка однородности проводилась по трем непараметрическим критериям, поскольку оба массива далеки от нормального распределения (см. табл. 8).

    Таблица 8. Непараметрические критерии однородности
    Критерийp-значение
    Вилкоксона0.4879
    Медианный 0.4187
    Колмогорова-Смирнова1.0000

    Таким образом, ожидаемая дата следующего землетрясения распределена равномерно на отрезке между 2009 и 2055 годами. Доверительные пределы для стандартного уровня доверия в 95% соответственно равны 2010 и 2054, а доверительный интервал составляет 44 года. В абсолютном выражении эта величина сопоставима с жизнью двух человеческих поколений, а потому может показаться, что подобный прогноз не представляет никакой практической ценности. Однако, если сравнить результаты статистического прогноза с естественным уровнем точности, на котором находятся исходные данные, то получится совсем другая картина. В самом деле, стандартная ошибка среднего для исходного массива данных равна ±28.7 года, а половина доверительного интервала для прогнозируемой даты следующего землетрясения составляет 44/2=22 года. Иначе говоря, точность полученного прогноза вполне соизмерима с точностью описания реальных наблюдений, а потому можно считать, что прогностическая модель не вносит существенных искажений в описание исходных данных. Следовательно, с вероятностью 0.95 ожидаемая дата следующего землетрясения находится между 2010 и 2054 годами, причем любой год является одинаково вероятным.

    6. Заключение

    По результатам статистического анализа массива дат крупных землетрясений (больше 7 баллов по шкале Рихтера), наблюдаемых в районе разлома Сан-Анреас (Калифорния) можно сделать следующие выводы:
    1. Даты крупных землетрясений, наблюдаемых в рассматриваемом регионе, подчиняются логнормальному распределению с нулевым порогом.
    2. Логнормальное распределение даты региональных землетрясений сохраняется за пределами интервала наблюдения, допуская расширение массива наблюдений для прогнозирования даты следующего землетрясения.
    3. Параметры расширенного распределения можно оценить на основе экстраполяции тенденций изменения среднего значения и стандартного отклонения логарифма даты в зависимости от объема выборки.
    4. Ожидаемую дату следующего землетрясения определяет конечная дата расширенного распределения, которое представляет наилучшее приближение к распределению с эталонными параметрами, отражающими наиболее устойчивые тенденции.
    5 Точность полученного прогноза вполне соизмерима с точностью отбора наблюдений, но явно недостаточна с практической точки зрения. Остается надеяться, что увеличение массива исходных данных позволит довести точность статистического моделирования до уровня современных потребностей.

    Источники:

  • Завьялов А.Д. Прогноз землетрясений: что нового?
  • Earthquakes Prediction Centre "GeoQuake (ГеоКвейк)"
  • Короновский Н.В., Абрамов В.А. Землетрясения: причины, последствия, прогноз (1998)
  • SAS Software for Windows (version 9.1)
  • StatSoft, Inc. (1999). Electronic Statistics Textbook. Tulsa, OK: StatSoft.
    StatSoft, Inc. (2001). Электронный учебник по статистике. Москва, StatSoft
  • Engineering Statistic Handbook, Gallery of Distributions

  • Проект осуществляется при поддержке:
    Геологического факультета МГУ,
    РФФИ
       

    TopList Rambler's Top100