STATISTICA Advanced Linear/Non-Linear Models
Линейные и нелинейные модели

STATISTICA Advanced Linear/Non-Linear Models (один из модулей продукта STATISTICA Advanced) предлагает широкий спектр линейных и нелинейных средств моделирования, поддерживает прогнозирование как непрерывной, так и категориальной переменной, взаимодействия, иерархические модели, возможность автоматического выбора моделей, а также компоненты дисперсии, временные ряды и другие методы. Все анализы снабжены разнообразными интерактивными графиками и встроенным редактором Visual Basic.

Модуль предоставляет следующие возможности:

Подгонка и моделирование

Компоненты дисперсии и смешанная модель ANOVA/ANCOVA

Анализ выживаемости

Модели пропорциональных рисков Кокса

Общее нелинейное оценивание (включая логит/пробит регрессию)

Логлинейный анализ

Анализ временных рядов и прогнозирование

Моделирование структурными уравнениями (SEPATH)

Общие Линейные Модели (GLM)

Общие Регрессионные Модели (GRM)

Обобщенные Линейные Модели (GLZ)

Общие Модели Частных Наименьших Квадратов (PLS)


Подгонка и моделирование

Автоматизируйте решение задачи прогнозирования с помощью системы Sales-Forecast. Смотреть видео

Подгонка и моделированиеМодуль Подгонка и моделирование используется для оценки подгонки теоретических распределений к наблюдаемым данным. Кроме того, вы можете смоделировать данные из теоретического распределения с выбором внутренней корреляционной структуры данных. Кажущийся на вид простым, этот метод позволяет вам безошибочно смоделировать текущие процессы, создающие данные. Полученные данные с помощью этих процессов позволяют смоделировать и оценить работу системы.

Например, вы производите продукт и выделяете 3 важные качественные характеристики. Предполагаем, что если сумма первых двух качественных характеристик больше, чем удвоенная величина третьей характеристики, то продукт считается дефектным. Вместо того, чтобы ждать когда появятся требуемые данные, можно подогнать теоретические распределения к наблюдаемым данным, моделируя данные из этих распределений и затем сделать выводы, основанные на моделировании, например, определить процент дефектов и т. д.

В начало


Компоненты дисперсии и смешанная модель ANOVA/ANCOVA

Компоненты дисперсии и смешанная модель ANOVA/ANCOVA

Модуль Компоненты дисперсии и смешанная модель ANOVA/ANCOVA предназначен для анализа смешанных моделей дисперсионного анализа со случайными факторами. Подобные факторы часто возникают в промышленных исследованиях (данный модуль входит также в пакет Промышленная STATISTICA), где уровни факторов представляют собой значения случайной величины (а не выбираются аналитиком).

В модуле Компоненты дисперсии можно анализировать планы с любой комбинацией фиксированных эффектов, случайных эффектов и ковариат. Могут быть эффективно проанализированы очень большие планы: факторы могут иметь несколько сотен уровней. Программа способна анализировать как стандартные факторные (перекрестные), так и иерархически вложенные планы, и вычисляет стандартные суммы квадратов и средние квадраты I, II и III типов для эффектов модели. Кроме того, можно вычислить таблицу ожидаемых средних квадратов для эффектов плана, компоненты дисперсии для случайных эффектов модели, коэффициенты для синтеза знаменателя и полную таблицу дисперсионного анализа с критериями, основанными на суммах квадратов для синтезированных ошибок и числе степеней свободы.

Реализованы также другие методы оценки компонент дисперсии (MIVQUE0, максимума правдоподобия [МП] и ограниченного максимума правдоподобия). При оценке методом максимума правдоподобия применяются алгоритмы Ньютона-Рафсона и Фишера, при оценивании модель не изменяется (не сокращается) принудительным образом, чтобы справляться с ситуациями, когда большинство компонент близки к нулю. Имеется ряд функций для просмотра взвешенных и невзвешенных маргинальных средних и их доверительных интервалов. Для визуализации результатов реализованы разнообразные графические средства.

В начало


Анализ выживаемости

Анализ выживаемости

Этот модуль содержит широкий набор методов анализа цензурированных данных, применяемых в общественных науках, биологии, медицинских исследованиях, а также в маркетинге и технике (контроль качества, оценка надежности и др.). После вычисления таблиц времен жизни, различных описательных статистик и множительных оценок Каплана-Мейера пользователь может сравнить функции выживания по группам, используя для этого различные методы (критерий Гехана-Вилкоксона, F-критерий Кокса, критерий Кокса-Ментела, лог-ранговый критерий и обобщенный критерий Пето-Вилкоксона). Диаграммы Каплана-Мейера могут быть построены для отдельных групп (при этом нецензурированные наблюдения изображаются на графиках с помощью особых символов).

В модуле реализованы также процедуры подгонки различных типов функций выживания (включая экспоненциальную, линейного риска, Гомпертца и Вейбулла) по методу невзвешенных или взвешенных наименьших квадратов (оценки максимума правдоподобия для параметров различных распределений, включая распределение Вейбулла, можно вычислять также в модуле Анализ процессов STATISTICA).

Наконец, в программе в полном объеме реализованы четыре общие объясняющие модели (модель пропорциональных интенсивностей Кокса, экспоненциальная регрессионная модель, нормальная и лог-нормальная регрессионные модели) с расширенной диагностикой, включающей стратифицированный анализ и графики выживаемости для заданных пользователем значений предикторов.

В регрессионной модели пропорциональных интенсивностей Кокса пользователь может решить, стратифицировать ли выборку, чтобы сделать возможным задание разных базовых функций интенсивности для разных слоев (но с общим вектором коэффициентов), или же допускать как различные базовые функций интенсивности, так и различные векторы коэффициентов.

Кроме того, имеются средства для задания одной или нескольких зависящих от времени ковариат. Такие ковариаты задаются с помощью удобного формульного редактора через арифметические выражения, которые могут явным образом содержать время, все обычные логические операции (пример: timdep=age+age*log(t_)*(age>45); здесь t_ – время жизни), а также различные распределения. Как и во всех других модулях системы STATISTICA, пользователь может изменять технические параметры всех процедур (или принять динамически определяемые значения по умолчанию).

Интерпретировать результаты помогают реализованные в модуле многочисленные виды графиков и специализированных диаграмм (диаграммы накопленных долей выживаний/отказов, структуры цензурированных данных, графики функции риска (обычный и кумулятивный) и плотности вероятности, сравнительные диаграммы для групп, графики подгонки распределений, различные графики остатков и другие). Для технических задач см. также раздел Анализ Вейбулла.

В начало


Модели пропорциональных рисков Кокса

Модели пропорциональных рисков КоксаОсновное отличие методов анализа выживаемости от классических методов анализа данных состоит в возможности использовать неполные (цензурированные) данные. Наблюдение считается цензурированным, если оно было изъято из исследования до наступления интересующего события. Для анализа такого типа данных многие модели, в том числе нормальная регрессия, непригодны.

Эта модель стала очень популярна во многих областях, где зависимая интересующая переменная представляет время наступления определенного события, а время проведения наблюдений и анализа ограничено, например:


Модуль Модель пропорциональных рисков Кокса позволяет эффективно работать с цензурированными данными, категориальными предикторами и планами, содержащими взаимодействия и/или вложенные эффекты. В качестве техники построения моделей этот модуль использует метод наилучших подмножеств и пошаговую регрессию. Построение функций выживаемости для новых данных можно задать с помощью STATISTICA Rapid Deployment.

В начало


Общее нелинейное оценивание (включая логит/пробит регрессию)

Общее нелинейное оценивание

В модуле Нелинейное оценивание реализованы методы, позволяющие осуществлять подгонку нелинейных моделей практически любого типа. Уникальная особенность этого модуля состоит в том, что (в отличие от обычных пакетов нелинейного оценивания) здесь нет никаких ограничений на размер обрабатываемого файла данных.

Методы оценивания

Модель может подгоняться по методу наименьших квадратов, по критерию максимума правдоподобия или с помощью любой определенной пользователем функции потерь. Имеется возможность выбрать один из четырех мощных, и существенно различных по своим характеристикам методов оценивания (квази-ньютоновский, симплекс-метод, метод Хука-Дживиса и метод Розенброка), так что практически в любой задаче (даже очень сложной в вычислительном отношении) можно получить устойчивые оценки параметров.

Модели

Пользователь может задать произвольный тип модели, вводя соответствующее уравнение в специальное окно редактора. Уравнения могут включать логические операторы, поэтому имеется возможность оценивать (кусочно-) разрывные модели регрессии и модели с индикаторами групп. В уравнениях могут быть использованы различные теоретические функции распределения (бета, биномиальное, Коши, хи-квадрат, экспоненциальное, экстремальных значений, F, гамма, геометрическое, Лапласа, логистическое, нормальное, логнормальное, Парето, Пуассона, Рэлея, t (Стьюдента) и Вейбулла).

Пользователю предоставляется полный контроль над всеми аспектами процедуры оценивания (начальные значения, величина шага, критерий остановки итераций и т.д.). Наиболее распространенные нелинейные модели регрессии имеются в готовом виде в модуле Нелинейное оценивание и могут быть вызваны прямо из меню. В их числе – пошаговая пробит- и логит-регрессия, экспоненциальная и кусочно-линейная регрессия.

Результаты

Результаты

Помимо различных описательных статистик, в стандартный набор результатов нелинейного оценивания входят: оценки параметров и их стандартные ошибки (которые вычисляются независимо от самих оценок с помощью специальных повышающих точность конечно-разностных методов), матрица дисперсий/ковариаций для оценок параметров, предсказанные значения, остатки и соответствующие критерии согласия (лог-правдоподобие оцененной/нулевой моделей, критерий хи-квадрат для различий между средними, доля дисперсии, объясненная моделью, классификация наблюдений и отношение несогласия для моделей логит и пробит и др.). Предсказанные значения и остатки могут быть вставлены в файл данных для дальнейшего анализа.

Для моделей логит и пробит автоматически производится пошаговая подгонка с добавлением/удалением параметров регрессионной модели (благодаря чему имеется возможность анализировать данные с помощью пошаговой процедуры нелинейного оценивания). В модуле Общие Линейные Модели (GLM) существуют опции для автоматизации прямой и обратной пошаговой регрессии.

Графики

Для всех результатов реализованы разнообразные возможности графического представления, в том числе интерактивные двух- и трехмерные графики функции подгонки, с помощью которых можно визуально отслеживать качество подгонки, выявлять выбросы и наблюдать меру расхождения модели и данных; пользователь может интерактивно видоизменять уравнение функции подгонки без повторной обработки данных и визуализировать практически все этапы процедуры нелинейной подгонки.

Для оценки качества подгонки и визуализации результатов имеются также различные специальные графические средства: гистограммы всех выбранных переменных и значений остатков, графики зависимости наблюдаемых значений от предсказанных и предсказанных от остаточных значений, нормальные и полунормальные вероятностные графики остатков и различные другие возможности.

В начало


Логлинейный анализ

Логлинейный анализ

В этом модуле реализованы все процедуры логлинейного анализа многовходовых таблиц частот. Отметим, что STATISTICA также включает модуль Обобщенные Линейные Модели (GLZ), в котором существуют функции для биномиального анализа и многомерных логит-моделей.

В модуле Логлинейный анализ можно анализировать таблицы с числом измерений до 7. Таблицы могут содержать структурные нули. Частотные таблицы могут быть вычислены по исходным данным либо введены непосредственно. Реализованный в модуле Логлинейный анализ универсальный набор мощных методов моделирования в сочетании с гибким интерактивным интерфейсом принципиально упрощает проведение разведочного и подтверждающего анализа сложных таблиц. В любой момент пользователь имеет возможность просмотреть всю наблюдаемую таблицу целиком и маргинальные таблицы, подогнанные (ожидаемые) значения, оценить качество подгонки для всех ассоциированных частных и маргинальных моделей и выбрать для подгонки к данным специфическую модель (маргинальную таблицу).

Для выбора модели в программе реализована автоматическая система интеллектуальной поддержки; сначала она определяет нужный порядок взаимодействия, обеспечивающий подгонку модели к данным, а затем, путем обратного исключения, находит наилучшую из моделей, достаточно хорошо (в смысле заданного пользователем критерия) аппроксимирующую данные.

В стандартный набор результатов входят: статистика G-квадрат (отношение максимального правдоподобия хи-квадрат) и стандартная статистика хи-квадрат Пирсона с соответствующим числом степеней свободы и уровнями значимости, наблюдаемая и подогнанная (ожидаемая) таблицы, маргинальные таблицы и другие статистики.

Графические средства модуля Логлинейный анализ включают множество двух- и трехмерных диаграмм для визуального представления двух- и многовходовых частотных таблиц (в том числе - управляемые пользователем каскады категоризованных гистограмм и трехмерные гистограммы, показывающие "срезы" многовходовых таблиц). Кроме того, реализованы диаграммы наблюдаемых и подогнанных частот, диаграммы различных типов остатков (стандартизованные, компоненты отношения максимального правдоподобия хи-квадрат, отклонения Фримена-Тьюки и др.) и другие разнообразные средства.

В начало


Анализ временных рядов и прогнозирование

Анализ временных рядов и прогнозирование

В модуле Временные ряды реализован широкий набор методов описания, построения моделей, декомпозиции и прогнозирования временных рядов, как во временной, так и в частотной области. Все процедуры полностью совместимы и результаты анализа одной модели (например, остатки, вычисленные для модели АРПСС) можно использовать для дальнейшего анализа (например, вычисления автокорреляции остатков).

Имеются самые разнообразные возможности для просмотра и графического представления одномерных и многомерных рядов. Можно анализировать очень длинные ряды (более 100 тыс. наблюдений). С многомерными рядами (в случае многомерных исходных данных или с рядами, полученными на различных этапах анализа) можно работать в активной рабочей области; здесь их можно просматривать и сопоставлять друг с другом.

Программа автоматически отмечает все этапы анализа временного ряда и сохраняет полную историю преобразований и полученные результаты (остатки модели АРПСС, сезонную составляющую и т.д.). Поэтому пользователь всегда имеет возможность вернуться к более раннему этапу анализа или отобразить на графике исходный ряд и его преобразования. Информация о последовательных преобразованиях хранится в виде длинных меток переменных, поэтому при сохранении вновь полученных рядов в файле данных автоматически сохраняется вся "история" каждого из рядов. Далее описываются конкретные процедуры модуля Временные ряды.

С помощью различных преобразований исходного временного ряда можно понять его структуру и имеющиеся в нем закономерности; в модуле реализованы такие часто используемые преобразования, как: удаление тренда, удаление автокорреляций, сглаживание скользящими средними (невзвешенными или взвешенными - с весами, заданными пользователем или вычисленными по методам Даниеля, Тьюки, Хэмминга, Парзена и Бартлета), медианное сглаживание (среднее заменено медианой), простое экспоненциальное сглаживание (подробное описание его вариантов см. далее), взятие разностей, суммирование, вычисление остатков, сдвиг, 4253H-сглаживание, косинус-сглаживание, преобразование Фурье, а также обратное преобразование Фурье и др. Можно выполнить анализ автокорреляций, частных автокорреляций и кросскорреляций.

АРПСС и анализ прерванных временных рядов (рядов с интервенциями)

Модуль Временные ряды включает полную реализацию модели авторегрессии и проинтегрированного скользящего среднего (АРПСС). Модель может включать константу. Перед построением модели ряд может быть подвергнут преобразованию, которое автоматически будет отменено после построения прогноза по АРПСС, при этом предсказанные значения и их стандартные ошибки будут выражены через значения исходного (а не преобразованного) ряда.

Могут быть вычислены приближенные и точные суммы квадратов из условия максимума правдоподобия; уникальной особенностью модели АРПСС модуля Временные ряды является способность анализировать модели с длинными периодами сезонности (с лагом до 30). Стандартный набор результатов содержит оценки параметров, стандартные ошибки и корреляции. Предсказанные значения могут быть представлены в числовой и графической форме и добавлены к исходному ряду. Имеются многочисленные дополнительные функции для исследования остатков модели АРПСС, в том числе большой набор графических средств.

Реализация модели АРПСС в модуле Временные ряды позволяет проводить анализ прерванных временных рядов (рядов с интервенциями). Имеется возможность использовать одновременно несколько различных интервенций (до 6). Доступны следующие виды интервенций: однопараметрические скачкообразные, двупараметрические постепенные, временные (характер воздействия можно просмотреть на графике). Для всех прерванных моделей могут быть построены прогнозы, которые можно вывести на график (вместе с исходным рядом) и, если требуется, добавить к исходному ряду.

Сезонное и несезонное экспоненциальное сглаживание

В модуле Временные ряды полностью реализованы все 12 классических моделей экспоненциального сглаживания. Задание модели может включать аддитивную или мультипликативную сезонную составляющую и/или линейный, экспоненциальный или демпфированый тренд; в частности, доступны популярные модели с линейным трендом Холта-Винтера.

Пользователь может задавать начальное значение параметров сглаживания, начальное значение тренда и (если требуется) сезонные факторы. Для тренда и сезонной составляющей могут быть заданы независимые параметры сглаживания. Для определения лучшей комбинации параметров используется метод поиска на сетке; в таблицах результатов для всех комбинаций значений параметров сглаживания вычисляется средняя ошибка, средняя абсолютная ошибка, сумма квадратов ошибок, среднеквадратическая ошибка, средняя относительная ошибка и средняя абсолютная относительная ошибка. Наименьшие значения этих ошибок выделяются цветом.

Имеется возможность автоматического поиска лучшего набора параметров в смысле среднеквадратической, средней абсолютной или средней абсолютной относительной ошибки (для этого используется общая процедура минимизации). Все результаты преобразования экспоненциальным сглаживанием, остатки и прогноз на требуемое число шагов можно в дальнейшем проанализировать и изобразить на графике. Для оценки адекватности модели используются графики, на которых вместе с исходным рядом в подходящем масштабе по оси Y изображаются его сглаженный вариант, прогноз и ряд остатков.

Классическая сезонная декомпозиция (метод Census I)

Имеется возможность задать произвольный сезонный лаг и выбрать либо аддитивную, либо мультипликативную сезонную модель. Программа вычисляет скользящие средние, отношения или разности, сезонные компоненты, ряд с сезонной поправкой, сглаженную тренд-циклическую и нерегулярную компоненты. Все эти составляющие ряда доступны для дальнейшего анализа; например, для проверки адекватности можно построить гистограммы, нормальные вероятностные графики и т.д.

Месячная и квартальная сезонная X-11-декомпозиция и корректировка (метод Census II)

Модуль Временные ряды включает полную реализацию метода X-11 сезонной корректировки, принятого Статистическим управлением США (US Bureau of the Census). Структура всех функций и диалоговых окон соответствует требованиям и соглашениям, описанным в документации Bureau of the Census. Можно выбрать либо аддитивные, либо мультипликативные модели.

Пользователь может дополнительно вычислить априорные поправки на число рабочих дней и сезонные поправки. Колебания числа рабочих дней оцениваются регрессионными методами (с правильной обработкой крайних членов ряда) и затем (по желанию) используются для корректировки ряда. Реализованы стандартные средства для градуировки выбросов, вычисления сезонных факторов и вычисления тренд-циклической компоненты (имеется возможность выбирать несколько типов взвешенного скользящего среднего; кроме того, программа может сама находить оптимальную длину и тип скользящего среднего).

Итоговые компоненты ряда (сезонная, тренд-циклическая, нерегулярная) и ряд с внесенной сезонной поправкой всегда доступны для дальнейшего анализа и вывода на график; кроме того, все они могут быть сохранены для дальнейшего исследования другими методами и/или в других программах. Все компоненты выводятся на графики в различной форме, включая категоризованные графики по месяцам (кварталам).

Полиномиальные модели распределенных лагов

С помощью реализованных в модуле Временные ряды методов анализа полиномиальных распределенных лагов можно выполнять оценку моделей с обычными лагами и лагами Алмона. Для анализа распределений переменных модели имеется ряд графических средств.

Спектральный (Фурье) анализ и кросс-спектральный анализ

Модуль Временные ряды включает полную реализацию методов спектрального или Фурье анализа одного ряда и кросс-спектральный анализ двух рядов. Преимущества реализации спектрального анализа в STATISTICA особенно отчетливо проявляются при анализе очень длинных временных рядов (с более чем 250 тыс. наблюдений) и не предполагают каких-либо ограничений на длину ряда (в частности, длина исходного ряда не обязательно должна быть четной). Вместе с тем, иногда бывает разумно предварительно увеличить или уменьшить длину ряда.

Стандартные методы предварительной обработки ряда включают косинус-сглаживание, вычитание среднего и удаление тренда. Результаты обычного спектрального анализа содержат коэффициенты частоты, периода, коэффициенты при синусах и косинусах, периодограммы и оценку спектральной плотности. Оценка плотности может быть вычислена с помощью весов Даниеля, Хэмминга, Бартлетта, Тьюки, Парзена или с весами и шириной, заданными пользователем.

Очень полезно, особенно при работе с длинными рядами, иметь возможность выводить в убывающем порядке заранее заданное число точек периодограммы или спектральной плотности; таким образом можно легко обнаружить резкие пики периодограммы и спектральной плотности для длинных рядов. Имеется возможность вычислить d-критерий Колмогорова-Смирнова для значений периодограммы, чтобы проверить, подчиняются ли они экспоненциальному распределению (является ряд белым шумом или нет).

Для представления результатов анализа имеются различные типы графиков; можно отобразить коэффициенты при синусах и косинусах, периодограмму, лог- периодограмму, спектральную и лог-спектральную плотность по отношению к частотам, периодам и лог- периодам. В случае длинного исходного ряда имеется возможность выбрать конкретный сегмент (период), для которого будут изображаться соответствующие периодограмма и график спектральной плотности, тем самым будет улучшено их "разрешение".

При кросс-спектральном анализе, в дополнение к результатам обычного спектрального анализа каждого отдельного ряда, вычисляется кросс-периодограмма (вещественная и мнимая часть), ко-спектральная плотность, квадратурный спектр, кросс-амплитуда, значения когерентности, усиления и фазовый спектр. Все эти величины могут быть выведены на график, где по горизонтальной оси будет откладываться частота, период или лог-период либо для всего интервала периодов (соответственно, частот), либо для выбранного пользователем диапазона. Указанное пользователем количество наибольших значений кросс-периодограммы (вещественных или мнимых) может быть выведено в убывающем порядке в виде таблицы результатов, что позволяет легко выявлять на ней резкие пики для длинных исходных рядов.

Как и во всех других процедурах модуля Временные ряды, все полученные ряды могут быть добавлены в активную рабочую область и затем подвергнуты дальнейшему исследованию с помощью других методов анализа временных рядов или средствами других модулей системы STATISTICA.

Прогнозирование на основе регрессионных методов

Наконец, в системе STATISTICA реализованы регрессионные методы анализа временных рядов для переменных с запаздыванием (лагом) или без него, в том числе регрессия, проходящая через начало координат, нелинейная регрессия и интерактивное прогнозирование по методу "что-если".

В начало


Моделирование структурными уравнениями (SEPATH)

В системе STATISTICA в полном объеме реализованы методы моделирования с помощью структурных уравнений и гибкие средства имитационного моделирования методом Монте-Карло. В модуль SEPATH вошли самые последние разработки в этой области, объединенные "интеллектуальным" пользовательским интерфейсом.

Здесь представлен широкий выбор процедур моделирования, а уникальные средства интерфейса позволяют строить даже чрезвычайно сложные модели, не обращаясь ни к какому командному языку. С помощью Мастера структурного моделирования и Конструктора путей можно задать все процедуры анализа в простых функциональных терминах через меню и диалоговые окна (в отличие от других программ моделирования структурными уравнениями, здесь нет необходимости изучать специальный и достаточно сложный "язык").

Модуль SEPATH представляет собой полную реализацию этого класса методов и содержит целый ряд дополнительных возможностей: например, есть возможность проанализировать матрицы корреляций, ковариаций и моментов (в моделях со структурированными средними и константами); построить модель можно средствами Мастера путей, Мастера факторного анализа и Конструктора путей. Эти высокоэффективные средства позволяют за считанные минуты определять сложнейшие модели, выбирая варианты в диалоговых окнах.

Используя методы условной оптимизации, программа SEPATH вычисляет стандартные ошибки для стандартизованных моделей и моделей, подогнанных к корреляционным матрицам. В качестве результатов выдается набор диагностических статистик (в том числе стандартные и нецентральные индексы подгонки), отражающий все последние достижения в области моделирования структурными уравнениями. Имеется возможность подгонять модель к нескольким выборкам (группам) и задавать для каждой группы фиксированные, свободные или связанные (одинаковые для всех групп) параметры. При анализе матрицы моментов эти средства позволяют проверять сложные гипотезы о структурных средних для различных групп.

Документация к модулю SEPATH содержит подробные описания большого числа примеров, взятых из литературы, в том числе примеры подтверждающего факторного анализа, анализа путей, модели теории тестирования для подобных тестов, матрицы моделей с несколькими уровнями реакции испытуемых, продольную факторную модель, сложную симметрию, структурированные средние и др.

Имитационное моделирование по методу Монте-Карло в модуле SEPATH

Модуль Моделирование структурными уравнениями (SEPATH) системы STATISTICA содержит мощные средства имитационного моделирования методом Монте-Карло: имеется возможность порождать (и сохранять) наборы данных для предопределенных моделей, основанных на нормальном распределении или на скошенных распределениях. С помощью метода Монте-Карло можно вычислять оценки с помощью бутстрепа, распределения различных информационных статистик, оценки параметров и т.д. Для визуализации результатов метода Монте-Карло (например, распределений параметров) служат различные графические средства.

В начало


Общие линейные модели (GLM)

Модуль Общие Линейные Модели STATISTICA (GLM) предназначен для анализа откликов одной или нескольких непрерывных переменных как функции одной или нескольких категориальных или непрерывных независимых переменных. GLM является не только вычислительным средством, но также и наиболее удобным и полным из доступных приложений, предоставляющим широкий выбор опций, графиков, сопутствующих статистик и расширенных диагностических функций.

STATISTICA GLM предлагает наиболее богатые опции для поддержки GLM-спорных задач, для которых не существует стандартных решений. GLM вычисляет все стандартные результаты, включая ANOVA-таблицы с одномерными и многомерными тестами, описательными статистиками и т.п. GLM предлагает широких выбор результатов и графических опций, которые обычно не доступны в других программах. GLM также предлагает простые способы тестирования линейных комбинаций параметров оценивания, спецификации пользовательских членов ошибки и эффектов, расширенные апостериорные методы сравнения межгрупповых эффектов, повторные эффекты измерений и взаимодействий между повторными измерениями. Подробнее о функциональных возможностях GLM.

Подробнее о Дисперсионном анализе, реализованном в модуле GLM

В начало


Общие регрессионные модели (GRM)

Общие регрессионные модели STATISTICA (GRM) предлагают пользователю уникальную высоко эффективную реализацию стандартных функций в общей линейной модели, а также включают широкий набор пошаговой регрессии и технологии лучшего подмножества построения моделей, поддерживающие непрерывные и категориальные переменные. Пошаговые методы и методы лучшего подмножества построения моделей составных планов можно использовать в GRM, включая планы с эффектами для категориальных предсказанных переменных.

GRM не ограничивает анализы в плане содержания непрерывных предсказанных переменных. Кроме этого, исключительные опции регрессионных результатов включают карты Парето параметров оценивания, целые модельные критерии с различными методами оценивающих моделей, частные и получастные корреляции и т.п. Подробнее о GRM.

В начало


Обобщенные линейные модели (GLZ)

Модуль Обобщенные линейные модели (GLZ) позволяет анализировать как линейные, так и нелинейные эффекты для любого количества и типа предикторов с дискретной или непрерывной зависимой переменной (включая множественную логит, пробит модели, распознавание сигналов и многие другие). Кроме того, в этом модуле реализованы разнообразные типы анализов, такие как биномиальная и множественная логит и пробит регрессия или Теория определения сигнала (SDT).

Модуль GLZ вычислит все стандартные итоговые статистики, включая критерии оценки правдоподобия, статистики Вальда для значимых эффектов, оценки параметров, их стандартные ошибки, доверительные интервалы и т.д. Интерфейс, способы задания плана и использование программы аналогичны модулям GLM, GRM и PLS.

Пользователь может легко задать ANOVA или ANCOVA-подобные планы, планы поверхности отклика, смешанные планы и т.д.; поэтому, даже у новичков не возникнет трудностей с применением обобщенных линейных моделей к анализу данных. Кроме того, модуль GLZ предоставляет обширный выбор инструментов проверки модели, таких как таблицы и графики различных статистик остатков или выбросов (включая исходные остатки, остатки Пирсона, сумму квадратов остатков, стьюдентизированные остатки Пирсона, стьюдентизированные суммы квадратов остатков, остатки правдоподобия, дифференциальные статистики Хи-квадрат, дифференциальную сумму квадратов, обобщенные расстояния Кука и т. д. Подробнее о GLZ.

В начало


Общие модели частных наименьших квадратов (PLS)

Модуль Общие модели частных наименьших квадратов (PLS) представляет обширный выбор алгоритмов для решения одномерных и многомерных задач по методу частных наименьших квадратов. PLS вычисляет все стандартные результаты, как для анализа частных наименьших квадратов. Также, в этом модуле представлено множество средств интерпретации результатов и, в частности, графического представления данных, которые обычно не доступны в других приложениях.

Например, Вы можете воспользоваться такими опциями, как график значений параметра как функции числа компонент, двухмерные графики для всех входных статистик (параметров, факторов и т.д.), двухмерные графики для всех статистик остатков и т.д. Поскольку модуль PLS аналогичен по своему интерфейсу модулям GLM, GRM и GLZ, для Вас не составит трудности построить модель в одном модуле и быстро проанализировать данные с помощью этой же модели в PLS. Уникальный гибкий интерфейс позволит даже начинающим пользователям использовать эти мощные инструменты для анализа своих задач.

Метод частных наименьших квадратов – это мощная технология добычи данных, особенно хорошо подходит для нахождения меньшего количества размерностей в большом количестве предикторов или переменных отклика. Подобные методы анализа линейных систем стали популярны только в последние несколько лет, поэтому многие алгоритмы и статистики по-прежнему находятся на стадии исследования. Подробнее о PLS.

В начало


Другие модули продукта STATISTICA Advanced: STATISTICA Multivariate Exploratory Techniques (Многомерные технологии анализа), STATISTICA Power Analysis and Interval Estimation (Анализ мощности и интервальное оценивание)

‹‹
››
ПнВтСрЧтПтСбВс


                info@statsoft.ru         +7 (495) 787-77-33      +7 (499) 674-06-15          STATISTICA 13.3 Trial

Авторские права на дизайн и материалы сайта принадлежат компании StatSoft Russia.
Все права защищены.

© StatSoft Russia
1999-2023

StatSoft Russia – компания, зарегистрированная и действующая в соответствии с законами России, которые могут отличаться от законов других стран, имеющих офисы StatSoft. Каждый офис StatSoft является самостоятельным юридическим лицом, имеет право предлагать услуги и разрабатывать приложения, которые могут быть, а могут и не быть представлены в офисах StatSoft других стран.

Лицензионное соглашение      Карта сайта