www.machinelearningmastery.ru

Машинное обучение, нейронные сети, искусственный интеллект
Header decor

Home

Тест статистической значимости в SAS

Дата публикации Aug 20, 2019

Многие материалы доступны для проверки статистической значимости. Этот блог дает вам краткое представление о том, почему, что, когда и как использовать статистический тест? Кроме того, этот пост является попыткой быстрого пересмотра использования этих статистических тестов. Значение p и гипотеза не обсуждались в этом блоге, и вы можете проверитьВот,

Зачем нам нужно много статистических тестов?

Например, мы хотим измерить вес мяча. У нас есть четыре устройства для измерения, такие как физический баланс, термометр, линейка и мерная колба. Какой из них мы выбираем? Очевидно, мы выбираем физическое равновесие. Не так ли? Предположим, мы хотим измерить температуру мяча? Затем выбираем термометр. Для объема, затем выбираем мерную колбу.

Теперь вы можете видеть, что в качестве переменной, которую мы хотим измерить, изменяется и устройство. Точно так же, почему у нас так много статистических тестов? У нас есть разные типы переменных и анализа. По мере изменения типа анализа меняются и статистические тесты.

Давайте возьмем другой пример. Предположим, Учитель хочет сравнить рост мальчиков и девочек в классе.

Так Учитель порождает Нулевую и Альтернативную Гипотезу. Вот,

Нулевая гипотеза (H0)→ Рост мальчиков и девочек одинаков, и любое различие между высотами случайно.

Альтернативная гипотеза (H1)→ Рост мальчиков выше, чем рост девочек, поэтому наблюдаемые различия между ростом реальны.

Как проверить эту гипотезу? Для этого играет роль критерий статистической значимости.

Что такое тест статистической значимости?

Это тест, который помогает исследователям или аналитикам подтвердить гипотезу. Другими словами, эти тесты помогают, является ли гипотеза верной или нет?

Есть много статистических тестов. Но мы увидим два типа в этом блоге.

Тест статистической значимости делится на два типа.

Следующий вопрос, когда использовать?

Выбор статистического теста

Как параметрические, так и непараметрические тесты имеют разные виды тестов (различные типы параметрических тестов были рассмотрены ниже), но как аналитик или исследователь выбирает правильный тест на основе дизайна исследования, типа переменной и распределения?

Приведенная ниже таблица содержит краткое изложение вопросов, на которые необходимо ответить перед выбором правильного теста. Справка: Университет Миннесоты. Ты можешь проверитьВот,

Что такое параметрический тест?

Используется, если информация о населении полностью известна посредством ее параметров, тогда статистический тест называется параметрическим тестом.

Типы параметрического теста

1) t-тест

T-тест для одного образца

T-критерий сравнивает разницу между двумя средними значениями в разных группах, чтобы определить, является ли разница статистически значимой

Давайте возьмем пример набора данных hbs2. Набор данных содержит 200 наблюдений из выборки старшеклассников. Он имеет пол, социально-экономический статус, этническое происхождение, такие предметы, как чтение, письмо, математика, общественные науки.

Здесь хотелось бы проверить, отличается ли средняя оценка письма от 50.

Здесь значение р составляет менее 0,05. Следовательно, среднее значение переменной записи для этой выборки студентов составляет 52,77, что статистически значительно отличается от значения теста 50. Мы пришли бы к выводу, что эта группа студентов имеет значительно более высокое среднее значение по тесту письма, чем 50.

t-тест для двух образцов

Он используется, когда две независимые случайные выборки происходят из нормальных популяций, имеющих неизвестную или одинаковую дисперсию. Он разделен на два типа

  1. Независимый T-тест с двумя образцами:

Независимый выборочный t-критерий используется, когда вы хотите сравнить средние значения нормально распределенной переменной, зависящей от интервала, для двух независимых групп. Другими словами, этот t-критерий предназначен для сравнения средних значений одной и той же переменной между двумя группами.

Здесь мы хотели бы проверить, одинаково ли среднее значение для письма для мужчин и женщин. (переменная female имеет 0 и 1 (0 -> Male и 1 -> Female). Эта переменная необходима для проведения независимого группового t-теста и определяетсяучебный классзаявление.

В нашем наборе данных мы сравниваем средний балл письменности между группой студенток и группой учеников мужского пола (в приведенном выше коде упоминается как класс, а самка является переменной (0 -> мужской и 1 -> женский). Это дает две возможные разные t-статистики и два разных p-значения Интерпретация p-значения такая же, как и в других t-тестах.

Из приведенного выше равенства дисперсий, значение р составляет 0,0187, что меньше 0,05, мы заключаем, что дисперсии значительно отличаются Приведенный выше результат показывает, что существует статистически значимая разница между средней оценкой письма для мужчин и женщин (t = -3,73, p = .0003). Другими словами, у женщин статистически значимо более высокий средний балл при написании (54,991), чем у мужчин (50,121).

2. Парный t-критерий с двумя образцами

Он используется, когда у вас есть два связанных наблюдения (то есть два наблюдения на субъекта), и вы хотите увидеть, отличаются ли средние значения этих двух нормально распределенных интервальных переменных друг от друга.

Проверка письма и чтения

Значение р> 0,05. Приведенный выше результат показывает, что среднее значение чтения статистически не отличается от среднего значения записи.

2) Z-тест

Z-критерий представляет собой статистический критерий, в котором применяется нормальное распределение и в основном используется для решения проблем, связанных с большими выборками, когда частота больше или равна 30. Он используется, когда известно стандартное отклонение совокупности. Если размер выборки меньше 30, тогда применяется t-критерий.

В SAS proc t-test позаботится о размере выборки и даст соответствующие результаты. В SAS нет отдельного кода для z-теста.

3) Анализ отклонений (ANOVA)

Это набор статистических моделей, используемых для анализа различий между групповыми средними или отклонениями.

Односторонний ANOVA

Односторонний дисперсионный анализ (ANOVA) используется, когда у вас есть категориальная независимая переменная (с двумя или более категориями) и нормально распределенная переменная, зависящая от интервала, и вы хотите проверить различия в средствах зависимой переменной с разбивкой по: уровни независимой переменной.

В SAS это делается с помощьюПРОЦ АНОВА

Здесь, хотел бы проверить, означает ли среднееписьмоотличается между тремя типами программ (прог). Prog - это переменная категории.

Среднее значение зависимой переменной (запись) существенно различается между уровнями типа программы. Однако мы не знаем, есть ли разница только между двумя уровнями или всеми тремя уровнями. Мы также видим, что учащиеся в академической программе (уровень программы 2 -> Академическая программа) имеют наивысший средний балл, в то время как учащиеся в профессиональной программе имеют самый низкий балл. (уровень прог 1 -> Профессиональное)

Двухсторонний ANOVA

Двухстороннее ANOVA - это тип плана исследования с одной числовой переменной результата и двумя категориальными пояснительными переменными.

Здесь запишите в качестве зависимой переменной и женский и социально-экономический статус (ы) в качестве независимых переменных. Мы хотели бы проверить, написание отличается между женщиной и сес.

Эти результаты показывают, что общая модель является статистически значимой (F = 8,39, р = 0,0001). Переменныеженщинаа такжесесявляются статистически значимыми (F = 14,55, р = 0,0002 и F = 5,31, р = 0,0057 соответственно).

4) корреляция Пирсона (r)

Корреляция полезна, когда вы хотите увидеть линейную связь между двумя (или более) нормально распределенными переменными интервала.

Мы можем установить корреляцию между двумя непрерывными переменными чтения и записи в нашем наборе данных

Мы можем видеть, что корреляция междучитатьа такжезаписывать0,59678. Вычисляя корреляцию, а затем умножая на 100, мы можем узнать, какой процент изменчивости является общим. Пусть округление 0,59678 до 0,6, что при квадрате равно 0,36, умноженное на 100, составит 36%. следовательночитать акцииоколо 36% его изменчивости сзаписывать,

Я объясню Непараметрический тест в моей следующей статье.

Продолжайте учиться и следите за обновлениями!

Ссылка:

  1. https://stats.idre.ucla.edu/sas/

Оригинальная статья

Footer decor

© www.machinelearningmastery.ru | Ссылки на оригиналы и авторов сохранены. | map