1_Ispolzovanie_metodov_kazualnogo_analiza_2 (1)..


Чтобы посмотреть презентацию с картинками, оформлением и слайдами, скачайте ее файл и откройте в PowerPoint на своем компьютере.
Текстовое содержимое слайдов презентации:

Выполнили: Горбунова Н., Дурнева Е., Наумова Е, Рогожина Я., Фетисова А., Ли Ши Нан. I часть. О регрессии1. Регрессия (определение, виды)2. Применение множественной регрессии в социологии3. Применение линейной регрессии4. Требования к зависимой переменной (условия регрессии) 4.1 Интервальная шкала 4.2 Квазинтервальная шкала5. Требования к независимой переменной 6. Мультиколлиниарность (ограничения регрессии) II часть. Процесс регрессии1. Использование корреляции для отбора переменных для регрессии2. REGRESSION в линейной регрессии 3. Интерпретация: 3.1 Коэффициентов множественной корреляции 3.2 Коэффициентов детерминации 3.3 Стандартных и нестандартных коэффициентов 3.4 Результатов регрессионного анализа4. Перекодировка множественных номинальных переменных в бинарные5. Бинарные зависимые переменные и логическая регрессия РЕГРЕССИЯ—зависимость среднего значения какой-либо случайной величины от некоторой другой величины или нескольких величин. При регрессионной связи одному и тому же значению x величины X могут соответствовать разные случайные значения величины Y. Распределение этих значений называется условным распределением Y при данном X= x. Множественная регрессия применяется в решении проблем спроса, доходности акций, при изучении функции издержек производства, в макроэкономических расчетах. Цель множественной регрессии - построить модель с большим числом факторов, определив при этом влияние каждого из них в отдельности, а также их совокупное воздействие на моделируемый показатель. Линейная регрессия применяется в статистике в виде четкой экономической интерпретации ее параметров.Цель линейной регрессии прогнозирование различных экономических или социальных процессов, исходя из прошлых данных.Построение более подходящей линии действий, для достижения наивысших результатов. Зависимые переменные - это переменные, которыеизмеряются или регистрируются (у). Важное значение имеет шкала измерения зависимой переменной.4.1Интервальная шкала: Это числовая шкала, количественно равные промежутки которой отображают равные промежутки между значениями измеряемых характеристик.Она позволяет:находить разницу между двумя величинами;указать количественное значение измеряемого признака.  Квазинтервальные переменные похожи на интервальные переменные.Их характерной чертой является наличие определенной точки абсолютного нуля. В программе записывается: порядковая-номер выбора, или квази-интервальная-балл по шкале. С методологической стороны (самого исследования, а не последующего анализа) лучше использовать именно порядок от 1 до 6. Независимые переменные (X)-это переменные, используемые для моделирования или прогнозирования значений зависимых переменных. Требования: -Однородность значений переменных;-Достоверность значения переменных; Мультиколлинеарность — наличие линейной зависимости между независимыми переменными (факторами) регрессионной модели. Если полная коллинеарность приводит к неопределенности значений параметров, то частичная мультиколлинеарность приводит к неустойчивости их оценок. Неустойчивость выражается в увеличении статистической неопределенности — дисперсии оценок. Это означает, что конкретные результаты оценки могут сильно различаться для разных выборок несмотря на то, что выборки однородны. Для обнаружения мультиколлинеарности факторов нужно проанализировать:корреляционную матрицу факторов (наличие больших по модулю (выше 0,7-0,8) значений коэффициентов парной корреляции свидетельствует о возможных проблемах с качеством получаемых оценок)коэффициенты детерминации регрессий факторов на остальные факторы (R^2_i) (на наличие указывают слишком высокие значения). Метод главных компонентов:Применение его к факторам модели позволяет преобразовать исходные факторы и получить совокупность ортогональных (некоррелированных) факторов. При этом наличие мультиколлинеарности позволит ограничиться небольшим количеством главных компонентов. Учет знаков коэффициентов корреляцииИсходя из того, что в линейных моделях коэффициенты корреляции между параметрами могут быть положительными и отрицательными, то можно установить:1.Недопустимую мультиколлинеарность - оба фактора действуют на функцию у одинаково и значительная положительная корреляция между ними может позволить исключить один из них.2.Допустимую мультиколлинеарность - такую, при которой факторы действуют на функцию у неодинаково Основная задача корреляционного анализа это установление характера и тесноты связи между результативными (зависимыми) и факторными (независимыми) признаками в данном явлении или процессе. А на основе этого уже проводится регрессионный анализ. Построение простых регрессионных моделей в SPSSМеню Analyze – Regression - Linear Зависимая переменная переносится в поле Dependent. Независимые переменные (факторные признаки) – в поле Independent(s). После нажатия кнопки Statistics появляется окно Linear Regression: Statistics c параметрами:Regression Coefficient Estimates – оценки значимости коэффициентов регрессионной модели;Regression Coefficient Confidence Intervals – доверительные интервалы для коэффициентов регрессионной модели;Model fit – параметры соответствия модели эмпирическим данным (коэффициенты множественной корреляции, множественной детерминации и др.);Descriptives – описательная статистика по эмпирическим данным (среднее арифметическое, стандартное отклонение и объем выборки);Collinearity diagnostics – параметры для оценки мультиколлинеарности (связанность независимых переменных). Для интерпретации направления связи между переменными смотрят на знаки (плюс или минус) регрессионных коэффициентов или B-коэффициентов:если B-коэффициент положителен, то связь этой переменной с зависимой переменной положительна (например, чем больше IQ, тем выше средний показатель успеваемости оценки); если B-коэффициент отрицателен, то и связь носит отрицательный характер (например, чем меньше число учащихся в классе, тем выше средние оценки по тестам);если B-коэффициент равен 0, связь между переменными отсутствует.  Коэффициент детерминации (  - R-квадрат) — единица минус доля необъяснённой дисперсии (дисперсии случайной ошибки модели, или условной по признакам дисперсии зависимой переменной) в дисперсии зависимой переменной. В случае линейной зависимости   является квадратом так называемого множественного коэффициента корреляции между зависимой переменной(у) и объясняющими переменными(х). Интерпретация коэффициента детерминации: Коэффициент детерминации для модели с константой принимает значения от 0 до 1. Чем ближе значение коэффициента к 1, тем сильнее зависимость. При оценке регрессионных моделей это интерпретируется как соответствие модели данным. Для приемлемых моделей предполагается, что коэффициент детерминации должен быть не меньше 50 %. Значение коэффициента детерминации 1 означает функциональную зависимость между переменными. Нестандартный коэффициент интерпретируется: коэффициент В представляет среднее изменение зависимой переменной при изменении на единицу соответствующей этому коэффициенту независимой переменной при неизменных других независимых переменных. 3.3 Интерпретация стандартных и нестандартных коэффициентов Интерпретация стандартных коэффициентов: умножение коэффициента В на стандартное отклонение независимой переменной и его деление на стандартное отклонение независимой переменной. Полученные результаты регрессионного анализа сравниваются с предварительными гипотезами. Оценивается корректность и правдоподобие полученных результатов. Переменная относимая к номинальной шкале и имеет более двух (а именно четыре) категории. Поэтому, без дополнительной обработки ее нельзя применять в дальнейших расчетах.В этом случае можно: разложить переменную на четыре, так называемых, фиктивных переменных, с кодировками отвечающими 0 (действительно) и 1 (ложно). В файл добавляются четыре новые переменные, которые поочередно соответствуют четырем различным кодировкам переменной. С помощью метода бинарной логистической регрессии можно исследовать зависимость дихотомических переменных от независимых переменных, имеющих любой вид шкалы.Как правило, в случае с дихотомическими переменными речь идет о некотором событии, которое может произойти или не произойти; бинарная логистическая регрессия в таком случае рассчитывает вероятность наступления события в зависимости от значений независимых переменных.

Приложенные файлы

  • ppt 18122669
    Размер файла: 3 MB Загрузок: 0

Добавить комментарий