Variant_2



Кафедра БТС
ОТЧЕТ ПО ИНДИВИДУАЛЬНОМУ ДОМАШНЕМУ ЗАДАНИЮ
По дисциплине: Планирование эксперимента
На тему: Снижение размерности пространства признаков.
Метод главных компонент.
Вариант 2
Выполнила: Антонович М.В.
Преподаватель: Манило Л.А.
Санкт-Петербург
СПбГЭТУ «ЛЭТИ»
2016
Содержание TOC \o "1-3" \h \z \u
Введение PAGEREF _Toc432216729 \h 3Расчёты PAGEREF _Toc432216730 \h 41.Преобразование матрицы наблюдений путем центрирования исходных признаков PAGEREF _Toc432216731 \h 62.Построение ковариационной матрицы для исследуемого множества объектов PAGEREF _Toc432216732 \h 123.Набор собственных векторов матрицы ковариаций PAGEREF _Toc432216733 \h 134.Переход от исходных центрированных признаков к главным компонентам PAGEREF _Toc432216734 \h 165.Определение новых координат объектов: PAGEREF _Toc432216735 \h 166.Построение кривой изменения относительной доли суммарной дисперсии, обусловленной первыми компонентами PAGEREF _Toc432216736 \h 167.Оценка доли дисперсии, которая обеспечивается первыми двумя главными компонентами PAGEREF _Toc432216737 \h 178.Отображение распределения объектов заданных классов в пространстве новых признаков PAGEREF _Toc432216738 \h 18Вывод PAGEREF _Toc432216739 \h 19
ВведениеЦель работы: освоение метода главных компонент с помощью программной среды MathCad.
Исходные данные: результат описания множества реализаций ЭКГ набором признаков ApEn (1), ApEn (2), ApEn (3), ApEn (4), ApEn (5), ME.
Эти признаки получены в процессе вычисления и анализа параметров энтропии Колмогорова, которая отражает степень сложности ритмограммы.
Выборка данных включает несколько классов ЭКГ:
МА – мерцательная аритмия,
НР – нормальный ритм,
ЧЭ – частая экстрасистолия.
Каждый из классов представлен 25 объектами.
Задание:
Требуется для всей совокупности данных, используя метод главных компонент, выполнить следующие преобразования:
1) преобразовать матрицы наблюдений путем центрирования исходных признаков ;2) построить ковариационную матрицу для исследуемого множества объектов;
3) найти набор собственных векторов матрицы ковариаций;
4) осуществить переход от исходных центрированных признаков к главным компонентам;
5) определить новые координаты объектов:;6) построить кривую изменения относительной доли суммарной дисперсии, обусловленной первыми компонентами;
7) оценить долю дисперсии, которая обеспечивается первыми двумя главными компонентами ;8) отобразить распределение объектов заданных классов в пространстве новых признаков: или.
РасчётыИмеется выборка данных (файл Вар_2.xls), состоящая из двух классов, где каждый класс представлен 25-ю объектами:
МА – мерцательная аритмия
Таблица 1. Мерцательная аритмия
№ ApEn(1) ApEn(2) ApEn(3) ApEn(4) ME
1 1,887 1,203 0,372 0,069 0,672
2 1,897 1,126 0,363 0,130 0,794
3 1,902 1,222 0,347 0,050 0,723
4 1,962 1,074 0,342 0,066 0,873
5 1,999 1,133 0,244 0,051 0,842
6 2,018 1,114 0,245 0,028 0,907
7 1,984 1,165 0,260 0,048 0,798
8 2,022 1,064 0,294 0,050 0,878
9 1,941 1,148 0,364 0,063 0,760
10 1,929 1,196 0,328 0,049 0,705
11 1,968 1,171 0,316 0,077 0,728
12 1,922 1,141 0,376 0,069 0,739
13 1,992 1,086 0,321 0,028 0,835
14 1,961 1,193 0,290 0,033 0,734
15 1,915 1,214 0,360 0,047 0,734
16 1,869 1,231 0,421 0,069 0,614
17 1,969 1,175 0,296 0,059 0,833
18 1,884 1,162 0,423 0,089 0,765
19 1,902 1,202 0,386 0,074 0,649
20 1,943 1,141 0,336 0,059 0,803
21 1,893 1,219 0,405 0,048 0,634
22 1,839 1,170 0,456 0,123 0,723
23 1,858 1,243 0,405 0,072 0,686
24 1,920 1,215 0,341 0,020 0,832
25 1,985 1,169 0,300 0,062 0,763

НР – нормальный ритм
Таблица 2. Нормальный ритм
№ ApEn(1) ApEn(2) ApEn(3) ApEn(4) ME
1 1,434 1,128 0,553 0,152 1,027
2 1,480 1,196 0,670 0,193 0,847
3 1,307 1,057 0,697 0,384 1,022
4 1,235 1,016 0,702 0,391 0,984
5 1,345 1,070 0,729 0,404 0,911
6 1,265 0,988 0,708 0,428 1,003
7 1,201 0,911 0,696 0,455 1,048
8 1,228 0,995 0,777 0,470 0,750
9 1,840 0,977 0,279 0,029 1,081
10 1,806 0,903 0,189 0,031 1,317
11 1,040 0,912 0,680 0,487 1,179
12 1,875 0,876 0,218 0,029 1,394
13 1,078 0,937 0,697 0,431 1,203
14 1,058 0,906 0,716 0,474 1,143
15 1,140 0,956 0,683 0,413 1,040
16 1,975 0,841 0,158 0,020 1,354
17 1,232 0,925 0,579 0,279 1,347
18 1,339 0,884 0,452 0,183 1,606
19 1,295 0,995 0,577 0,222 1,312
20 1,465 0,885 0,472 0,157 1,397
21 0,808 0,603 0,497 0,396 1,305
22 1,449 1,165 0,678 0,290 0,832
23 1,315 0,902 0,460 0,219 1,609
24 1,444 1,045 0,612 0,256 1,065
25 1,245 1,012 0,663 0,366 1,116

Преобразование матрицы наблюдений путем центрирования исходных признаков
Выполним импорт данных из Excel в Mathcad, проделав следующие операции:
Вставка → Данные → Ввод из файла…
2) Задаём путь к файлу, выбираем нужный нам лист и диапазон ячеек.
Получим:



Центрирование производится по следующей формуле:
Xci,j= Xi,j-Xj, где Xi,j-матрица исходных данных , Xj=i=1nXi,jn-средние значения столбцов .Для получения матрицы исходных данных произведём объединение двух классов:

Таблица 3. Матрица исходных данных


Отобразим полученную таблицу с помощью оператора ORIGIN.
Таблица 4. Матрица исходных данных с оператором ORIGIN




Рисунок 2 – График распределения исходных признаков
Вычислим средние значения столбцов:


Выполним центрирование признаков:




Построение ковариационной матрицы для исследуемого множества объектовКовариационная матрица вычисляется по следующей формуле:
Si,j= 1n∙k=1nXk,i-Xi∙Xk,j-Xj=1n∙k=1nXck,i∙Xck,jПример расчёта элементаcov(x1,x2) ковариационной матрицы:
S=cov(x1,x1)cov(x1,x2)cov(x1,x3)cov(x1,x4)cov(x1,x5)cov(x2,x1)cov(x2,x2)cov(x2,x3)cov(x2,x4)cov(x2,x5)cov(x3,x1)cov(x3,x2)cov(x3,x3)cov(x3,x4)cov(x3,x5)cov(x4,x1)cov(x4,x2)cov(x4,x3)cov(x4,x4)cov(x4,x5)cov(x5,x1)cov(x5,x2)cov(x5,x3)cov(x5,x4)cov(x5,x5),
где covx1,x1, covx2,x2, covx3,x3, covx4,x4, cov(x5,x5) – дисперсии.
Вычислим ковариационную матрицу:


Набор собственных векторов матрицы ковариацийНаходим собственные числа λ1≥λ1≥...≥λp матрицы S, как вектор решений характеристического уравнения:
S-λp∙E∙Lp=0, где S – матрица ковариаций;
λp – собственное число;
E – единичная матрица (квадратная матрица, элементы главной диагонали которой равны единице, а остальные равны нулю);
Lp – собственный векторLp=1.
Вычислим собственные числа и собственные векторы:
Таблица 5. Собственные числа и их векторы
Собственные числа:


Собственные вектора:



Таблица 6. Собственные вектора и их нормировка
Первый собственный вектор:



Второй собственный вектор:



Третий собственный вектор:



Четвёртый собственный вектор:



Пятый собственный вектор:



Нормировка векторов:





Переход от исходных центрированных признаков к главным компонентамy(i)= LpT∙XcT, где y(i)– i-ая главная компонента.
Определение новых координат объектов:



Построение кривой изменения относительной доли суммарной дисперсии, обусловленной первыми компонентами
Ip'=n=1p'λnk=1pλk–доля дисперсии, вносимая первымиp' главными компонентами.
Таблица 7. Доли дисперсий для каждой главной компоненты










Из полученных данных построим график:

Рисунок 3 – Распределение дисперсии
Оценка доли дисперсии, которая обеспечивается первыми двумя главными компонентами
Произведём анализ дисперсий для двух главных компонент:








Таблица 8. Анализ вклада главных компонент y1и y2Главная компонента yiy1y2Собственное число λp0,2 0,054
Вклад главной компоненты, % 76,726 20,605
Суммарный вклад, % 76,726 97,321
Мы видим, что суммарный вклад двух компонент y1и y2 от общей дисперсии составляет 97,321%, чего достаточно для дальнейшего анализа.
Отображение распределения объектов заданных классов в пространстве новых признаков
Класс мерцательной аритмии:




Класс нормального ритма:




Отобразим распределение объектов для двух классов в пространстве меньшей размерности:

Рисунок 4 – Распределение объектов двух классов в пространстве первых двух главных компонент

ВыводПроизвели нормировку собственных векторов, убедились в верных расчётах;
Снизили размерность пространства признаков, применив МГК;
На графике распределения объектов двух классов можно легко увидеть мерцательную аритмию (красные точки) и нормальный ритм (синие кружочки).

Приложенные файлы

  • docx 17933496
    Размер файла: 168 kB Загрузок: 0

Добавить комментарий