Главная страница сайта Услуги решения задач по химии
Лекции по химии Учебник - общая химия


классу принадлежит тот или иной объект. Поэтому такие методы называют неконтролируемыми.

Проекционные методы

Задача проекционных методов — сведение исходного массива данных к массиву меньшей размерности: одно-, дву- или трехмерному. Это действие можно наглядно представить себе таким образом, как если бы аналитик смотрел на экран компьютера и с помощью специальной математической процедуры вращал массив данных во всевозможных направлениях с целью выбрать такое положение, для которого проекция данных на экран обеспечивала бы наилучшее разделение между классами. Подобные методы действительно разработаны статистиками и широко применяются в хемометрике.

В настоящее время проекцию данных осуществляют в основном с помощью методов, называемых анализом главных компонент (РСА), факторным анализом (FA), сингулярным разложением (SVD) и проекцией на собственные векторы или ранговой аннигиляцией. Все эти методы очень близки между собой. Различия в их названиях—во многом лишь дань традиции (в разных областях науки укоренились разные названия). Кроме того, существуют и некоторые различия в применяемых математических алгоритмах, а именно в форме представления дисперсионной матрицы, характере основных допущений, способах преобразования массива данных и интерпретации результатов (на основе анализа собственных значений или сингулярных чисел) и т. д.

□ Дисперсионная матрица характеризует разброс многомерных данных относительно среднего. Для матрицы центрированных данных X дисперсионная матрица вычисляется как Х1Х.

Здесь мы рассмотрим два проекционных метода —анализ главных компонент и сингулярное разложение. Родственные методы, такие, как факторный анализ, рассмотрены в разд. 12.5.4.

Главная идея метода главных компонент — аппроксимация исходной матрицы X произведением двух матриц меньшей размерности, называемых матрицей факторов и матрицей нагрузок:

Здесь X — матрица данных, состоящая из N строк (объекты) и К столбцов (признаки), Т — матрица факторов или главных компонент (N строк и А столбцов), Р—матрица нагрузок (А строк и К столбцов), Е — матрица погрешностей (N строк, К столбцов), а верхний индекс t означает транспонированную матрицу.

Число А называется числом главных компонент. Оно может быть меньше, чем общее число признаков К. Поэтому рассматриваемую операцию можно представить как проекцию матрицы X в подпространство размерности А с помощью проекционной матрицы Р1. Результатом является набор координат

X = TPt

(12.5-4)



 

Вернуться в меню книги (стр. 501-600)

 

Если нужно решить контрольную по химии - обращайтесь к нам
Поможем быстро и качественно решить задачи по химии, выполнить контрольную работу или написать реферат. Консультируем по химии онлайн.

 

Copyright © 2007-2012 Zomber.Ru

Использование материалов сайта возможно при условии указания активной ссылки
Решить химию