Главная страница сайта | Услуги решения задач по химии |
Лекции по химии | Учебник - общая химия |
классу принадлежит тот или иной объект. Поэтому такие методы называют неконтролируемыми.
Проекционные методы
Задача проекционных методов — сведение исходного массива данных к массиву меньшей размерности: одно-, дву- или трехмерному. Это действие можно наглядно представить себе таким образом, как если бы аналитик смотрел на экран компьютера и с помощью специальной математической процедуры вращал массив данных во всевозможных направлениях с целью выбрать такое положение, для которого проекция данных на экран обеспечивала бы наилучшее разделение между классами. Подобные методы действительно разработаны статистиками и широко применяются в хемометрике.
В настоящее время проекцию данных осуществляют в основном с помощью методов, называемых анализом главных компонент (РСА), факторным анализом (FA), сингулярным разложением (SVD) и проекцией на собственные векторы или ранговой аннигиляцией. Все эти методы очень близки между собой. Различия в их названиях—во многом лишь дань традиции (в разных областях науки укоренились разные названия). Кроме того, существуют и некоторые различия в применяемых математических алгоритмах, а именно в форме представления дисперсионной матрицы, характере основных допущений, способах преобразования массива данных и интерпретации результатов (на основе анализа собственных значений или сингулярных чисел) и т. д.
□ Дисперсионная матрица характеризует разброс многомерных данных относительно среднего. Для матрицы центрированных данных X дисперсионная матрица вычисляется как Х1Х.
Здесь мы рассмотрим два проекционных метода —анализ главных компонент и сингулярное разложение. Родственные методы, такие, как факторный анализ, рассмотрены в разд. 12.5.4.
Главная идея метода главных компонент — аппроксимация исходной матрицы X произведением двух матриц меньшей размерности, называемых матрицей факторов и матрицей нагрузок:
Здесь X — матрица данных, состоящая из N строк (объекты) и К столбцов (признаки), Т — матрица факторов или главных компонент (N строк и А столбцов), Р—матрица нагрузок (А строк и К столбцов), Е — матрица погрешностей (N строк, К столбцов), а верхний индекс t означает транспонированную матрицу.
Число А называется числом главных компонент. Оно может быть меньше, чем общее число признаков К. Поэтому рассматриваемую операцию можно представить как проекцию матрицы X в подпространство размерности А с помощью проекционной матрицы Р1. Результатом является набор координат
X = TPt
(12.5-4)
|
Если нужно решить контрольную по химии - обращайтесь к нам |
Copyright © 2007-2012 Zomber.Ru
Использование материалов сайта возможно при условии указания активной ссылки
Решить химию