Главная страница сайта | Услуги решения задач по химии |
Лекции по химии | Учебник - общая химия |
Рис. 12.5-5. Зависимость собственного значения от номера компоненты для данных по составу волос из табл. 12.5-1.
Собственное значение
2-
о-
Компонента
Еще один метод определения числа главных компонент — это гсроес-валидация (перекрестная проверка на достоверность). В простейшем варианте для этого из матрицы X исключают один объект и проводят вычисления для оставшейся матрицы при некотором фиксированном числе главных компонент. Затем на основании полученной модели рассчитывают значения признаков для исключенного объекта и сравнивают предсказанные значения с экспериментальными, после чего исключенный объект возвращают в матрицу, удаляют следующий объект и повторяют вычисления. По окончании перебора всех объектов рассчитывают общую сумму квадратов отклонений предсказанных величин признаков от экспериментальных. После этого всю процедуру повторяют с самого начала с другим числом компонент. Окончательный выбор числа главных компонент осуществляют на основе полученного набора сумм квадратов отклонений с помощью соответствующих статистических критериев. Если массив данных очень большой, то объекты можно удалять не по одному, а группами.
Графическая интерпретация результатов в методе главных компонент
В методе главных компонент результаты обычно интерпретируют путем графического представления компонент (факторов) и нагрузок. Иногда выводы можно сделать уже на основании анализа одной компоненты. Коммерческие программы предоставляют возможности для визуализации дву- и трехмерных массивов данных. Для группировки объектов в кластеры строят диаграммы, на которых каждый объект представлен точкой с координатами, равными значениям его главных компонент. Такие диаграммы представляют собой проекцию множества объектов в пространство нескольких главных компонент, описывающих основную долю дисперсии данных. На рис. 12.5-6 представлен такой график для данных по составу образцов волос из табл. 12.5-1. Легко видеть, что объекты распадаются на три кластера по три объекта в каждом.
Аналогичный график, построенный для нагрузок, позволяет выявить корреляции между признаками и их относительную значимость. Такой график для двух первых компонент рассматриваемого массива данных приведен на рис. 12.5-7.
Графическое представление нагрузок является проекцией свойств в пространство главных компонент. Информацию о корреляции между признаками можно получить из величины косинуса угла между соответствующими векторами. Чем она ближе по абсолютной величине к единице (в частности, чем меньше соответствующий угол), тем выше корреляция. Векторы, соответству-
|
Если нужно решить контрольную по химии - обращайтесь к нам |
Copyright © 2007-2012 Zomber.Ru
Использование материалов сайта возможно при условии указания активной ссылки
Решить химию