Главная страница сайта Услуги решения задач по химии
Лекции по химии Учебник - общая химия


Рис. 12.5-5. Зависимость собственного значения от номера компоненты для данных по составу волос из табл. 12.5-1.

Собственное значение

2-

о-

Компонента

Еще один метод определения числа главных компонент — это гсроес-валидация (перекрестная проверка на достоверность). В простейшем варианте для этого из матрицы X исключают один объект и проводят вычисления для оставшейся матрицы при некотором фиксированном числе главных компонент. Затем на основании полученной модели рассчитывают значения признаков для исключенного объекта и сравнивают предсказанные значения с экспериментальными, после чего исключенный объект возвращают в матрицу, удаляют следующий объект и повторяют вычисления. По окончании перебора всех объектов рассчитывают общую сумму квадратов отклонений предсказанных величин признаков от экспериментальных. После этого всю процедуру повторяют с самого начала с другим числом компонент. Окончательный выбор числа главных компонент осуществляют на основе полученного набора сумм квадратов отклонений с помощью соответствующих статистических критериев. Если массив данных очень большой, то объекты можно удалять не по одному, а группами.

Графическая интерпретация результатов в методе главных компонент

В методе главных компонент результаты обычно интерпретируют путем графического представления компонент (факторов) и нагрузок. Иногда выводы можно сделать уже на основании анализа одной компоненты. Коммерческие программы предоставляют возможности для визуализации дву- и трехмерных массивов данных. Для группировки объектов в кластеры строят диаграммы, на которых каждый объект представлен точкой с координатами, равными значениям его главных компонент. Такие диаграммы представляют собой проекцию множества объектов в пространство нескольких главных компонент, описывающих основную долю дисперсии данных. На рис. 12.5-6 представлен такой график для данных по составу образцов волос из табл. 12.5-1. Легко видеть, что объекты распадаются на три кластера по три объекта в каждом.

Аналогичный график, построенный для нагрузок, позволяет выявить корреляции между признаками и их относительную значимость. Такой график для двух первых компонент рассматриваемого массива данных приведен на рис. 12.5-7.

Графическое представление нагрузок является проекцией свойств в пространство главных компонент. Информацию о корреляции между признаками можно получить из величины косинуса угла между соответствующими векторами. Чем она ближе по абсолютной величине к единице (в частности, чем меньше соответствующий угол), тем выше корреляция. Векторы, соответству-



 

Вернуться в меню книги (стр. 501-600)

 

Если нужно решить контрольную по химии - обращайтесь к нам
Поможем быстро и качественно решить задачи по химии, выполнить контрольную работу или написать реферат. Консультируем по химии онлайн.

 

Copyright © 2007-2012 Zomber.Ru

Использование материалов сайта возможно при условии указания активной ссылки
Решить химию