총 10분 중 11분
2001
시즌 2개, 그리고 영화
시즌 2:
5화
“아일랜드”
출연: 이나영, 김민준, 김민정, 현빈
장르: 애초에 역경을 딛고 이룩하는 숭고한 사랑이란 없다. 그 역경 자체가 사랑이다.
프로그램 특징: 그 곳에서 살아남는 사랑이 어떤 모습으로 걸어오는지 기다려 보고 싶다.
장르: 애초에 역경을 딛고 이룩하는 숭고한 사랑이란 없다. 그 역경 자체가 사랑이다.
프로그램 특징: 그 곳에서 살아남는 사랑이 어떤 모습으로 걸어오는지 기다려 보고 싶다.
회차
Data Science/자격증 공부
[ADsP] 주성분 분석
728x90
반응형
PCA (Principle Component Analysis)
- 차원 축소로 복잡한 데이터 구조를 파악할 수 있는 방법
- 상관관계가 있는 변수를 결합해 상관관계가 없도록 선형결합해 분산을 극대화한다.
- 표본의 크기가 작거나 순서형 자료를 포함하는 범주형 자료에 적용 가능
- 주로 3개 이내의 변수로 축약한다.
- 예측 모델 만들 때 주로 사용한다.
- 다변량 자료를 저차원으로 표시하여 Outlier 탐색에 사용한다.
주성분 분석의 목표는 데이터를 설명하는 방향성을 찾는 것이다.
- 이 방향은 데이터의 분산을 최대화하는 방향이다.
여기서 분산이란 평균에서 멀리 떨어진 만큼을 의미하며, 분산이 크다는 것은 데이터가 다양함을 의미한다.
- 변동성이 크다고 해석할 수도 있다.
- 다양한 범위에 걸쳐 분포되어 있는 데이터는 폭 넓은 특성과 패턴을 나타낼 수 있다.
A_pca <-(A2[, -score], scales = TRUE)
Summary(A_pca)
importance of components:
PC1 PC2 PC3 PC4
Standard deviation 2.08 0.95 0.911 0.641
Portion of Variance 0.618 0.128 0.119 0.054
Cumulative preportion 0.618 0.718 0.865 0.99
PCA에서 자료를 2개의 주성분으로 축약할 때 전체 분산의 78% 설명 가능하다는 의미는 데이터가 다양한 특성(패턴)을 포함할 수 있음을 말한다.
여기서 사용된 주성분은은 원래 변수들 중 서로 상관성이 높은 변수들의 선형 결합으로 만들어진다.
728x90
'Data Science > 자격증 공부' 카테고리의 다른 글
[빅데이터분석기사 필기] 키워드 정리 (4) | 2025.02.27 |
---|---|
[ADsP] 군집분석 (0) | 2024.08.06 |
[ADsP] 분석 거버넌스 체계 수립 (5) | 2024.08.05 |
[ADsP] 용어 정리 (0) | 2024.08.05 |
[ADsP] 연속형 변수와 순서형 변수 차이 (1) | 2024.07.25 |
2024:08:05
Data Science/자격증 공부
[ADsP] 주성분 분석