kmeans 2

[R] R을 이용한 군집분석

1. 군집화 1) 개념 * 군집분석: 동일한 성격을 가진 여러 개의 그룹으로 대상을 분류하는 것 - 대상 개체를 유사하거나 서로 관련있는 항목기리 묶어 몇 개의 집단으로 그룹화 하는 것 - 각 집단의 성격을 파악함으로써 데이터 전체의 구조에 대한 이해를 돕고자 하는 탐색적 분석방법 (집단 간 이질성: 크게 / 집단 내 동질성: 작게) 2) 군집 분석의 특징 * 사전에 정의된 어떤 특수한 목적이 없음 -> 종속변수에 대한 독립변수의 영향과 같이, 사전에 정의된 어떤 특수한 목적이 없음 -> 데이터 자체에 의존하여 데이터의 구조와 자료를 탐색하고 요약하는 기법 * 대용량 데이터의 경우, 전체에 대한 의미 있는 정보를 얻어낼 수 있음 - 전체를 유사한 관찰치들의 군집으로 구분(잘 대표하는 군집) -> 전체에 ..

프로그래밍 2021.05.29

[Python] Machine Learning(Linear Regression, PCA, KNN, SVM, Kmeans)

1. Iris Data 탐색 * 내장된 데이터 셋에서 Iris 데이터를 로드 from sklearn import datasets iris = datasets.load_iris() * Iris = (Sepal Length, Sepal Width, Petal Length, Petal Width) iris.data * Target iris.target * Target_Name(0: setosa, 1: versicolor, 2: vriginica) iris.target_names * Sepal Scatter # Sepal Scatter sepal_length = iris.data[:, 0] sepal_width = iris.data[:, 1] species = iris.target # Visulization p..

프로그래밍 2021.05.16