현재 A.I 및 빅데이터 분석을 하다보면 모르는 영단어로 된 용어가 지속적으로 등장하면 곤욕을 치를 때가 있다 그래서 이번 글에선 A.I 및 빅데이터 분석에서 자주 등장하는 용어들을 정리해볼 것이다
Size (전체 수치)
Size (전체 수치)는 데이터 세트의 전체 크기나 개수
Distinct (고유 값)
Distinct (고유 값)는 데이터 세트에서 중복을 제거한 후 남는 고유한 값의 수
Missing (결측치)
Missing (결측치) 데이터 세트에서 누락된 값
Minimum (최소값)
Minimum (최소값) 데이터 세트에서 가장 작은 값
Maximum (최대값)
Maximum (최대값) 데이터 세트에서 가장 큰 값
Zeros (0의 개수)
Zeros (0의 개수) 데이터 세트에서 0의 값이 나타나는 횟수
Mean (평균)
Mean (평균) 데이터 세트의 평균값
Median (중간값)
Median (중간값) 데이터 세트의 중간값
Sum (합계)
Sum (합계) 데이터 세트의 모든 값의 총합
SD (표준편차)
SD (표준편차) 데이터 세트의 값이 평균에서 얼마나 퍼져 있는지를 나타내는 수치
Skewness (왜도)
Skewness (왜도) 데이터의 분포가 얼마나 비대칭인지를 나타내는 척도
Outlier (이상치)
Outlier (이상치) 나머지 데이터와 크게 다른 데이터 포인트
Overfitting (과적합)
Overfitting (과적합) 모델이 학습 데이터에 지나치게 최적화되는 현상
Bias (편향)
Bias (편향) 결과가 한 쪽으로 치우친 경향