노가다 없는 스프레드시트 데이터 정리 핵심 함수 4가지

깔끔한 데이터 정리는 모든 분석의 시작입니다. 복잡하고 뒤죽박죽인 스프레드시트 데이터는 작업 능률을 떨어뜨리죠. 하지만 걱정 마세요! 정리 함수 몇 가지만 익히면 누구나 전문가처럼 시트를 깔끔하게 구성하고, 데이터의 가독성을 확 높여 효율적인 분석을 할 수 있습니다. 이 글을 통해 데이터를 구조화하고 정제하는 핵심 함수들을 배워보세요.


노가다 없는 스프레드시트 데이터 정리 핵심 함수 4가지

데이터 구조화의 첫걸음: 정리 함수 심화

방대한 데이터 더미 속에서 우리가 원하는 핵심 정보만을 추출하고 정제하는 것은 모든 데이터 분석의 출발점입니다. 올바르게 정리된 데이터는 분석의 효율성을 극대화하고, 더 정확한 인사이트를 얻는 기반이 됩니다. 다음 함수들은 이 중요한 과정을 빠르고 효과적으로 수행할 수 있도록 돕는 필수 도구입니다.

"데이터 정리의 90%는 불필요한 데이터를 제거하고, 나머지 10%는 올바른 형식으로 만드는 것입니다."

1. 중복 제거: UNIQUE 함수

수많은 데이터 속에서 고유한 값만을 추출하는 가장 강력하고 간단한 방법입니다. 불필요한 중복을 제거하여 데이터의 본질을 파악할 수 있게 해줍니다.

예시 1: A열의 고유한 제품명 예시 2: A, B열 조합의 고유한 값 예시 3: A열의 고유한 값, 정확히 일치하는 행
=UNIQUE(A2:A10) =UNIQUE(A2:B10) =UNIQUE(A2:A10,,TRUE)
본론1(h3가 3개 있는 상태) 이미지 1

2. 데이터 정렬: SORT 함수

데이터를 오름차순이나 내림차순으로 정렬하면 가독성이 높아질 뿐만 아니라, 특정 기준에 따라 데이터를 쉽게 분석할 수 있는 기반을 마련해줍니다.

예시 1: A열을 오름차순으로 예시 2: A,B열을 B열 기준으로 내림차순 예시 3: A,B열을 A열 오름차순, B열 내림차순
=SORT(A2:A10) =SORT(A2:B10, 2, FALSE) =SORT(A2:B10, {1,2}, {TRUE,FALSE})

3. 공백 및 불필요한 문자 제거: TRIM & CLEAN 함수

데이터 입력 시 종종 발생하는 숨은 공백이나 인쇄 불가 문자는 오류의 원인이 될 수 있습니다. 이 함수들을 사용하여 텍스트 데이터를 깨끗하게 정돈하고, 정확한 계산과 비교가 가능하도록 만들어 줍니다.

예시 1: 앞뒤 공백 제거 예시 2: 중간 공백 1개로 정리 예시 3: 인쇄 불가 문자 제거
=TRIM(" Hello World ") =TRIM("Hello World") =CLEAN(A1)

이 함수들 외에 더 많은 함수가 궁금하신가요?

더 많은 함수 알아보기

시트 통합과 고급 데이터 정제

데이터를 구조화하는 것은 단순히 정렬하고 정리하는 것을 넘어, 여러 데이터를 하나로 합치거나 특정 조건에 맞춰 필요한 정보만 추출하는 고급 작업까지 포함합니다. 이는 더 깊이 있는 분석을 가능하게 하고, 여러 시트에 흩어져 있던 데이터들을 한곳에 모아 관리 효율을 극대화합니다. 본 섹션에서는 강력한 데이터 추출 및 정리 함수를 통해 시트 작업을 한 단계 업그레이드하는 방법을 소개합니다.

4. 강력한 데이터 추출기: QUERY 함수

QUERY 함수는 스프레드시트의 엑기스 같은 존재입니다. 이 함수는 SQL(Structured Query Language)과 유사한 문법을 사용해 마치 데이터베이스를 다루듯 데이터를 자유자재로 다룰 수 있게 해줍니다. 특정 조건을 만족하는 행만 추출하거나, 원하는 열만 선택하고, 심지어는 필터링과 정렬을 한 번에 처리할 수 있습니다. 예를 들어, 특정 상품의 판매량이 100개를 넘는 데이터만 골라내거나, 특정 기간 동안의 매출액을 합산하여 보여주는 것도 가능하죠. 복잡한 필터와 함수를 여러 개 조합할 필요 없이, QUERY 하나로 대부분의 데이터 분석 준비를 끝낼 수 있습니다.

QUERY 함수 활용 팁

예제 1: 조건부 데이터 추출

특정 기간의 매출 데이터만 골라내기

A B C
날짜 상품명 매출액
1/1 A상품 50,000
1/2 B상품 150,000
1/3 A상품 80,000
수식: =QUERY(A2:C4, "select A, B where C > 100000")
결과:
날짜상품명
1/2B상품
예제 2: 그룹별 요약

상품별 총 매출액 합산

수식: =QUERY(A2:C4, "select B, sum(C) group by B")
결과:
상품명sum(매출액)
A상품130,000
B상품150,000
예제 3: 정렬 및 제한

매출액 상위 2개 상품 추출

수식: =QUERY(A2:C4, "select B, C order by C desc limit 1")
결과:
상품명매출액
B상품150,000

주의사항: QUERY 함수는 문자열 비교 시 따옴표를, 숫자 비교 시 따옴표 없이 사용해야 합니다. 또한, SQL 문법을 정확히 지켜야 오류가 발생하지 않습니다.


관련 함수: FILTER, SORT, GROUPBY 함수를 조합하여 QUERY와 유사한 결과를 얻을 수 있지만, QUERY가 훨씬 간결하고 강력합니다.

실무 활용 팁: 복잡한 데이터 분석 보고서를 만들 때, 원본 시트는 그대로 두고 QUERY 함수를 사용해 별도의 시트에 필요한 정보만 추출하여 사용하면 원본 데이터를 훼손할 염려 없이 안전하게 작업할 수 있습니다.

5. 여러 시트 한 번에 합치기: VSTACK 함수

VSTACK 함수는 여러 개의 시트나 범위에 흩어져 있는 데이터를 한 곳에 모아주는 매우 유용한 함수입니다. 예를 들어, 월별 판매량을 기록한 시트가 여러 개 있을 때, 이들을 하나로 합쳐서 전체 연간 데이터를 손쉽게 만들 수 있습니다. 데이터 범위를 쉼표(,)로 구분하여 VSTACK 함수에 넣어주기만 하면, 모든 데이터가 수직으로 쌓여 하나의 깔끔한 표로 나타나죠. 일일이 복사해서 붙여넣을 필요 없이, 함수 하나로 모든 통합 작업을 끝낼 수 있어 시간과 노력을 크게 절약할 수 있습니다.

VSTACK 함수 활용 팁

예제 1: 단순 합치기

팀별 분기 보고서 통합

시트1 시트2
데이터1 데이터3
데이터2 데이터4
수식: =VSTACK(Sheet1!A1:A2, Sheet2!A1:A2)
결과:
데이터1
데이터2
데이터3
데이터4
예제 2: VSTACK과 UNIQUE 조합

중복 제거 후 통합 데이터 생성

수식: =UNIQUE(VSTACK(A1:A5, B1:B5))
결과:
값1
값2
예제 3: VSTACK과 SORT 조합

통합 후 특정 열 기준으로 정렬

수식: =SORT(VSTACK(A1:B5, C1:D5), 2, TRUE)
결과:
데이터값1
데이터값2

주의사항: VSTACK으로 합칠 범위의 열 개수가 서로 다르면 오류가 발생할 수 있습니다. 각 범위의 열 개수를 일치시켜야 합니다.


관련 함수: 데이터를 수평으로 합칠 때는 HSTACK 함수를 사용할 수 있으며, 특정 조건에 따라 데이터를 합칠 때는 FILTERVSTACK을 함께 활용할 수 있습니다.

실무 활용 팁: 매월 생성되는 보고서 데이터를 하나의 마스터 시트로 자동 통합하는 대시보드를 만들 때 VSTACK 함수를 유용하게 활용할 수 있습니다.


마무리: 체계적인 데이터 관리의 시작

지금까지 살펴본 함수들은 단순히 데이터를 효율적으로 만드는 것을 넘어, 복잡한 시트를 깔끔하게 정리하는 데에 결정적인 역할을 합니다. 특히, `TRIM`, `CLEAN`, `PROPER` 같은 정리 함수들을 활용하면, 텍스트 데이터에 숨어있는 공백이나 불필요한 문자를 손쉽게 제거하고 일관성 있게 정렬할 수 있습니다. 이는 스프레드시트 작업을 훨씬 더 효율적으로 만들어 줄 것입니다.

결론 이미지 1

이처럼 강력한 함수들을 활용하면, 복잡하고 지저분해 보였던 데이터도 누구나 손쉽게 정리하고 분석할 수 있는 형태로 변환할 수 있습니다. 체계적인 데이터 관리의 첫걸음은 바로 이러한 작은 정리부터 시작됩니다. 오늘부터 이 함수들을 활용해 데이터 관리를 시작해 보세요!


자주 묻는 질문

Q1: 위 함수들은 어떤 스프레드시트에서 사용할 수 있으며, 어떤 차이가 있나요?

주로 Google Sheets에서 가장 강력하고 유연하게 사용할 수 있습니다. 특히 QUERYIMPORTRANGE와 같은 함수는 Google Sheets의 고유한 강점입니다. 반면, Microsoft Excel의 경우에도 대부분의 함수가 존재하지만, 사용법이나 기능에 약간의 차이가 있습니다. 예를 들어, UNIQUEExcel 365 버전부터 지원하며, 이전 버전에서는 FILTER와 SORT를 조합하여 비슷한 효과를 낼 수 있습니다.

💡 시트 호환성 팁

Google Sheets에서 작업한 파일을 Excel로 변환할 경우, QUERY나 ARRAYFORMULA 같은 함수는 호환되지 않아 오류가 발생할 수 있습니다. 중요한 작업은 한 프로그램에서 일관되게 진행하는 것이 좋습니다.

Q2: 함수를 사용했는데 오류가 발생해요. 어떻게 해결해야 할까요?

대부분의 오류는 아래와 같은 원인으로 발생합니다. 문제를 해결하기 위해 아래 체크리스트를 확인해보세요.

  • 데이터 범위 오류: 함수에 지정한 셀 범위(예: A1:B100)가 실제 데이터의 범위와 맞지 않는 경우.
  • 인자(parameter) 오류: 함수에 입력해야 할 인자의 순서나 개수가 잘못된 경우. 특히 VLOOKUP이나 INDEX MATCH 함수에서 자주 발생합니다.
  • 데이터 유형 오류: TRIM, CLEAN 함수는 텍스트에만 적용되는데 숫자나 날짜 데이터에 사용한 경우.
  • 권한 오류: IMPORTRANGE 함수 사용 시, 가져오려는 다른 스프레드시트에 접근 권한이 없는 경우.

Q3: 시트 정리 함수를 효율적으로 활용하는 팁이 있나요?

입력 데이터로 제공된 '깔끔한 시트 구성에 도움 되는 정리 함수'들은 단독으로 사용하기보다 다른 함수와 결합할 때 그 진가를 발휘합니다.

예를 들어, TRIMCLEAN 함수를 UNIQUE 함수와 함께 사용하면, 중복 데이터를 제거하기 전에 불필요한 공백이나 제어 문자를 사전에 제거하여 더 정확한 고유값 목록을 얻을 수 있습니다. 또한, SORTFILTER 함수를 함께 사용해 특정 조건에 맞는 데이터를 정렬하여 볼 수 있습니다.

데이터 분석을 시작하기 전에 이 함수들을 활용해 데이터를 '전처리'하는 습관을 들이면 이후 분석 작업이 훨씬 수월해집니다.

Q4: QUERY 함수는 어떻게 활용할 수 있나요?

QUERY 함수는 Google Sheets의 꽃이라고 불릴 만큼 강력한 기능입니다. 이 함수는 마치 스프레드시트 안에서 SQL 데이터베이스를 다루는 것과 유사합니다.

  1. 기본 필터링 및 선택: 특정 열만 선택하거나, 특정 조건에 맞는 행만 필터링할 수 있습니다. 예를 들어, `SELECT A, B WHERE C > 10`과 같이 사용할 수 있습니다.
  2. 데이터 집계: `GROUP BY` 구문을 사용해 데이터를 그룹별로 묶고, `COUNT`, `SUM`, `AVG` 등과 같은 함수로 집계할 수 있습니다.
  3. 정렬: `ORDER BY` 구문을 사용해 원하는 열을 기준으로 오름차순 또는 내림차순 정렬할 수 있습니다.
  4. 피벗 테이블 생성: `PIVOT` 구문을 활용하여 손쉽게 피벗 테이블을 만들 수 있습니다.

더 자세한 학습을 위해서는 Google Sheets 공식 문서나 다양한 온라인 커뮤니티의 튜토리얼을 참고하는 것을 추천합니다.