본문 바로가기

데이터 프로젝트는 어떻게 포트폴리오가 될까? 질문, 분석, 결과물로 정리하는 법

collie@ 2026. 7. 2.

데이터 프로젝트가 포트폴리오가 되는 순간은 그래프를 만들었을 때가 아닙니다. 누군가가 그 글을 읽고 “이 학생은 질문을 세우고, 데이터를 다루고, 결론의 한계까지 알고 있구나”라고 느낄 때입니다.

그래서 포트폴리오는 결과물 묶음이 아니라 사고 과정의 정리본에 가깝습니다.

한 장짜리 포트폴리오 구조

데이터 프로젝트를 정리할 때는 아래 순서로 한 장을 만든다고 생각하면 쉽습니다.

위치 들어갈 내용 예시 문장
맨 위 질문 청소년 인구가 많은 지역일수록 도서관 접근성이 좋을까?
중간 1 데이터 KOSIS 인구 자료와 공공도서관 자료를 사용했다.
중간 2 분석 지역별 인구와 도서관 수를 비교하고 산점도를 그렸다.
하단 결론과 한계 경향은 보였지만 교통 접근성은 추가 확인이 필요하다.

Before와 After

아래 두 문장을 비교해보면 차이가 분명합니다.

Before: 공공데이터를 활용해 지역별 도서관 수를 분석했습니다.

After: 청소년 인구가 많은 지역일수록 도서관 접근성이 좋은지 확인하기 위해, KOSIS 청소년 인구 자료와 공공도서관 데이터를 비교했습니다. 도서관 수만으로 접근성을 단정할 수 없어 교통 시간과 면적은 추가 변수로 남겼습니다.

두 문장 모두 같은 활동을 말하지만, 두 번째 문장은 질문, 데이터, 분석 기준, 한계가 보입니다. 이 차이가 포트폴리오의 신뢰를 만듭니다.

과정 기록에서 빠지면 아쉬운 것

포트폴리오에는 완성된 그래프만 넣지 말고, 분석 과정도 짧게 남겨야 합니다.

  • 데이터 출처와 수집 날짜
  • 사용한 컬럼과 제외한 컬럼
  • 결측치나 이상치를 처리한 기준
  • 그래프 축과 단위
  • 결론을 단정하지 않은 이유

이런 기록은 화려하지 않지만 독자가 분석을 믿게 만드는 근거가 됩니다.

결과물은 여러 개여도 된다

데이터 프로젝트 결과물은 꼭 머신러닝 모델 하나일 필요가 없습니다. 오히려 입문 단계에서는 핵심 그래프 3개, 비교표 1개, 분석 요약 글 1편, 간단한 대시보드가 더 읽기 좋을 수 있습니다.

다만 결과물이 많아도 질문에 답하지 못하면 독자는 금방 길을 잃습니다. 그래프 개수보다 중요한 건 처음 세운 질문으로 다시 돌아오는 흐름입니다.

마지막에 넣을 문장

포트폴리오 마지막에는 “그래서 다음에는 무엇을 확인할 것인가?”를 넣어보세요. 예를 들어 “도서관 수만으로 접근성을 판단하기 어렵기 때문에 다음 분석에서는 대중교통 소요 시간과 지역 면적을 함께 보겠다”처럼 쓰면 됩니다.

이 문장은 프로젝트를 약하게 만들지 않습니다. 오히려 데이터를 조심스럽게 해석할 줄 안다는 신호가 됩니다.

댓글