'Python으로 csv파일 데이터 시각화하기!'

2022. 7. 3. 21:02'Python 기반 데이터 분석'

- CSV 파일로 시각화 해보기 -

데이터를 시각화하는 기본적인 방법은 네 가지가 있지만 이번 포스팅은 matplotlib을 이용한 선그래프를 그려보겠습니다.

  • 선그래프
  • 막대그래프
  • 히스토그램
  • 산점도

 

파일 종류(exls, csv, etc..)는 다양하지만 가공돼있는 데이터를 이용해 쉽게 시각화하기 위해 CSV 파일을 이용하겠습니다.

  

먼저 예제로 사용할 CSV 파일부터 준비합시다.

 

005930.KS.csv
0.02MB

 

위 데이터는 야후파이낸스에서 제공받은 삼성전자 주가 차트입니다.

다음 글에는 오픈 API로 CSV 파일 받는법도 포스팅하겠습니다.

 

파일을 받으셨다면 파이썬이 깔려있는 파일 경로에 담아주시기 바랍니다.

 

자 그럼 본격적으로 데이터 시각화를 시작해보겠습니다.

 

먼저 시각화에 필요한 패키지 부터 셋팅합니다.

 

pandas는 데이터프레임을 다룰 수 있는 라이브러리이고 데이터를 가공하고 시각화하기 위해 필수적 요소입니다.

그 다음은 matplotlib 쿼리문을 import하시면 됩니다. 주로 축약해서 plt로 나타냅니다.

마지막으로 이 부분을 주의해주셔야 하는데

만약 그래프 제목이나 내용을 한글 폰트로 만들고 싶으신 분들은 이 라이브러리를 꼭 입력해야 합니다.

rcParams 라이브러리는 그래프를 그리기 위한 것으로 Runtime Configuration Parameters,

줄여서 rcParams라는 딕셔너리의 값을 이용해서 그립니다.

 

- rcParams 쓰임새 -

 

그래서 한글폰트가 깨지는 현상을 방지하기 위해 위와 같이 폰트를 설정해주면 됩니다.

폰트 종류는 기호대로 고르시면 되고 

내장되어있는 폰트를 확인하고 싶다면 

이렇게 찾아주시면 됩니다!

저는 가장 보편적인 '맑음고딕'을 사용했습니다.

 

먼저 위에 올려둔 데이터파일을 읽어오면 이렇게 데이터프레임이 형성됩니다!

칼럼명을 보시면 영어로 되어있는데

이 칼럼을 한글로 바꾸겠습니다. (영어로 하셔도 됩니다~)

이런식으로 칼럼명을 설정하시면 됩니다.

 

다음은 가장 중요한 그래프 구성 및 생성 부분입니다!!

사진 속 주석을 보시면 해당 라이브러리 기능을 알 수 있습니다.

이런식으로 그래프를 구성하고 불러내면

이렇게 깔끔한 그래프가 완성됩니다!! 

 

밑에 날짜가 살짝 깨졌는데 이 문제는 x축의 파라미터를 수정하시면 됩니다!!

 

그럼 다음 포스팅에서 뵙겠습니다!!