Data Analysis with Python

Plot이란? plot의 종류

코밥 2019. 9. 29. 17:29

안녕하세요! 오랫만에 하는 포스팅입니다. 

 

plot?

 데이터 집합을 나타내기 위한 기술이라고 정의되어 있습니다~ 

파이썬에서는 matplotlib의 pyplot과 pandas, seaborn, ggplot라이브러리를 사용해 데이터를 시각화합니다.

이때 plot이란 말이 주구장창 쓰이므로 알아두시면 좋습니다.

 

더 자세한 내용이 궁금하신 분들은 아래의 위키피디아를 참조하세요~

https://en.wikipedia.org/wiki/Plot_(graphics)

 

Plot (graphics) - Wikipedia

A plot is a graphical technique for representing a data set, usually as a graph showing the relationship between two or more variables. The plot can be drawn by hand or by a mechanical or electronic plotter. Graphs are a visual representation of the relati

en.wikipedia.org

 

1. 막대 그래프(bar plot)

막대 그래프는 범주형 데이터를 요약하는데 사용합니다.

x축은 소비자의 이름이고 y축은 각각의 소비자가 구매한 구매량을 표시합니다.

MNO가 제일 많이 구입했네요 ㅎㅎ

 

2. 히스토그램(Histogram)

히스토그램은 수치형 데이터의 분포를 나타낼때 쓰이는데요~

위의 데이터는 random 함수를 이용해 만든 그래프입니다.

초록색은 100근처에서 생성하도록 했고, 주황색 그래프는 130 근처에서 생성하도록 했습니다.

random 함수는 가우시안 분포를 그립니다! 전압에서 발생하는 잡음값을 이용했기 때문이에요.

 

유명한 잡음이죠.. 백색 잡음 - ㅇ -;;

 

3. 선 그래프(Line plot)

선 그래프는 수치의 변화를 선으로 이어그려줍니다. 

 

4. 산점도(scatter plot)

산점도는 두 변수간의 관계를 표현할때 유용합니다.

키와 몸무게, 수요와 공급 등 두 변수가 양의 상관관계인지, 음의 상관관계인지 알 수 있어요!

위의 산점도는 x와 y간의 상관관계를 표현했는데요.

이 산점도 위에 선이 하나씩 있죠! 이 선은 회귀선(regression line)인데요.

이렇게 회귀선을 그리면 하나의 변수 값에 따라 다른 변수값이 어떻게 변하는지를 예측할 수 있습니다.