반응형

👨‍💻Data Science

    EDA란?

    EDA가 뭔가요❓ 며칠전 EDA가 무엇인가? 라는 질문을 들었다 기계적으로 결측치나 분포등을 파악해보고 이를 활용하는 것이다 대답을 하였는데 문득 EDA란 진짜 무엇일까라는 생각을 갖게되었다. 단순히 파이썬이나 R을 통해 결측치를 파악하고 화려하고 예쁜 데이터 분포 그래프를 그려보는게 EDA의 목적일까? 왜 하나요❓ 근본적인 생각으로 돌아가서 과연 EDA가 대체 무엇이고 왜 하는지부터 생각해보면 좋을 것 같다 EDA는 Exploratory Data Analysis(탐색적 데이터 분석)의 약자로 데이터를 이해하려는 과정이다 이과정 속에서는 주어진 수 많은 데이터에서 실제로 데이터가 어떻게 생겼는지? 주어진 데이터 타입의 특성은 무엇인지? 메타데이터의 분포는 어떻게 되는지? 그게 과연 어떤 특징과 어떤 의미..

    데이터 시각화(Data Visualization)

    Intro 길게 나열된 줄글이나 엄청난 정보량이 담긴 표를 한 번에 보기는 쉽지 않다, 아니 어렵다 이 때 한 눈에 보기 편하게 시각화를 시킨다면 데이터의 특성을 파악하는데 큰 도움이 된다 시각화 Q. 시각화란 무엇일까? 데이터 시각화란 데이터를 그래픽 요소로 매핑하여 시각적으로 표현하는 것을 말한다 그러나 단순히 그래픽 요소로 매핑만 한다고 하면 그다지 좋은 시각화 방법이 아닐 것 이다 당연히 여러가지 요소를 고려하여 적절한 시각화를 해야한다, 크게 아래와 같은 내용들을 생각해 볼 수 있다 왜 시각화 하는지? 가장 근본적인 이유이다 어떤 목적하에 시각화를 하는지 생각해야 한다 누가 볼 것 인지? 나만 볼 수 있게 간단히 정리된 도표일 수도, 고객을 설득하기 위한 지표로 사용될 수도있다. 누구를 대상으로..