제목

공지사항

WE DESIGN BETTER HR SERVICE PLATFORM

공지사항

데이터 시각화 시대, 무엇이 어떻게 중요할까?

  • 더나은인재들
  • 2021-02-15 15:33:08
  • hit69896
  • vote13
  • 61.78.78.44

 

이터 시각화란 무엇?

 

데이터 시각화는 데이터를 표시하기 위해 그래픽 디스플레이를 그리는 것을 의미합니다. 산점도처럼 모든 데이터 점이 그려지는 경우도 있고 히스토그램처럼 통계 요약이 표시될 수도 있습니다. 디스플레이는 주로 기술적이며, ‘미가공’ 데이터와 간단한 요약에 초점을 맞추었습니다. 변환된 데이터의 표시를 포함할 수 있으며, 때로는 복잡한 변환을 기반으로 할 수도 있습니다. 한 사람의 통계는 다른 사람의 원시 데이터일 수 있습니다. 그래픽 작업 시 다른 측면과 마찬가지로, 기본 개념과 용어의 합의된 기반을 갖는 것이 유용할 것입니다. 주요 목표는 데이터 및 통계를 시각화하고 디스플레이를 해석하여 정보를 얻는 것입니다.

데이터 시각화는 데이터 정리, 데이터 구조 탐색, 특이점 및 비정상 그룹 탐지, 추세 및 클러스터 식별, 로컬 패턴 찾기, 모델링 출력 평가 및 결과 표시에 유용합니다. 탐색적 데이터 분석 및 데이터 마이닝은 데이터 품질을 확인하고 분석가들이 이전의 데이터 구조와 기능에 익숙해지도록 돕는 데 필수적입니다. 이것은 교과서에서는 평가되지 않지만 실제 조사에서는 항상 존재하는 데이터 분석의 일부입니다. 예를 들어, 마라톤 결승 시간 분포의 한쪽 정점을 보세요.

그래픽은 통계와 모형이 놓칠 수 있는 데이터 특징(예: 데이터의 비정상적인 분포, 로컬 패턴, 군집화, 간격, 결과값, 측정값, 반올림 또는 고산의 증거, 암시적 경계, 특이점 등)을 보여줍니다. 그래픽은 연구를 자극하고 아이디어를 제안하는 질문을 제기합니다. 쉬울 것 같아요. 사실, 그래픽을 해석하는 것은 잠재적으로 흥미로운 특징과 과잉 해석의 위험으로부터 보호하기 위한 통계적 명사들을 식별하기 위한 경험이 필요합니다. 그래픽이 모델 결과를 확인하는 데 유용하듯이 모델은 그래픽에서 파생된 아이디어를 확인하는 데 유용합니다.

이 개요는 정적 그래픽에 초점을 맞춥니다. 동적 그래픽과 특히 대화형 그래픽은 개발의 흥미로운 단계에 있으며 추가할 것이 많습니다. 그들은 그들만의 물건을 요구합니다. 뛰어난 예로는 세계 인구를 3-D로 보여주는 역동적인 그래픽인 휴먼 지형과 대화형 이름 보이어가 있습니다.

 

‘한 장의 사진이 천 마디의 단어보다

가치있다’

유명한 속담은 그들 자신의 삶을 발전시키는 방법을 가지고 있습니다. 그림은 천 개의 단어를 대신할 수 없습니다. 천 개의 단어가 필요합니다. 데이터 시각화를 위해서는 컨텍스트, 데이터의 출처, 데이터의 수집 방법 및 이유, 더 많은 정보를 수집할 수 있는지 여부, 디스플레이를 그리는 이유, 필요한 배경 지식을 가진 사람들이 어떻게 해석할 수 있는지 알아야 합니다.

텍스트와 그래픽의 잠재적인 시너지는 자신의 그래픽을 통해 이야기하고 다른 사람들에게 설명함으로써 이해할 수 있습니다. 왜 그런 그림을 그렸습니까? 어떻게 그렸습니까? 무엇이 보이나요? 흥미로운 패턴들이 있나요? 무엇이 변화되고 개선될 수 있을까요? 어떤 다른 그래픽을 그릴 수 있습니까? 결론은 어떻게 확인할 수 있습니까? 그래픽에 대해 더 많이 이야기하고 그래픽에 덜 의존해야 합니다.

본인이 직접 그려보지 않은 그래픽에 대해서는 답변하기가 더 어려울 수 있지만 동일한 유형의 질문이 여전히 관련이 있습니다.

 

‘프레젠테이션 및 탐색 그래픽’

 

프레젠테이션과 탐색 그래픽은 상당히 다른 동물입니다. 결과를 표시할 때 하나의 그래픽만 사용할 수 있는 공간이 있을 수 있으며, 얼마나 많은 사람들이 볼 수 있는지 알 수 없습니다. 만약 그것이 신문이나 텔레비전이

나 웹에 나온다면, 여러분의 청중은 수백만 명의 사람들이 될 수 있습니다. 그래픽은 효과적인 설명 텍스트와 함께 잘 설계되고 잘 그려져야 합니다. 반면에, 만약 여러분이 데이터를 탐색하고 있다면, 여러분은 많은 그래픽이 필요하고 그것들은 한 사람, 즉 여러분 자신을 위한 것입니다. 개별 그래픽이 완벽

할 필요는 없지만 대체 보기와 추가 정보를 제공해야 합니다. 프레젠테이션 그래픽은 알려진 정보를 전달하는 데 사용되며 종종 주의를 끌도록 설계되었습니다. 탐색 그래픽은 새로운 정보를 찾는 데 사용되며 정보에 주의를 기울여야 합니다.

 

게시된 그래픽은 프레젠테이션용 그래픽인 경향이 있습니다. 부분적으로 출판을 위한 그래픽이며 도움이 될 수도 있고 그렇지 않을 수도 있는 수백 개의 빠른 그래픽을 보고 싶어하는 사람이 없기 때문입니다. 그것은 오히려 수학적인 증명과 같습니다: 기사들은 전에 왔던 낙서된 노트와 무작위적인 아이디어가 아니라 우아하고 간결한 최종 버전을 포함하고 있습니다. 최근 몇 년 동안 영국 각료들의 사임을 보여주기 위해 이 놀라운 전시회가 선정되기 전에 얼마나 많은 그래픽이 그려졌을까요?

탐색 그래픽은 이제 그래픽을 그리거나 다시 그리기가 얼마나 쉬운지 활용합니다. 디스플레이를 인쇄해야 하는 것조차 포함하여 느리고 지루한 공정이었던 것이 빠르고 유연해졌습니다. 동시에 새로운 추가 기술이 필요합니다. 수많은 그래픽 중에서 흥미로운 기능을 식별하고 더 자세히 확인하는 방법은 단순히 많은 그래픽을 그리는 것이 아니라 해석 능력과 어떤 그래픽이 어떤 종류의 정보를 제공하는지 이해하는 것이 필요합니다. 표시되는 변수, 그래픽 유형, 그래픽의 크기 및 가로 세로 비율, 사용된 색상과 기호, 척도 및 한계, 범주형 변수의 순서, 다변량 표시의 변수 순서 등 매우 다양합니다. 다양한 그래픽을 현명하게 선택하고, 통찰력을 얻는 방법을 이해하는 것은 사소한 일이 아니다. 안내하고 기반으로 삼아야 할 데이터 시각화 이론의 부족이 핵심 문제입니다.

 

‘데이터 시각화가 더욱 중요해지고 있다’

 

더 나은 하드웨어는 더 정밀한 복제, 더 나은 색상(알파 블렌딩 포함), 더 빠른 드로잉을 의미합니다. 더 나은 소프트웨어는 더 쉽고 유연한 도면, 일관된 테마 및 더 높은 표준을 의미합니다. 컴퓨터 과학자들은 기술적인 측면과 새로운 접근 방식을 도입하는데 있어서 훨씬 더 많이 관여하게 되었습니다. 특히 윌킨슨의 Grammar of Graphics(2005)와 Hadley Wickham이 R package ggplot2(Wickham, 2016)에 구현한 덕분에 그래픽 이론 개발에 진전이 있었습니다. 색과 지각의 문제에 대한 더 나은 이해와 지속적인 연구가 있습니다. 병렬 좌표도(예: Theus, 2015) 및 모자이크도(예: Unwin, 2015)와 같이 거의 사용되지 않고 그리기 어려운 그래픽이 개선되고 개발되었습니다. 훨씬 더 큰 데이터 세트를 분석 및 시각화할 수 있으며 그래픽은 복잡한 모델의 장단점을 진단하는 데 중요한 역할을 할 수 있습니다. 데이터 시각화는 과학 출판물, 신문, TV, 웹 등 어디에서나 찾아볼 수 있습니다. 그래픽에 대해 토론하고 토론하는 많은 웹 페이지가 있습니다. 이것은 심지어 20년 전의 상황에 비해 큰 발전입니다.

 

‘데이터 시각화 연구’

 

데이터 시각화 분야에서 향후 연구할 수 있는 좋은 기회가 있습니다. 여러 그래픽 중에서 그릴 수 있는 그래픽을 결정하는 방법에 대한 원칙이 필요합니다. 단 하나의 ‘최적’ 그래픽을 그리는 것이 문제가 아닙니다. 만약 그런 것이 존재한다면, 그것은 더 많은 정보를 제공할 그래픽 그룹을 선택하는 문제입니다. 이것은 복잡한 물체의 사진을 찍는 것과 같으며, 한 장으로는 충분하지 않을 것이고, 가능한 모든 각도와 거리에서 사진을 찍는 것은 너무 많을 것입니다.

정적 앙상블이든 대화식 디스플레이든 그래픽을 더 나은 소프트웨어가 필요한 만큼 그래픽을 조합하고 연결해야 합니다. 예를 들어 작은 배수와 면(다른 변수에 동일한 형식의 여러 그래픽을 표시)을 사용하여 효과적인 비교를 위한 정렬 및 공통 스케일링의 값이 이 중 하나입니다.

 

출판된 그래픽은 때때로 매력적이고 아름답게 제작됩니다. 내용이 항상 일치하는 것은 아닙니다. 그것은 아마도 작가와 출판업자들이 그래픽이 어떤 세부적으로 검토될 것으로 기대하지 않기 때문일 것입니다. 레이아웃의 균형을 맞추고 더 보기 좋게 보이도록 그림으로 추가할 수 있습니다. 적절한 사진, 만화 또는 지도가 없는 경우, 다채로운 통계 그래픽을 사용할 수 있습니다. 저는 사람들이 숫자를 이해하지 못하고 학교에서 수학을 잘 못한다고 말하는 것을 여러 번 들었습니다. 아무도 제게 그래픽을 논쟁의 중심이 아니라 삽화로 간주하기 때문에 이해하지 못한다고 말한 적이 없습니다. 연구자와 독자를 그래픽의 가치에 대해 교육하는 데 있어 해야 할 일이 있습니다.

 

새롭고 혁신적인 그래픽에 대한 연구는 흥미롭고 생산적입니다. 동시에, 잘 알려진 그리고 잘 이해된 그래픽을 최대한 활용하는 것이 필수적입니다. 친숙함을 희생하면서 새로움을 강조할 위험이 있습니다. 새롭고 혁신적인 그래픽을 해석하려면 지침과 경험이 필요합니다. 그들의 디자이너들은 그것들을 개발하는 데 많은 시간을 소비했고 그들에게 명백한 것은 모든 사람들에게 명백해야 한다고 합리적으로 믿습니다. 보잘것없는 산점도를 생각해 보세요. 산점도가 가장 중요한 통계 그래픽 중 하나이긴 하지만 미디어에 나타난 것은 최근 몇 년 동안입니다. 만약 여러분이 전에 한 번도 본 적이 없다면, 그들은 더 위협적일 수 있습니다. 여러분이 ‘분명히 알 수 있다’ 혹은 ‘그것을 쉽게 알 수 있다…’라고 들었을 때, 우리는 우리의 독자들을 우리와 함께 데리고 다닐 수 있도록 친숙한 것을 구축해야 합니다.

 

더나은인재교육컨설팅
문의 : 02-545-3487
홈페이지 
http://www.thehrd.kr/

게시글 공유 URL복사
댓글[0]

열기 닫기

더나은인재들 주식회사 서울 강남구 언주로 804 (신사동) 3층 302호 더나은인재들

대표: 최유연 통신판매 신고번호: 제 2019-서울강남-02923 호 사업자등록번호: 396-86-01447

TEL. 02-518-3488 FAX. 02-518 -3489 E-mail. betterpeople@thehrd.kr