빅데이터 분석을 위한 정부 빅데이터 소개!
최근 파이썬을 통해서 빅데이터를 분석하고 시각화 하는 학습을 하고 있습니다. 먼저 공공데이터가 가장 흥미롭습니다. 분석하는 기법과 분석을 위한 Insight만 조금 있다면 다양한 공공데이터를 충분히 활용하여 멋진 데이터 분석을 할 수 있을 것 같아요.
예전에 빅데이터를 제공하는 공공데이터 오픈 포털의 빅데이터에 대하여 제공되는 유형을 간략하게 정리한 적이 있습니다. 아래 포스팅을 참고하시면 좋을 것 같네요.
최근 분석 학습을 해 보면서 제공 리스트만 가지고 정보를 알아보기에는 조금 불편할 것 같아 실제 분석에 사용될 수 있는 제공되는 데이터의 유형을 각 기관별로 조금씩 정리해 보려고 합니다. 우선 한국 소비자원에서 제공하는 빅데이터 유형을 정리해 보려고 합니다.
빅데이터센터
사실 이 빅데이터센터는 제가 최초로 공공데이터 분석과 관련한 학습을 시작하게 된 계기다 되는 사이트 입니다. 다양한 공공데이터를 빅데이터 형식으로 누구나 사용하여 비즈니스를 만들 수 있는 취지에서 국가에서 운영 시작하는 웹이라는 기사를 보고 접하게 되었거든요.
실제로 제공되는 데이터의 수가 방대하기도 하고 제공되는 유형도 많아 조금만 관심있게 보고 공부하면 유의미한 빅데이터 분석 결과를 만들어 볼 수 있는 사이트이기도 합니다. 그 중에서도 일부 제가 조금 살펴봤던 재미있는 빅데이터 유형을 정리해 보았습니다. 아래 데이터를 참고하여 관심있으신 분들은 학습하시는데 도움이 되었으면 하네요.
- 파일데이터 약 34천건 (2020. 05 기준)
: 신용 보증기금_보증비율별 보증부 대출 금리 비교
: 국가보훈처_ 국가보훈처_보훈의료 위탁병원 코로나 119 병원 정보 현황
: 전라북도_대기요염정보(이산화질소, 일산화 탄소)
: 환경부_전기자동차 급속충전기 보급 현황
: 한국토지주택공사_임대주택 단지별 연령대별 성별정보
- 오픈 API 약 6천건 (2020. 05 기준)
: 경기도 유해화학물질 취급 사업장 현황
: 금융위원회_채권권리행사정보
: 금융위원회_단기금융증권발행정보
: 금융위원회_정보공개재산정보
: 충청남도_주요 관광명소
- 표준 데이터 119건 (2020. 05 기준)
: 전국도로안내표지표준데이터
: 전국동물보호센터정보표준데이터
: 전국민박펜션업소표준데이터
: 전국도시공원정보표준데이터
: 전국무인민원발급정보표준데이터
데이터를 분석하는 방법은 다양합니다만 제가 주로 사용하는 방식과 툴은 파이썬이라는 프러그래밍입니다. 빅데이터의 분석 영역에 대한 각광으로 더욱 많은 사람들이 관심을 가지고 있는 프로그램 언어이지요.
저도 안지는 꽤 되었지만 실제로 사용하면서 학습하는 시기는 최근인거 같습니다. 많은 흥미를 가지고 있는 언어입니다. 파이썬의 기본 사용방법에 대해서는 아래 포스팅을 참고하세요. 공부하면서 몇자 적어 보았습니다.
파이썬으로 실제 분석하고 시각화 하는 프로그래밍과 관련한 포스팅은 조금 더 유용한 결과를 분석할 줄 아는 시점에서 하는게 좋을것 같아요. 잘 알지도 못하면서 아는것처럼 포스팅하기에는 부담이 많이 됩니다. 그럼 재밌게들 학습해 보세요~
아 그리고 파이썬은 누구나 사용할 수 있는 무료 프로그램언어입니다. 빅데이터에 특화되어 있으니 알고 빅데이터 분석에 참여하시면 좋습니다
'IT > 빅데이터' 카테고리의 다른 글
빅데이터 분석 - 기상관측이래 서울이 가장 더웠던 날과 온도는? (61) | 2020.10.17 |
---|---|
'티맵 미식로드'사업으로 본 빅데이터 분석 방향! (28) | 2020.09.19 |
빅데이터 분석을 위한 데이터스토어 빅데이터 (18) | 2020.09.17 |
빅데이터분석을 위한 통계청 빅데이터 (17) | 2020.09.16 |
빅데이터 분석을 위한 경기데이터드림 빅데이터 (27) | 2020.09.15 |