CS Repository/기초 통계학 3

[혼자 공부하는 데이터 분석] 데이터 분석 기초를 시작하며

해당 챕터에서는 첫 장인만큼, 데이터 분석의 정의와, 코랩과 판다스의 기초적인 사용법을 알아보도록 하자.데이터 분석이란?“데이터 분석”은 명확히 정의하기 어렵다.데이터 분석과 관련된 용어는 다음과 같은 것들이 있다.데이터 과학데이터 분석머신러닝통계학데이터 마이닝각각의 정확한 의미와 범주를 파악해보자.데이터 분석은 데이터 과학의 한 종류로, 그 외 다른 데이터 과학의 구성요소는 다음과 같은 것들이 있다.그렇다면 데이터 과학의 의미는 뭘까?Quora에 존재하는 질문에서 데이터 과학자 Ji Li가 적은 답변은 데이터 과학을 다음과 같이 정의하고 있다.데이터 세계와 비즈니스 세계를 잇는 다리데이터를 기반으로 비즈니스 결정을 하는 방법이 책의 저자는 데이터 분석과 데이터 과학을 이렇게 정의한다.데이터 분석올바른 ..

공공 데이터셋 탐색 사이트

국내 사이트공공데이터포털www.data.go.kr행안부에서 운영하는 공공 데이터 통합 제공 시스템공공데이터를 찾고싶을 때 사용하자.통합 데이터 지도www.bigdata-map.kr과기정통부와 한국지능정보사회진흥원에서 운영중인 여러 빅 데이터 플랫폼의 데이터를 한곳에서 검색할 수 있는 서비스AI허브aihub.or.kr한국지능정보사회진흥원에서 운영하는 AI 학습용 데이터 제공 사이트국가통계포털kosis.kr통계청이 제공하는 대표적인 통계 포털 사이트해외 사이트구글 데이터 셋 검색datasetsearch.research.google.com무료로 사용할 수 있는 데이터를 검색할 수 있는 검색 엔진캐글 데이터셋www.kaggle.com/datasets캐글에서 진행된 경진 대회에서 사용된 데이터셋허깅페이스 데이터셋..

[개발자를 위한 통계학 찍먹하기] 0편 - 동기

서론나는 그동안 포트폴리오에서 발견되는 성능 테스트에 대한 회의론을 갖고 있었다.정량적 데이터에 의한 동기만으로 성능 테스트가 수행된 경우, 어디서 본 듯한 이유와 어디서 본 듯한 개선, 짜맞춘 의도에 짜맞춘 개선밖에 볼 수 없었고, 정성적 데이터에 의한 동기만으로 성능 테스트를 수행한 경우, 트레이드오프를 고려하지 않은 단순한 오버엔지니어링으로밖에 보이지 않았다.따라서, 해당 성능 테스트에서 작성자들의 문제 해결 능력을 이해하기가 어려웠다.하지만, 아무것도 안하는 것보다는 낫다는 걸 나 스스로도 인정하고 있긴 했다.그래서, “할거면, 논리적으로 하자.” 라는 결론에 도달하게 되었다. 참고: 정량적 데이터 vs 정성적 데이터 정량적 VS 정성적 데이터 차이 파악하고 균형 있는 설문조사 실시하기정량적 데이..