k-Nearest Neighbors

당신은 내가 다음 노트북으로 어느 모델을 구매할 지 예측해 볼 수 있는가? 당신이 나에 대해 아무것도 모른다고 해도, 내 주변 개발자들이 무슨 노트북을 쓰고 있는지를 알고 있다면 내가 무엇을 구매할지도 어느 정도 짐작해 볼 수 있다.

기계학습 개요

introduction to machine-learning

파이썬 내장 변수와 언더바

Python의 내장 변수와 언더바의 불문율을 알아보자.

데이터 다루기

How to handle data

데이터베이스 백업

데이터베이스는 어딘가에 물리적 파일을 저장하고 있으며 SQL 데이터베이스의 경우 SQL문으로 데이터베이스의 복원이 가능하다. 따라서 데이터베이스를 백업하기 위해서는 몇 가지 방법이 있다.

파이썬 웹 스크래핑, 크롤링

Beautifulsoup 라이브러리를 이용해 웹을 스크래핑해보자.

파이썬 sys 모듈, 데이터 읽기 쓰기

파이썬 sys 모듈을 이용하여 시스템 파일과 상호작용하는 프로그램 짜기, 데이터 읽기 쓰기.

iPython 사용 팁

iPython tips

변수 & 함수 이름짓기

다양한 코딩스타일 중 취향에 맞는 녀석을 사용하자.

Python Probability

일정한 조건 아래에서 어떤 사건이나 사상이 일어날 가능성의 정도. 또는 그런 수치. 수학적으로는 1을 넘을 수 없고 음이 될 수도 없다. 확률 1은 항상 일어남을 의미하고, 확률 0은 절대로 일어나지 않음을 의미한다.

Python Hypothesis

통계와 확률 이론을 통해 가설을 검정하고 통계적 추론을 할 수 있다. 가설(hypothesis)이란 '데이터 과학자는 MATLAB보다 R이나 Python을 선호한다.' 등과 같은 주장이며, 데이터 통계에 대한 얘기가 될 수도 있다.

Likelihood(가능도)와 Probability(가능성)

연속사건에서는 특정 사건이 일어날 확률이 전부 0으로 계산되기 때문에 사건들이 일어날 가능성을 비교하는 것이 불가능하며, 가능도라는 개념을 적용해야 이를 비교할 수 있다 .

Python Statistics

통계학은 중요하다. 좋은 데이터 과학자에게 통계학은 뗄레야 뗄 수 없다.

Python 선형대수 입문

Linear algebra is the study of vectors and linear functions

Python Lightning을 이용한 시각화

Lightning을 이용해 그럴싸한 시각화 해보기

Pyplot 시각화

Pyplot을 이용해 간단한 그래프 그리기

안녕 데이터마이닝

거대한 데이터에서 쓸만한 정보를 빼내는 것. (Hand et al) 데이터 마이닝은 탐색과 분석의 과정이다. 다량의 데이터에서 의미있는 패턴과 규칙을 찾는 것이다. (Berry and Linoff) 데이터 마이닝은 저장소에 있는 다량의 데이터를 패턴 인식과 수학-통계적 기술로써 의미있는 상관관계, 패턴과 트렌드를 찾아내는 과정이다.(Gartner Group).

Road to Data Science

공부할 게 너무 많다.

Python 자료형

Python data structures at a glance

정말 훌륭한 파이썬 자료들

파이썬 기초 가이드, 파이썬 히치하이커 가이드, 플라스크 가이드, 장고 가이드, 머신러닝 가이드