저는요

고양이가 냐, 하고 울면 저는 녜 하고 울래요. 반가워요 :3

  • 저는 기술과 저의 능력으로 사람들로 하여금 정보에 대한 장벽을 낮추는 일을 좋아해요.
  • 배우고, 꿈꾸고, 오픈소스에 기여하는 걸 좋아해요.
  • 뭐든지 기록하고, 이름을 지어요!

e-mail로 연락해주세요 : iam@nyanye.com


Nyanye (2018년 9월)

고등학생 때부터 선망하던 롤모델들을 쫓아 데이터 과학자 / 엔지니어, 그리고 오픈소스 개발자가 되었습니다. 최신 소프트웨어, 연구를 받아들이고 분석하는 것을 좋아하며 탄력적이고 유연한 사람이 되기 위해서 노력하고 있습니다.

  • 고도의 자동화, 분산 환경, 동시성, 병렬성, 대용량, 고성능 컴퓨팅에 관심이 많습니다.
  • 다양한 도메인의 데이터를 배우고 모델링하는 데에 관심이 많습니다.

업무 경험

데이터 과학자, 뉴로핏, 한국 서울 (2017.09~)

  • 자동 세분화 알고리즘의 정성적 평가를 위한 내부 MRI viewer 소프트웨어를 개발하였습니다.
  • 구글 클라우드 기반의 확장 가능한 managed 의료영상분석 시스템을 개발하였습니다.
  • 보편적으로 적용 가능한 완전 자동화된 두부 세분화 소프트웨어를 개발하고 있습니다.
  • 머신러닝, 뇌영상학, 기타 영상처리에 필요한 내부 파이썬 라이브러리를 개발하고 관리하였습니다.
  • 사내 제품 머신러닝 알고리즘 서비스화 개발 리드를 맡고 있습니다.

데이터 과학자 인턴쉽, 뉴로핏, 한국 서울 (2017.02~2017.09)

  • 의료영상처리를 위한 신경망 아키텍쳐들을 학습하고 사전에 학습된 모델을 tensorflow C++ API로 구현하였습니다.

교육

수원하이텍고등학교

  • 전기전자제어과 전공
  • 아사히카와공업고등전문학교 교환학생
  • IT 네트워크 및 시스템 관리 기술영재반 (2015~2016)
    • 컴퓨터 시스템, OS, 네트워킹 및 통신
    • 학기 중 저녁시간, 주말, 방학기간 등에 상시 참여
  • Big Data 기술영재반 (2017)
    • 2017 경기도 지방기능경기대회 빅데이터 종목 훈련
    • 학기 중 저녁시간, 주말, 방학기간 등에 상시 참여

데이터 과학 자기주도학습, Github ★ 42+

  • 그 외 자기주도학습 등 기록은 블로그에 있어요!

기술

  • 다차원, 다양한 의료영상처리 & 학습 모델링
  • 파이썬 및 파이썬 서드파티 라이브러리 활용 능력(Tensorflow, Pandas, Keras, Scikit-learn, Nibabel, …)
  • 클라우드 서비스 및 소프트웨어 운영 (Google Cloud Platform, AWS, docker, linux, ansible, airflow …)
  • 자연어 처리

한 번이라도 사용해 본 기술의 마인드 맵

  • 저의 기술 스택에 대한 자세한 내용은 마인드맵을 참고해주세요!

수상 및 대회

기계학습

2017 경기지방기능경기대회, 1위, 상금 130만원, 금메달 및 도지사 표창장 수여

  • 인터넷 이력과 검색어 데이터 그리고 통계 데이터를 활용해 인구통계학적 정보를 추론하였습니다.
  • 활용 기술: Python, Doc2Vec(임베딩), Scikit-learn, numpy, pandas, xgboost 등

카카오 아레나 쇼핑 카테고리 분류, 446 팀 중 5위, 우수상

  • 계층적인 온라인 쇼핑 카테고리를 상품 정보를 포함하는 대규모 데이터셋을 바탕으로 분류하는 대회.
  • 활용 기술: Python, Scikit-learn, numpy, pandas, h5py, tensorflow, CNN, weighted ensemble 등
  • 활용 기술을 포함한 상세한 후기

뇌영상학

MICCAI 2018 - Grand Challenge on MR Brain Segmentation 2018

  • 회백질, 백질, 척수액을 비롯한 뇌 구조들을 3T MRI 스캔에서 세분화 하는 방법론을 비교하는 대회.

언어

영어

  • 업무 및 전문적 소통 및 작업 가능

일본어

  • 일본어능력검정시험 JLPT N1, 현지인과 아무런 지장 없이 소통

한국어

  • 한국인

프로젝트 / 오픈소스

Koshort 프로젝트 최초 개발자 / 관리자 (Github ★ 38+, 9+, 6+)

Koshort은 한국어 NLP를 위한 high-level API 프로젝트입니다. Koshort은 현재 총 3가지 파이썬 패키지로 이루어져있으며, 다음과 같은 특징을 공통으로 가집니다.

  • Windows, Linux, Mac에서 모두 사용이 가능하도록 노력합니다.
  • 손쉬운 설치 (코드 1줄 내지 2줄)
  • Python3를 권장합니다. (pyeunjeon, goorm은 python2에서도 잘 동작합니다!)

쉽고 배우기 쉬운 고수준(High-level) API를 제공합니다.

KoNLPy 프로젝트 개발 / 관리 Team KoNLPy 멤버 (Github ★ 700+)

KoNLPy(“코엔엘파이”라고 읽습니다)는 한국어 정보처리를 위한 파이썬 패키지입니다.

Tweepy 기여 (Github ★ 5236+)

Twitter for Python!

Hangulize 기여 (Github ★ 157+)

Hangulize - 외국어의 한국어 음역을 위한 파이썬 소프트웨어

GPUtil 기여 (Github ★ 172+)

GPUtil is a Python module for getting the GPU status from NVIDA GPUs using nvidia-smi. GPUtil locates all GPUs on the computer, determines their availablity and returns a ordered list of available GPUs. Availablity is based upon the current memory consumption and load of each GPU. The module is written with GPU selection for Deep Learning in mind, but it is not task/library specific and it can be applied to any task, where it may be useful to identify available GPUs.