파이썬 제너레이터 : 장차 크게 될 녀석

“제너레이터”는 메모리 효율적인 방식으로 반복자를 생성하기 위한 강력한 도구입니다. 제너레이터를 만드는 방법은 2가지 입니다. 1. 함수의 yield 문 사용. 2. 컴프리핸션 사용 대부분의 블로그에서 제너레이터의 예제는 피보나치 수열 문제를 예로 들어줍니다. 하지만 이런 수학 문제 예제는 제너레이터를 어떻게 활용해야 하는지에 대한 감을 떨어뜨립니다… 저는 피보나치보다는 데이터 처리에서 제너레이터가 어떻게 쓰이는 예제를 가져왔습니다. 아래 yield문을 사용한 … Read more

Python(파이썬): NamedTuple

파이썬에는 튜플인데 딕셔너리 성격을 가진 튜플인 NamedTuple이 있다. 튜플의 성격처럼 불변형이라서 중요한 데이터를 담는 데 유용하다. 뿐만 아니라 일반 튜플과 달리 직관적으로 무슨 데이터인지 알 수 있게 데이터 모델링이 가능하다. ‘NamedTuple’ 알고 있으면 정말 유용하게 사용할 수 있을 것 같아서 정리해보았다. NamedTuple 사용 방법 collections의 namedtuple를 import 합니다. 직원의 이름, 부서, 연봉 데이터를 담는 데이터를 … Read more

Python(파이썬): 시퀀스 자료형 분류 및 예제

Python(파이썬): 시퀀스 자료형 분류 및 예제파이썬에 어떤 시퀀스 자료형들이 있고 이들의 특성들은 무엇인지 잘 알아야 원하는 순간 적절한 자료형을 사용할 수 있는 것 같다. 해당 포스트는 이전에 공부했던 파이썬 시퀀스 자료형의 분류와 예제를 정리하였다. 시퀀스 자료형이란 데이터가 순서대로 나열된 형식을 의미한다. (이때, 데이터가 순서대로 나열되었다는 뜻일 뿐 정렬되어있다는 의미는 아니다.) 리스트, 튜플 같은 것들이 대표적으로 … Read more

초보자 파이썬 시작

파이썬 시작: 저도 아직 파이썬 고수는 아니지만… 제가 처음 파이썬을 시작하였을 때 고민하였던 것, 혹은 알았다면 좋았을 것이라고 생각되는 것을 5개를 적어보았습니다. 백문이불여일타 ‘파이썬 시작’ 을 위해서는 눈으로만 보지 말고 무조건 코드를 입력하고 실행까지 해보기를 추천 드립니다. 눈으로만 보는 것과 실제 입력하는 것과는 천지차이 입니다. 하고 싶은 것 결정 우선 파이썬으로 데이터 분석을 하고 싶은지, … Read more

COSMIC 데이터 분석 시 알아야 할 것

COSMIC 데이터 분석 시 알아야 할 것 COSMIC 데이터는 대용량 데이터로 매력적으로 보이지만 데이터가 큰 만큼 지저분하고 데이터를 해석하기 위해 알아할 내용도 많다 . 뿐만 아니라 웹페이지에서 자세히 설명하지 않은 부분도 존재하기 때문에 얼핏 봐서는 데이터를 오해하기 십상이다. 때문에 COSMIC 데이터 분석 시 알아야 할 것을 몇 가지 정리하였다. COSMIC data에서의 mutation 빈도는 실제 mutation … Read more

COSMIC 데이터베이스 사용법

COSMIC 데이터베이스 사용법COSMIC 데이터베이스는 Catalogue of Somatic Mutation In Cancer의 줄임말이며 해당 주소(https://cancer.sanger.ac.uk/cosmic)로 접근할 수 있다. COSMIC을 제공하는 기관은 Sanger institute이며 세계 최대 규모의 somatic variant database이다. COSMIC은 여러 저널에서의 데이터와 ICGC, TCGA, PCGP와 같은 암 데이터 포탈에서 얻을 수 있는 데이터들을 취합하였다. 때문에 암 변이에 관련된 정말 많은 정보를 COSMIC에서 얻을 수 있지만 데이터가 … Read more

COSMIC에서 사용하는 식별자 COSV와 COSM

COSMIC에서 사용하는 식별자 COSV와 COSM: COSMIC은 Catalogue of Somatic Mutation In Cancer의 약자이며 해당 주소(https://cancer.sanger.ac.uk/cosmic)로 접근 할 수 있다.COSMIC에서는 변이를 식별하기 위해서 COSV와 COSM 두 가지를 사용한다. 간단히 말하면, COSV는 현재 사용되고 있는 변이의 식별자이며 genomic position이 있다면 무조건 COSV가 있다. 반면 COSM은 과거에 사용했던 변이의 식별자이며 genomic position 정보가 없어도 된다. 자세한 차이는 아래에 … Read more