분류 전체보기 (58) 썸네일형 리스트형 reference build version 바꾸기(hg38 to hg19, hg19 to hg38) public data를 사용하다 보면 내가 가진 데이터와 다른 reference genome에 mapping된 데이터들을 사용해야 할때가 많다. hg38에 mapping된 결과와 hg19에 mapping된 결과는 coordinate가 다르기때문에 문제가 될 수있으니, 이를 보정해 주어야한다. hg38 to hg19 혹은 hg19 to hg38 둘다 input만 달라지고 나머지는 같다. 1. liftOver download 우선 UCSC에서 제공하는 liftover tool을 받는다. wget http://hgdownload.cse.ucsc.edu/admin/exe/linux.x86_64/liftOver chmod a+x liftOver 2. liftOver chain file을 받는다. http://hg.. [ 파이썬 error ] UserWarning: Matplotlib is currently using agg, which is a non-GUI backend, so cannot show the figure. plt.show() 주로 주피터 노트북으로 python conda환경을 사용하는데, 잘되다가 갑자기 plt.show()가 안된다. 즉, figure를 jupyter notebook 웹상에서 시각화 할 수가 없게 되었다. 해당 에러는 다음과 같았다. :2: UserWarning: Matplotlib is currently using agg, which is a non-GUI backend, so cannot show the figure. plt.show() 1차 해결법 plt.plot(targets) #plt.show() plt.savefig("targets.png") 당장은 급하기에 figure를 저장하여 확인하는 방식으로 작업을 진행하고 있는데, 여간 귀찮은 일이 아니다. 2차 해결법 sudo apt-get install.. [에러해결]cannot rescale a constant/zero column to unit variance prcomp in R prcomp로 PCA를 그리기위해 주성분 분석을 수행하던중 다음과 같은 에러를 만났다. "cannot rescale a constant/zero column to unit variance" Error in prcomp.default(toy, scale. = TRUE): cannot rescale a constant/zero column to unit variance Traceback: 1. prcomp(toy, scale. = TRUE) 2. prcomp.default(toy, scale. = TRUE) 3. stop("cannot rescale a constant/zero column to unit variance") 이는 PCA분석을 진행할때 사용되는 데이터 table의 열(column)중에 분산이 .. 바이오, 제약 산업군에서 AI의 위치. 바이오업계에서 AI를 접목시키려고하는 시도가 많아지고 있다. 하지만 아직 바이오업계는 제약업계와 비교해서 작은 산업군에 속한다. 따라서 바이오 업계에서의 대우자체가 제약 업계와 차이가난다. 이때문에 AI인력이 바이오 업계에 많이 부족한 현실이며, 그마저도 대우가 좋지 않다. 그래서 항상 인재가 부족한 실정이다. 다음은 내가 일하면서 느끼고 배운것들을 기록한것 이다. 앞으로 추가할 예정이다. 1. data split할때 중요한것은 일관성(homogeneous). 2. 제약 bigdata를 모으기 힘듬. -> small data 분석에 우선은 초점을 맞추는것이 필요 3. 빅데이터를 모으기는 힘들지만 결국엔 바이오,제약 사업에서 AI는 큰 영향을 줄것. 4. genome data와 임상정보(phenotype).. 파이썬 Tensorflow 오류 해결 - illegal instruction (core dumped) 예전에 내 노트북에서 tensorflow를 해보려고 구글링을 통해서 tensorflow(CPU)를 설치했다. import를 시도했을때 다음과 같은 에러가 발생했다. import tensorflow as tf >illegal instruction (core dumped) 그때 당시 구글링에도 익숙치 않았지만 열심히 구글링해서 이유를 찾아냈다. 이유는 내가 사용했던 노트북이 너무 구식이여서... 설치한 텐서플로우의 버전이 1.6이상이면 CPU에서 사용되는 명령어중에 AVX가 사용되도록 빌드 되어있다고 한다. AVX명령어가 지원되지않는 CPU를 사용중이라면 위와같이 illegal instruction (core dumped)에러가 발생하게 된다. 에러 해결법은 간단하다. tensorflow 버전을 다운그레이드.. 에러해결-Can't connect to X11 window server using 'localhost:46.0' as the value of the DISPLAY variable. Qualimap 2 is a platform-independent application written in Java and R that provides both a Graphical User Inteface (GUI) and a command-line interface to facilitate the quality control of alignment sequencing data and its derivatives like feature counts. 자바와 R로 만들어진 tool인 qualimap을 사용하다가 다음과 같은 에러를 만났다. Can't connect to X11 window server using 'localhost:46.0' as the value of the DISPLAY variabl.. 코드 잘짜는방법 - clean code (클린코드, 로버트C.마틴) "우리 모두는 자신이 짠 쓰레기 코드를 쳐다보며 나중에 손보겠다고 생각한 경험이 있다." "프로그래머는 집중탐구가 필요한 코드가 아니라 대충봐도 이해할수 있는 코드를 짜야한다." 본 포스팅은 클린 코드책을 읽고 요약 정리하여 작성했다. http://www.yes24.com/Product/Goods/11681152 Clean Code 클린 코드 - YES24 애자일 소프트웨어의 혁명적인 패러다임을 제시하는 책이다. 저자 로버트 마틴은 오브젝트 멘토(Object Mentor)의 동료들과 힘을 모아 ‘개발하며’ 클린 코드를 만드는 최상의 애자일 기법을 정제 www.yes24.com 나쁜 코드로 치르는 대가 1. 나쁜코드는 개발속도를 크게 떨어뜨린다. 깨끗한 코드를 어떻게 작성할까? 1. 의미 있는 이름 1) .. 논문리뷰 - Cell-free DNA TAPS provides multimodal information for early cancer detection 본 리뷰는 지극히 개인적으로 읽고 요약한것이며, 잘못된정보가 포함할수 있습니다. 또한, 출처를 명확히 밝히며, 문제가 있을경우 삭제하겠습니다. 첫번째 리뷰논문은 Cell-free DNA TAPS provides multimodal information for early cancer detection https://www.science.org/doi/10.1126/sciadv.abh0534 Cell-free DNA TAPS provides multimodal information for early cancer detection Novel cell-free DNA whole-genome methylome sequencing method enables accurate cancer detection. www.s.. 이전 1 2 3 4 5 ··· 8 다음