본문 바로가기

전체 글

(58)
바이오 빅데이터 정리 ( 1000genome, TCGA, COSMIC, CCLE 등..) 공부하면서 정리하는 Bioinformatics 본 포스팅은 genomics를 공부하며 작성하는 포스팅이기 때문에 잘못된 부분이 있을수 있습니다. 또한, 범문에듀케이션에 출판된 유전체 데이터 분석2 (NGS편, 암과 질병 유전체) 서적을 기반으로 공부하여 작성하였음을 미리 알립니다. 오늘은 바이오 빅데이터를 정리한다. 1. The 1000 genome project 인종별로 다양하게 나타나는 변이에 대한 정보를 모으기위해 시작된 사업. 2008년에 미국,영국,중국이 참여함. 5개의 인종과 26개의 아인종으로 구분된 2504명의 유전체 염기서열을 공개, 인종간의 다양성을 설명할 수 있는 대표적인 유전체 서열 데이터, data 접근 sample별이 아니라 염색체별로 24개의 파일 제공. NCBI에서 제공하는 ..
에러 해결 : Failed to get convolution algorithm. This is probably because cuDNN failed to initialize 딥러닝 모델을 만들고 훈련시키는 과정에서 컴퓨팅 자원으로 CPU를 활용하는것보다 GPU를 활용하는것이 훨씬 속도가 빠르다. 하지만 gpu를 이용하다보면 이따금씩 만나는 에러메세지가 있다. Failed to get convolution algorithm. This is probably because cuDNN failed to initialize~ 이 메세지를 구글링해보면 여러 커뮤니티에서 질문과 답을 주고 받은 내용들이있다. tensoflow 버젼을 바꿔라, conda 에서 CUDA 버젼을 어떻게해라.. 등등 이런 다양한 메세지들을 시도해봣지만 결과는 달라지지 않았다. 결론적으로는 GPU memory와 연관이 있다. 나는 멀티GPU를 사용하고있다. 기본적으로 keras는 멀티 GPU사용시 모든 물리적 G..
주식투자의 시작(feat. 2차 팬더믹, 코로나19)(6) 2차 pandamic우려가 수치상으로 거의 확실시되고 있다. 미국의 확진자수가 다시 증가하고 있는것을 그래프로도 확인할수 있다. S&P500지수도 확진자가 점점 증가한 2차 팬더믹 우려로 인해 6.11일 6.76% 급락했다. 코로나로 인해 가장큰 피해를 보고있는 종목들 중 하나인 dis는 테마파크 개장이 또한번 미뤄져 주가가 회복을 못하고 있는 중이다. 하지만 애플과 같은 대형 기술주는 약간의 조정수준이라고 보일만큼 약간 하락하고 금새 전고점을 갱신하는 모습을 확인할 수 있다. ----------- 코로나가 장기화 되어가고, 코로나로 인한 생활습관의 변화로 인해 어떤 기업들은 전고점을 갱신하고 있고 어떤 기업들은 상황이 좋지 않다. 나는 코로나가 끝나면 국경폐쇄, 사회적 거리두기로 인해 억눌러왔던 여행,..
Variants allele frequency (VAF) 와 minor allele frequency(MAF)의 차이 유전체학 공부를 하다보면 여기저기서 Variants allele frequency와 minor allele frequency를거의 혼용해서 사용한다. 이두 용어가 혼동되어 찾아보고 생각해본 결과, 아래와같이 두 용어를 정리 했다. variants allele frequency(VAF) 대립유전자 빈도를 뜻하는 용어로 NGS에서 주로 사용 하는 용어. 한사람의 조직에서의 염색체의 특정위치(locus)에 대립유전자가 나타나는 빈도이다. minor allele frequency(MAF) GWAS에서 쓰는 용어 인구집단 내에서 minor 한 allele의 빈도를 지칭하는 용어
Somatic variants calling VS Germline variants calling 비교 Somatic variants calling 과 Germline variants calling을 비교해 보자 먼저 Germline variants는 생식세포 돌연변이로서 부모에게 유전받아 전체 genome에서 발견되는 변이 이다. 이에반해 Somatic variants는 체세포 돌연변이이며 살면서 다양한 이유로 발생하는 변이이다. 유전체 분석에서 variants를 찾아내는 과정을 variants calling 이라고 칭한다. germ-line mutation을 target으로 변이를 검출할때 한 site에서 A가 10번 T가 90번 읽혔으면 이 변이는 somatic mutation또는 sequencing error일 가능성이 높다. germline mutation은 부모로부터 물려받았기 떄문에 homoz..
아파치를 이용해 Web server(웹서버) 운영하기/IP주소 확인하는법 본 포스팅은 생활코딩의 Web수업을 들으며 정리한 글입니다. 웹서버를 운영할때는 두가지 방법이 있다. 하나는 외부 hosting업체를 이용하는 방법이 있고.(github) 다른 하나는 직접 웹서버를 운영하는 방법이다. 그중 직접운영하는 방식을 진행해 본다. 1. 아파치를 직접 설치해서 관리하는 것은 어려우므로 통합 매니저를 이용한다. 여러가지 software가 있지만 그중하나인 bitnami WAMP를 이용한다. 홈페이지를 통해 bitnami WAMP를 설치한다. https://bitnami.com/stack/wamp/installer Install WAMP, Download WAMP show MD5 ee2a130c2729beee867351395b5eb20d SHA1 d8bf67b00a7a5b5eaac7..
주식투자 기록(feat. 우한폐렴, 코로나19)(5) 코로나 팬더믹이 어느정도 잠잠해지고 있는 와중에 미국에서 미네소타 흑인 사망 사건으로 인해 폭동이 발생한다. 하지만 이는 주식 시장에 영향을 주지 않는듯 했다. 오히려 경제활동 재개 기대감으로 언택트는 물론이고 컨택트 관련주까지 상승하고 있었다. 하지만 폭동으로 인한것인지 미국 일부 주에서는 확진자가 다시 증가하고 있다. 때문에 글로벌 2차 팬더믹이 대두되고있다. 2차 팬더믹 공포로 인해 다우지수가 6월 11일 7% 폭락했다. S&P 차트와 데이터를 보면 6월 11일 5.76% 하락했다. S&P 500지수 6개월 차트 거의 다 회복했지만 다시 급락했다. 여기저기서 또다시 공포뉴스가 쏟아지고있다. 한국을 보면 곳곳에서 아직 코로나확진자가 집단으로 발생하고 있지만, 내가 느끼기엔 경각심이 예전보다는 떨어진듯..
(autokeras)AttributeError: 'google.protobuf.pyext._message.RepeatedCompositeCo' object has no attribute 'append' autokeras를 시도하던 도중 다음과 같은 에러와 함께 AttributeError:'google.protobuf.pyext._message.RepeatedCompositeCo' object has no attribute 'append' too many fail build model 에러가 함께 떳다. 구글링해도 만족할만한 결과를 찾기가 쉽지 않았다. autokeras 커뮤니티가 아직 활발하지 않기 때문이다. stack over flow를 통해 해답을 얻을 수 있었다. pip install -U protobuf==3.8.0 노트북을 사용하는 경우는 !pip install -U protobuf==3.8.0 을 통해 protobuf 버젼을 업그레이드 해준다. 정확한 이유는 잘 모르겠다... 저 문제는 해결..