바닥부터 R과 바이오인포을 시작하여 R과 바이오인포를 마스터 하는 것을 목표로 하는 실습형 스터디입니다.
https://drive.google.com/drive/folders/0B6bSLTlVnagfRy1FRWp4MlJwbWs
-
- R 바이오( Bioinformatics in R )
-
- Biomedical Data Science : http://genomicsclass.github.io/book/
- R 바이오( Bioinformatics in R )
-
- R 고급 + 특강 : 상황에 따라 내용이 많이 변경 될 수 있음.
-
- 구글 genomics
-
- Spark R : http://spark.apache.org/docs/latest/sparkr.html "Data Algorithms: Recipes for Scaling Up with Hadoop and Spark"책 예제를 Spark R로 변환하기
-
- R 고급 + 특강 : 상황에 따라 내용이 많이 변경 될 수 있음.
- 윈도우즈 환경에서 Jupyter와 R연동
- Markdown 문법
- Spark - 무료 동영상 강의 한글
- Spark 실습환경구축
- 도커로 스파크 시작하기
- 빅바이오
- 딥바이오
- Hadoop및 Spark로 구현된 바이오인포 도구들
- 장소: 토즈 신촌 아트레온토즈점 ( http://www.toz.co.kr/branch/main/index.htm?id=6 )
- 매주 화요일, 저녁 7시 30분~10시
- 시작: 2016년07월 26일
seq. | 날짜 | 내용 | 후기 |
---|---|---|---|
1 | 2016. 7.26 | (R 기초) R컴퓨팅 : R설치 및 실습환경 구축, 제3장 데이터 입력과 출력 (지용기) | |
(R 중급 ) ISL : 2장 Statistical Learning (김가경) | |||
(R 바이오) R for Bioinformatics : DNA Sequence Statistics (1) (이승우) | |||
(R 고급) (구글 genomics) https://cloud.google.com/genomics/install-genomics-tools : How-to Guide : Installing the Cloud SDK and Genomics Commands 발표내용 (이병철) | |||
2 | 2016. 8. 2 | (R 기초) R컴퓨팅 : 제4장 데이터 구조(명충민) | |
(R 중급 ) ISL : 3장 Linear Regression (지용기) | |||
(R 바이오) R for Bioinformatics : Sequence Databases, 코드(양윤주) | |||
(R 고급) Spark에 대한 소개 및 Spark 실습환경, 간단한 예제 돌려보기(지용기) | |||
3 | 2016. 8. 9 | (R 기초) R컴퓨팅 : 4장 리스트, 제5장 프로그래밍 (명충민) | |
(R 중급 ) ISL : 4장 Classification(황성원) | |||
(R 바이오) R for Bioinformatics : Sequence Databases(양윤주) | |||
(R 고급) (구글 genomics) https://cloud.google.com/genomics/v1/analyze-variants : How-to Guide: Analyze Variants Using BigQuery 와 https://cloud.google.com/genomics/v1/load-variants : How-to Guide : Loading Genomic Variants (박혜진) | |||
4 | 2016. 8.16 | (R 기초) R컴퓨팅 : 제6장 함수의 생성 (명충민) | |
(R 중급 ) ISL : 5장 Resampling Methods (황성원) | |||
(R 바이오) R for Bioinformatics : Pairwise Sequence Alignment(이병철) | |||
(R 고급) Spark R : http://spark.apache.org/docs/latest/sparkr.html 발표내용 (지용기) | |||
http://spark.rstudio.com/index.html 발표내용 |
seq. | 날짜 | 내용 | 후기 |
---|---|---|---|
1 | 2016.10. 4 | (R 기초) 데이터시각화 : 2장 탐색적 자료분석1, 탐색적 자료분석2 (명충민) | |
(R 중급 ) R 고급활용 : 제1장 R 데이터 처리(장혜정) | |||
(R 바이오) Biomedical Data Science : 0 - Introduction, 1 - Inference CLT in Practice까지(이승우) | |||
2 | 2016.10.11 | (R 기초) 데이터시각화 : 3 장 이변량 데이터의 시각화(명충민) | |
(R 중급 ) R 고급활용 : 제2장 통계계산(권기호) | |||
(R 바이오) Biomedical Data Science : 1 - Inference t-tests in Practice부터(이승우) | |||
(R 고급) (구글 genomics) Docs » Process Data on Google Cloud » Create a Grid Engine cluster with Preemptible VM workers, 발표자료(이병철) | |||
(R 고급) (DataAlgorithm) 4장. Left Outer Join을 Spark-R로 구현 (지용기) | |||
3 | 2016.10.18 | (R 기초) 데이터시각화 : 4 장 시계열의 시각화 | |
(R 중급 ) R 고급활용 : 제3장 통계추론 | |||
(R 바이오) Biomedical Data Science : 2 ~ 4 - Matrix Algebra | |||
(R 고급) (DataAlgorithm) 7장. Market Basket Analysis을 Spark-R로 구현 | |||
4 | 2016.10.25 | (R 기초) 데이터시각화 : 5 장 지리적 데이터의 시각화(명충민) | |
(R 중급 ) R 고급활용 : 제4장 R 통계 그래픽스(박세진) | |||
(R 바이오) Biomedical Data Science : 5 - Linear Models (장수경) | |||
(R 고급) (구글 genomics) http://googlegenomics.readthedocs.io/en/latest/use_cases/run_samtools_over_many_files/index.html : Docs » Process Data on Google Cloud » Run SAMtools to index BAM files in Cloud Storage (이병철) |
seq. | 날짜 | 내용 | 후기 |
---|---|---|---|
1 | 2016.11. 1 | (R 기초) 데이터시각화 : 6 장 텍스트 데이터의 시각화 - 워드 클라우드 | |
(R 중급 ) R 고급활용 : 제5장 R을 이용한 고급 그래픽 기법, 한방팩, shiny-cheatsheet | |||
(R 바이오) Biomedical Data Science : 6 - Inference for High-Dimensional ,7 - Statistical Modeling | |||
(R 고급) (DataAlgorithm) 10장. Content-Based Recommendation: Movies을 Spark-R로 구현 | |||
2 | 2016.11. 8 | (R 기초) 데이터시각화 : 7 장 다변량 데이터의 시각화 | |
(R 중급 ) R 고급활용 : 제6장 일반화 선형모형 | |||
(R 바이오) Biomedical Data Science :7 - Statistical Modeling | |||
3 | 2016.11.15 | (R 기초) 데이터시각화 : 8 장 웹을 이용한 동적 · 대화형 데이터 시각화 | |
(R 바이오) Biomedical Data Science :7 - Statistical Modeling | |||
4 | 2016.11.22 | (R 중급 ) R 고급활용 : 제6장 일반화 선형모형 (박세진) | |
(R 고급) (DataAlgorithm) 11장. Smarter Email Marketing with the Markov Model을 Spark-R로 구현 | |||
(R 바이오) Biomedical Data Science :8 - Distance and Dimension Reduction (명충민) | |||
5 | 2016.11.29 | (R 중급 ) R 고급활용 : 제6장 일반화 선형모형(박세진) | |
(R 중급 ) R 고급활용 : 제7장 분류분석(장수경) | |||
(R 고급) (DataAlgorithm) 12장. K-Means Clustering을 Spark-R로 구현(지용기) |