2021-01-12 13:27:59 +00:00
|
|
|
# bedtools
|
|
|
|
|
|
|
|
> 유전자 분석 작업을 위한 도구의 swiss-army knife. BAM, BED, GFF/GTF, VCF 형식으로 데이터를 교차, 그룹화, 변환 및 카운트하는 데 사용.
|
2021-09-29 19:56:15 +01:00
|
|
|
> 더 많은 정보: <https://bedtools.readthedocs.io>.
|
2021-01-12 13:27:59 +00:00
|
|
|
|
2021-01-31 17:05:18 +00:00
|
|
|
- sequence의 strand를 기준으로 두개의 파일을 교차하고 결과를 `path/to/output_file`의 경로에 저장:
|
2021-01-12 13:27:59 +00:00
|
|
|
|
|
|
|
`bedtools intersect -a {{path/to/file_1}} -b {{path/to/file_2}} -s > {{path/to/output_file}}`
|
|
|
|
|
2021-01-31 17:05:18 +00:00
|
|
|
- 외부 조인이 왼쪽인 두개의 파일을 교차, 예시. `file_1`에서 각 기능을 보고하고 `file_2`와 겹치지 않으면 NULL:
|
2021-01-12 13:27:59 +00:00
|
|
|
|
|
|
|
`bedtools intersect -a {{path/to/file_1}} -b {{path/to/file_2}} -lof > {{path/to/output_file}}`
|
|
|
|
|
|
|
|
- 더 효율적인 알고리즘을 사용하여 두개의 사전 정렬된 파일을 교차:
|
|
|
|
|
|
|
|
`bedtools intersect -a {{path/to/file_1}} -b {{path/to/file_2}} -sorted > {{path/to/output_file}}`
|
|
|
|
|
2021-01-31 17:05:18 +00:00
|
|
|
- 첫 3열과 5열을 기준으로 `path/to/file`을 그룹화하여 6열을 요약:
|
2021-01-12 13:27:59 +00:00
|
|
|
|
|
|
|
`bedtools groupby -i {{path/to/file}} -c 1-3,5 -g 6 -o sum`
|
|
|
|
|
|
|
|
- bam-formated 파일을 bed-formated 파일로 변환:
|
|
|
|
|
|
|
|
`bedtools bamtobed -i {{path/to/file}}.bam > {{path/to/file}}.bed`
|
|
|
|
|
2021-01-31 17:05:18 +00:00
|
|
|
- `file_2.bed`와 가장 가까운 `file_1.bed`에서의 모든 기능을 찾고,그들의 거리와 추가 열을 기록 (입력 파일 정렬 필요):
|
2021-01-12 13:27:59 +00:00
|
|
|
|
|
|
|
`bedtools closest -a {{path/to/file_1}}.bed -b {{path/to/file_2}}.bed -d`
|