2019-01-24 21:39:11 +00:00
# bedtools
> Un coltellino svizzero di strumenti per analisi genomica.
> Usato per intersecare, raggruppare, convertire e contare dati in formato BAM, BED, GFF/GTF, VCF.
2021-09-29 19:56:15 +01:00
> Maggiori informazioni: <https://bedtools.readthedocs.io>.
2019-01-24 21:39:11 +00:00
- Interseca i fili genetici delle sequenze contenute in due file diversi e salva il risultato:
2022-10-20 14:26:58 +01:00
`bedtools intersect -a {{percorso/del/file_1}} -b {{percorso/del/file_2}} -s > {{percorso/del/file_output}}`
2019-01-24 21:39:11 +00:00
- Interseca due file unendo il risultato a sinistra, ovvero riporta ogni feature da {{file_1}} e NULL dove non c'è sovrapposizione con {{file_2}}:
2022-10-20 14:26:58 +01:00
`bedtools intersect -a {{percorso/del/file_1}} -b {{percorso/del/file_2}} -lof > {{percorso/del/file_output}}`
2019-01-24 21:39:11 +00:00
- Usa un algoritmo più efficiente per intersecare due file precedentemente ordinati:
2022-10-20 14:26:58 +01:00
`bedtools intersect -a {{percorso/del/file_1}} -b {{percorso/del/file_2}} -sorted > {{percorso/del/file_output}}`
2019-01-24 21:39:11 +00:00
- Raggruppa file in base alle prime tre e la quinta colonna e raggruppa la sesta colonna sommandola:
2022-10-20 14:26:58 +01:00
`bedtools groupby -i {{percorso/del/file}} -c 1-3,5 -g 6 -o sum`
2019-01-24 21:39:11 +00:00
- Converti da formato BAM a BED:
2022-10-20 14:26:58 +01:00
`bedtools bamtobed -i {{percorso/del/file}}.bam > {{percorso/del/file}}.bed`
2019-01-24 21:39:11 +00:00
- Trova per tutte le proprietà in {{file_1}} la più vicina in {{file_2}} e scrivi la loro distanza in una ulteriore colonna (i file in input devono essere ordinati):
2022-10-20 14:26:58 +01:00
`bedtools closest -a {{percorso/del/file_1}}.bed -b {{percorso/del/file_2}}.bed -d`