Những tiến bộ trong giải trình tự thế hệ tiếp theo cho phép chúng ta giải trình tự DNA nhanh chóng với chi phí tương đối thấp. Nhiều phương pháp tin sinh học đã được phát triển để xác định các biến thể bộ gen từ toàn bộ bộ gen hoặc toàn bộ dữ liệu giải trình tự exome. Việc phát triển các phương pháp gọi biến thể tốt hơn bị hạn chế bởi khó khăn trong việc đánh giá tính chính xác và đầy đủ của một phương pháp mới. Thông thường, các phương pháp tính toán có thể được chuẩn hóa bằng cách sử dụng dữ liệu mô phỏng cho phép chúng tôi tạo ra nhiều dữ liệu như mong muốn và trong các tình huống được kiểm soát. Trong nghiên cứu này, chúng tôi đã so sánh ba đường ống gọi biến thể: Samtools / VarScan, Samtools / Bcftools và Picard / GATK bằng cách sử dụng hai tập dữ liệu mô phỏng. Kết quả cho thấy sự khác biệt đáng kể giữa ba đường ống trong hai trường hợp. Trong tập dữ liệu của Chromosome 6, các đường ống dẫn GATK và Bcftools đã phát hiện ra hơn 90% các biến thể. Trong khi đó, chỉ 82,19% đột biến được VarScan phát hiện. Trong tập dữ liệu NA12878, kết quả cho thấy đường ống GATK nhạy hơn đường ống Bcftools và đường ống Varscan. Tất cả các đường ống đều có Giá trị Dự đoán Tích cực cao. Hơn nữa, theo thước đo thời gian chạy, VarScan là đường ống cao nhất nhưng GATK có một tùy chọn cho đa luồng, đây là một cách để làm cho một chương trình chạy nhanh hơn. Do đó, GATK hiệu quả hơn Bcftools và Varscan để gọi biến thể với tập dữ liệu có phạm vi phủ sóng thấp hơn.