Giải trình tự toàn bộ hệ gen (Whole genome sequencing - WGS) và giải trình tự hệ gen biểu hiện (Whole exome sequencing - WES) là 2 xu hướng chính ứng dụng công nghệ NGS vào giải trình tự ADN. WGS/WES cho phép tìm kiếm và xác định các biến dị di truyền SNP, InDel, CNV, SV... có trong cá thể, quần thể đối với những loài đã có hệ gen tham chiếu. Việc phát hiện các biến dị di truyền giúp phát hiện các biến dị gây ra bệnh di truyền đã biết, từ đó tiến hành sàng lọc ung thư/bệnh di truyền sớm hoặc theo dõi đáp ứng điều trị; cung cấp các biến dị cho nghiên cứu GWAS, chú giải...; đánh giá đa dạng quần thể bằng cách xác định tần số allen...
Những ưu điểm vượt trội về công suất và giá thành đã khiến WGS trở thành phương pháp thích hợp nhất cho nhiều mục đích nghiên cứu. WGS ngày càng được sử dụng nhiều hơn cho các nghiên cứu giải mã như khoa học pháp y, di truyền nông nghiệp và các chẩn đoán lâm sàng (chẩn đoán bệnh di truyền là một ví dụ). Một trong những ứng dụng lâm sàng quan trọng khác là giải trình tự các chủng gây bệnh và các bệnh truyền nhiễm quan tâm.
Đối với nhiều ứng dụng, việc giải trình tự toàn bộ hệ gen là không thực tế và không cần thiết. Do đó, giải trình tự hệ gen biểu hiện (WES) là phương án tiếp cận hợp lý đối với những vùng gen quan tâm, ví dụ Exon chỉ chiếm 2% trong hệ gen người nhưng biến đổi trong đó lại gây nên 85% các căn bệnh đã biết. Vì lý do này, WES đã được sử dụng cho nghiên cứu lâm sàng trong những năm gần đây, cho ra nhiều công cụ chẩn đoán hứa hẹn sẽ làm thay đổi đáng kể dịch vụ y tế và chăm sóc sức khỏe.
Một hướng tiếp cận cao hơn mới phát triển trong thời gian gần đây là giải trình tự các gen quan tâm đã được khuếch đại bằng PCR. Phương pháp này phù hợp với các kiểm tra bệnh, tập trung vào một lượng giới hạn các bệnh có liên quan đến các biến thể hoặc ứng dụng trong giải trình tự gen 16S của rARN từ các loài khác nhau. Đây là phương pháp được sử dụng rộng rãi trong hệ thống học và phát sinh chủng loại, cụ thể là giữa các mẫu đa dạng về di truyền. Phương pháp này dùng để dánh giá sự đa dạng của vi khuẩn trong môi trường, giúp các nhà nghiên cứu phân tích được hệ vi sinh vật từ các mẫu khó hoặc không thể nghiên cứu được.
Giải trình tự ARN (ARN-seq)
Các bản phiên mã của sinh vật nhân chuẩn rất phức tạp và nhiều gen tạo ra các bản đối mã. Trên cơ sở các công nghệ NGS, nhiều quy trình đặc hiệu cho ARN-seq đã được phát triển, quy trình đầu tiên xuất hiện năm 2008. Các quy trình này cho phép xác định các bản đối mã điều hòa có thể đóng vai trò quan trọng trong các chức năng sinh học. Phân tích các bản phiên mã hiện nay cũng có thể thực hiện được ở mức độ các tế bào đơn lẻ dựa trên các phương pháp chuẩn bị mẫu đã được cải tiến. Phân tích toàn bộ các bản phiên mã của các tế bào đơn lẻ đã cho thấy có thể có những bản phiên mã không hoàn toàn giống nhau giữa các tế bào giống nhau. Một phương pháp mới được công bố năm 2014 có tên là giải trình tự ARN huỳnh quang tại chỗ (FISSEQ), có thể nghiên cứu về toàn bộ các bản phiên mã của các tế bào đơn lẻ, đồng thời xác định được vị trí chính xác của mỗi bản phiên mã trong tế bào.
Hạn chế của phương pháp ARN-seq truyền thống là việc xác định mức độ ổn định của ARN không phản ánh được hoạt động phiên mã hoặc tốc độ sinh tổng hợp protein. Vài năm trước đây, phương pháp NET-seq ra đời giúp chúng ta nhìn được các bản phiên mã ở độ phân giải từng nucleotide thông qua giải trình tự đặc hiệu từng bản sao mới được tạo nên. Phương pháp này dựa trên kết tủa miễn dịch của ARN polymerase kết hợp với giải trình tự đầu 3’ của các ARNs mới tổng hợp được đồng kết tủa. NET-seq là phương pháp thay thế cho ARNP ChIP-seq với độ phân giải cao hơn và giữ lại thông tin về mạch ARN.
Một phương pháp khác là ribo-seq đã được sử dụng để xác định bản đồ dịch mã ribosome trên ARN thông tin, phương pháp này kết hợp giữa dấu vết của nuclease và giải trình tự 28-30 nucleotide trong vùng được bảo vệ với ribosome của bản phiên mã. Kỹ thuật này được ứng dụng trong các nghiên cứu về điều hòa dịch mã của gen và cơ chế sinh tổng hợp protein.
Nhìn chung, sự xuất hiện của NGS đã cho phép các nhà khoa học nghiên cứu về các hệ thống sinh học ở mức độ chưa từng đạt được từ trước tới nay. Cùng với sự phát triển của công nghệ, các phương thức chuẩn bị mẫu và công cụ phân tích dữ liệu cũng được tăng cường mạnh mẽ. Do đó, NGS đã trở thành công nghệ chủ chốt trong nghiên cứu cơ bản và nhanh chóng trở thành công cụ cho mọi nghiên cứu về di truyền học và các nghiên cứu liên quan khác. Với sự phát triển mạnh về công nghệ, trong những năm tới đây, sẽ có hàng triệu bộ gen người được giải mã, tạo ra bộ dữ liệu gen khổng lồ so với những gì đang có. Vì vậy, vấn đề đạo đức cần được đặc biệt quan tâm, đồng thời cần đưa ra những phương pháp hiệu quả trong việc lưu trữ và phân tích dữ liệu khi tốc độ dữ liệu được tạo ra ngày càng lớn.