Các vi sinh vật thực hiện chức năng chính trong hệ sinh thái và sự đa dạng của chúng phản ánh sức khỏe của môi trường của chúng. Tuy nhiên, chúng vẫn bị khai thác chủ yếu trong chương trình phản ứng sinh học hiện tại vì chúng khó xác định. Các nhà nghiên cứu từ Đại học Geneva (UNIGE)-Thụy Sĩ, gần đây đã phát triển một phương pháp kết hợp hai công nghệ tiên tiến. Họ sử dụng công cụ gen để sắp xếp chuỗi ADN của vi sinh vật trong các mẫu và sau đó khai thác lượng dữ liệu đáng kể này bằng trí tuệ nhân tạo. Họ xây dựng mô hình dự đoán có khả năng thiết lập chẩn đoán sức khỏe của các hệ sinh thái trên quy mô lớn và xác định các loài thực hiện những chức năng quan trọng. Phương pháp mới này, được công bố trên tạp chí Trends in Microbiology, sẽ tăng đáng kể khả năng quan sát của các hệ sinh thái lớn và giảm thời gian phân tích cho chương trình phản ứng sinh học thông thường rất hiệu quả.

Theo dõi tình trạng của hệ sinh thái có tầm quan trọng quyết định trong bối cảnh phát triển bền vững và tăng áp lực của con người lên môi trường. Các loài vi sinh vật khác nhau nhạy cảm với những thay đổi trong môi trường xung quanh được sử dụng làm chỉ số sinh học để theo dõi chất lượng môi trường. Tuy nhiên, việc xác định hình thái đòi hỏi rất nhiều thời gian và chuyên môn. “Một năm trước, chúng tôi đã có thể thiết lập một chỉ số chất lượng nước chỉ dựa trên trình tự ADN của tảo đơn bào có trong các mẫu, mà không cần phải xác định trực quan từng loài“, Jan Pawlowski-Giáo sư tại Đại học Geneva, cho biết.

Sử dụng trình tự DNA mà không cần phải xác định chúng

Các công cụ gen có thể mô tả nhanh chóng và rất chính xác cộng đồng sinh học sống trong một môi trường. Tuy nhiên, tỷ lệ lớn dữ liệu không thể được sử dụng để tiến hành chẩn đoán sức khỏe môi trường vì nhiều chuỗi ADN không được tham chiếu trong cơ sở dữ liệu hiện có. Do đó, các loài sở hữu trình tự này là không rõ, cũng như vai trò sinh thái của chúng. Tác giả đầu tiên của nghiên cứu Tristan Cordier, cho biết: “Để khai thác tất cả dữ liệu gen môi trường, cụ thể là tất cả đa dạng sinh học của các mẫu, chúng tôi đã sử dụng thuật toán học máy“. Các nhà sinh học đã sử dụng các mẫu có tình trạng chất lượng sinh thái được biết đến khác nhau, từ tốt đến xấu, từ đó họ giải trình tự ADN. Sự kết hợp của thông tin này cho phép họ xây dựng một hệ thống tham chiếu với dữ liệu từ mỗi mẫu. Một mô hình dự đoán sau đó đã được phát triển với thuật toán này, dựa trên dữ liệu đào tạo của chúng tôi. Chúng bao gồm dữ liệu từ các chẩn đoán tham chiếu và dữ liệu từ trình tự của các loài chưa biết. Mô hình này được tinh chỉnh và xác nhận theo thời gian bằng cách đưa các mẫu tham chiếu mới vào bộ dữ liệu đào tạo hiện có.

Khám phá các chỉ số sinh học mới

Sự kết hợp của hai công nghệ tiên tiến này giúp có thể có được các giá trị sinh thái cho chuỗi ADN mà không cần phải xác định chúng. Các loài vi sinh vật, đã được mô tả hay chưa, thực hiện chức năng quan trọng có thể được phát hiện thông qua phương pháp này, cũng như nhiều chỉ số sinh học mới. Tristan Cordier kết luận: “Nghiên cứu của chúng tôi có một số điểm tương đồng với nghiên cứu về hệ vi sinh vật ở người. Cả hai đều nhằm mục đích làm sáng tỏ các cộng đồng vi sinh vật và xác định các dấu ấn sinh học có thể được sử dụng như một công cụ chẩn đoán mạnh mẽ để phát hiện ô nhiễm môi trường hoặc bệnh ở người“.

Đ.T.V (NASATI), theo https://www.sciencedaily.com/releases/2018/12/181213131229.htm,