AI chẩn đoán đạt độ chính xác 90% khi thử nghiệm nhưng vừa bước vào đời thật thì lại thất bại thảm hại

0
37

AI không bị áp lực giữa “thử” và “thật”, tuy nhiên làm việc một cách máy móc cũng khiến chất lượng kết quả giảm sút.

Đại dịch Covid-19 vẫn chưa có dấu hiệu dừng lại, khiến bệnh viện nhiều nước rơi vào tình trạng quá tải, thậm chí có những chuyên gia lo ngại hệ thống y tế địa phương có thể sụp đổ khi bệnh dịch vượt tầm kiểm soát. Chẳng lạ khi nhiều người bắt đầu đặt kỳ vọng vào trí tuệ nhân tạo, rằng nó có thể giúp tăng tốc độ xét nghiệm và giảm tải cho nhân viên y tế.

Tuy nhiên, một nghiên cứu mới do Google Health thực hiện, cũng là nghiên cứu đầu tiên theo dõi tác động của công nghệ deep learning vào môi trường phòng khám chuyên nghiệp, cho thấy hệ thống AI chính xác nhất cũng phạm sai lầm nghiêm trọng nếu như không được làm quen với môi trường làm việc.

Những luật lệ hiện tại cho việc ứng dụng AI vào phòng khám đều tập trung vào đảm bảo độ chính xác của thiết bị, không kèm yêu cầu nào khác liên quan tới giúp bệnh nhân khá hơn vì chưa bài thử nào như vậy diễn ra cả. Nhà nghiên cứu Emma Beede tới từ Google Health nhận định cách thức ứng dụng AI trong điều trị cần phải thay đổi.

Chúng ta cần hiểu cách thức thiết bị trí tuệ nhân tạo giúp đỡ con người trong những hoàn cảnh nhất định, nhất là trong lĩnh vực chăm sóc sức khỏe, trước khi ta ứng dụng chúng rộng rãi”, cô Beede nói.

Cơ hội thử công cụ AI trong bối cảnh thực tế đầu tiên tới từ đất nước Thái Lan. Bộ Y tế nước này đã đặt mục tiêu chẩn đoán 60% người mắc tiểu đường để xem họ có mắc bệnh màng lưới, nỗ lực giúp giảm tỷ lệ mùa lòa do tiểu đường. Nhưng chỉ khoảng 200 chuyên gia mắt khám cho 4,5 triệu người bệnh tiểu đường thì không đủ, nên Thái Lan khó có thể đạt mục tiêu do chính phủ đặt ra nếu không có công nghệ hậu thuẫn.

Cho dù vẫn đang chờ chứng nhận Cục quản lý Thực phẩm và Dược phẩm Hoa Kỳ FDA, Google vẫn được phép lắp đặt hệ thống trí tuệ nhân tạo để giúp Thái Lan chống di chứng tiểu đường. Cô Beede và cộng sự tới 11 phòng khắp trên khắp nước Thái, lắp đặt hệ thống deep learning được huấn luyện để phát hiện bệnh mắt trên bệnh nhân tiểu đường.

Thông thường, y tá sẽ chụp ảnh mắt bệnh nhân và gửi cho chuyên gia – một quá trình có thể kéo dài tới 10 tuần. Hệ thống AI của Google Heath có thể xác nhận bệnh màng lưới mắt với độ chính xác lên tới 90%, mức được đội ngũ cho là tương đương với đẳng cấp chuyên gia; quá trình chẩn đoán chỉ mất dưới 10 phút.

Nghe rất ấn tượng, nhưng máy đạt được độ chính xác nói trên trong phòng điều kiện phòng thí nghiệm. Vì không rõ máy móc tự động vận hành ra sao trong thế giới thực, Google Health cố gắng tìm ra sự thật. Sau nhiều tháng theo dõi, phỏng vấn y bác sĩ về trải nghiệm sử dụng hệ thống AI, các chuyên gia Google nhận về kết quả không mấy tích cực.

Khi mọi thứ trôi chảy, AI có tăng tốc độ chẩn đoán bệnh. Nhưng thỉnh thoảng cỗ máy từ chối đưa kết quả. Cũng giống nhiều hệ thống nhận dạng hình ảnh khác, chúng đã quen với hình ảnh chất lượng cao nên sẽ từ chối phân tích hình ảnh với chất lượng thấp hơn mức quy chuẩn. Nó đã từ chối nhận khoảng hơn 20% lượng ảnh do y bác sĩ đưa vào phân tích.

Những bệnh nhân có ảnh bị AI từ chối sẽ phải thăm khám lại với một phòng khám khác; không phải ai cũng có điều kiện đi lại như vậy. Y tá chụp ảnh cũng gặp nhiều phiền toái, họ cho rằng nhiều ảnh cho thấy rõ mắt người bệnh khỏe mạnh, không cần phải tái khám làm gì. Nhiều khi việc chụp lại ảnh một lần nữa, hay ngồi chỉnh sửa ảnh sao cho rõ ràng cũng làm mất nhiều thời gian quý giá.

Bởi lẽ hệ thống yêu cầu y bác sĩ phải tải ảnh lên kho lưu trữ đám mây để xử lý hình ảnh, việc tốc độ Internet chậm có thể làm trì hoãn quá trình chẩn đoán. “Bệnh nhân thích thú với kết quả liền tay, nhưng tốc độ chậm khiến họ phàn nàn nhiều. Họ đã phải chờ ở đây từ 6 giờ sáng, và trong hai tiếng đầu làm việc chúng tôi mới chỉ chẩn đoán được 10 bệnh nhân”, một y tá nói.

Đội ngũ Google Health đang thảo luận với các nhân viên y tế địa phương để lập ra phương án làm việc mới. Sẽ có lúc y tá có thể tự đưa ra chẩn đoán với những ca dễ/những ảnh dễ, và chuyên gia Google sẽ chỉnh sửa hệ thống để nó nhận dạng ảnh chất lượng thấp tốt hơn.

Tuy nhiên, nguy cơ vẫn còn đó

Đây là nghiên cứu tối quan trọng với bất kỳ ai muốn tham gia vào ngành [nhận dạng hình ảnh] cũng như muốn ứng dụng giải pháp AI vào tình huống thực tế”, nhà nghiên cứu Hamid Tizhoosh tới từ Đại học Waterloo, Canada, nói. Tizhoosh là chuyên gia trong lĩnh vực nhận dạng hình ảnh y học, và ông chỉ trích việc nhanh chóng ứng dụng công cụ AI vào chẩn đoán Covid-19. Chuyên gia Tizhoosh cho rằng nghiên cứu mới của Google Health chính là hồi chuông cảnh tỉnh, cho thấy AI vẫn chưa sẵn sàng, đạt độ chính xác cao mới chỉ là bước đầu tiên.

Michael Abramoff, một bác sĩ nhãn khoa và nhà khoa học máy tính tới từ Đại học Iowa, đã và đang phát triển một hệ thống AI nhận dạng bệnh mắt suốt nhiều năm nay. Abramoff cũng là CEO của startup liên quan tới bệnh mắt có tên IDx Technologies, có hợp tác với cả IBM Watson. Bác sĩ Abramoff đưa lời cảnh báo về việc vội vàng ứng dụng AI trong chẩn đoán, cũng như phản hồi tiêu cực từ những người có trải nghiệm xấu trong chẩn đoán bệnh bằng AI.

Tôi vui vì Google sẵn sàng theo dõi từng bước làm việc trong phòng khám. Bởi lẽ ở khía cạnh chăm sóc sức khỏe, đâu phải có mỗi yếu tố thuật toán là quan trọng”, bác sĩ Abramoff nhận định.

Ông cũng đặt dấu hỏi liên quan tới việc so sánh độ chính xác của AI với chuyên gia. Con người còn có thể tranh luận, chứ một hệ thống chỉ biết từ chối khi máy móc nhận định hai giá trị “đúng” và “sai”. Bác sĩ Abramoff cho rằng một hệ thống AI cần biết tham gia vào quá trình thảo luận những điểm chưa rõ.

Khi mọi thứ diễn ra trôi chảy, thì hiệu quả công việc tăng vọt. Nhà nghiên cứu Beede và cộng sự chứng kiến tận mắt cách hệ thống AI trợ giúp những y bác sĩ tài năng. “Có những y tá chỉ làm một mình mà cũng chẩn đoán được tới 1.000 bệnh nhân, bằng công cụ mới này, cô ấy sẽ còn làm việc trôi chảy hơn nữa”, cô Beede nói.

Bệnh nhân không quan tâm tới việc AI hay người thật thực hiện chẩn đoán. Họ muốn biết trải nghiệm chẩn đoán sẽ ra sao”.

Dink -Tham khảo Technology Review