Trí tuệ nhân tạo đang cách mạng hóa y học theo nhiều cách, trong đó có tiềm năng trở thành trợ lý chẩn đoán đáng tin cậy cho các bác sĩ lâm sàng bận rộn.
Trong hai năm qua, các mô hình AI độc quyền – tức các hệ thống độc quyền với mã nguồn đóng, không công khai-đã đạt được những bước tiến ấn tượng trong việc xử lý các ca bệnh phức tạp, đòi hỏi lập luận lâm sàng tinh vi. Đáng chú ý, các mô hình này đã chứng minh khả năng vượt trội so với các mô hình nguồn mở, vốn có mã nguồn công khai và có thể được chỉnh sửa bởi bất kỳ ai.
Liệu AI nguồn mở có đang bắt kịp với các mô hình AI độc quyền?
Một nghiên cứu mới do Viện Y tế Quốc gia Hoa Kỳ (NIH) tài trợ, dẫn đầu bởi các nhà nghiên cứu tại Trường Y Harvard, đã cho thấy AI nguồn mở có thể sánh ngang với các mô hình độc quyền hàng đầu. Nghiên cứu này được thực hiện với sự hợp tác của các bác sĩ lâm sàng tại Trung tâm Y tế Beth Israel Deaconess trực thuộc Harvard và Bệnh viện Brigham and Women’s.
Theo kết quả công bố ngày 14/3 trên JAMA Health Forum, mô hình AI nguồn mở Llama 3.1 405B đã thể hiện hiệu suất tương đương với GPT-4, một mô hình AI nguồn đóng hàng đầu. Để đánh giá khách quan, nhóm nghiên cứu đã so sánh hai mô hình trên 92 trường hợp lâm sàng phức tạp, được rút ra từ tiêu chí chẩn đoán khó của Tạp chí Y khoa New England.
Những phát hiện này cho thấy AI nguồn mở đang trở thành một đối thủ cạnh tranh đáng gờm và có thể mang đến giải pháp thay thế hiệu quả cho các mô hình độc quyền. Với tốc độ phát triển hiện tại, AI nguồn mở có tiềm năng tạo ra sự thay đổi lớn trong nhiều lĩnh vực, bao gồm cả y học, nơi độ chính xác và tính minh bạch trong chẩn đoán là yếu tố quan trọng.
“Từ những gì chúng tôi biết, đây là lần đầu tiên một mô hình AI nguồn mở đạt hiệu suất ngang bằng với GPT-4 trong các tình huống phức tạp do bác sĩ đánh giá. Thật ấn tượng khi các mô hình Llama có thể bắt kịp nhanh chóng với các mô hình độc quyền hàng đầu. Sự cạnh tranh này sẽ mang lại lợi ích cho bệnh nhân, nhà cung cấp dịch vụ chăm sóc và các bệnh viện”, Arjun Manrai, tác giả chính và phó giáo sư tin sinh học tại Viện Blavatnik thuộc HMS, cho biết.
So sánh ưu và nhược điểm của hệ thống AI nguồn mở và nguồn đóng
AI nguồn mở và AI nguồn đóng có những khác biệt quan trọng trong ứng dụng y tế. Các mô hình AI nguồn mở cho phép tải xuống và vận hành trực tiếp trên hệ thống nội bộ của bệnh viện, giúp dữ liệu bệnh nhân được lưu trữ an toàn trong hệ thống nội bộ. Ngược lại, AI nguồn đóng thường chạy trên máy chủ bên ngoài, yêu cầu chuyển dữ liệu bệnh nhân ra khỏi bệnh viện, tiềm ẩn lo ngại về bảo mật.
“Mô hình nguồn mở có thể hấp dẫn hơn đối với nhiều giám đốc thông tin, quản trị viên bệnh viện và bác sĩ vì việc dữ liệu rời khỏi bệnh viện để chuyển cho một thực thể khác, dù đáng tin cậy, vẫn là một vấn đề nhạy cảm”, Thomas Buckley, nghiên cứu sinh tiến sĩ chuyên ngành AI trong Y học tại Khoa Tin sinh học của HMS, cho biết.
Bên cạnh đó, AI nguồn mở cho phép các chuyên gia y tế và công nghệ thông tin điều chỉnh mô hình để đáp ứng nhu cầu nghiên cứu và lâm sàng đặc thù. Trong khi đó, AI nguồn đóng thường có tính tùy chỉnh hạn chế, khiến việc điều chỉnh theo yêu cầu cụ thể trở nên khó khăn hơn.
Buckley nhấn mạnh rằng người dùng có thể sử dụng dữ liệu cục bộ để tinh chỉnh các mô hình AI, giúp chúng phù hợp với nhu cầu riêng biệt của bác sĩ, nhà nghiên cứu và bệnh nhân. Quá trình này có thể được thực hiện từ đơn giản đến phức tạp, tùy thuộc vào yêu cầu cụ thể.
Các công ty như OpenAI và Google cung cấp mô hình nguồn đóng, đồng thời hỗ trợ khách hàng. Ngược lại, mô hình nguồn mở yêu cầu người dùng tự cài đặt và bảo trì. Ngoài ra, mô hình nguồn đóng thường dễ dàng tích hợp hơn với các hệ thống cơ sở hạ tầng y tế hiện có.
AI mã nguồn mở so với AI mã nguồn đóng: Đánh giá hiệu quả trong việc giải quyết các trường hợp lâm sàng khó khăn.
Các thuật toán AI, cả nguồn mở lẫn nguồn đóng, đều được huấn luyện trên một lượng dữ liệu y tế đồ sộ. Những dữ liệu này bao gồm sách giáo khoa y khoa, các nghiên cứu khoa học đã qua thẩm định, công cụ hỗ trợ quyết định lâm sàng và dữ liệu bệnh nhân đã được ẩn danh (như bệnh án, kết quả xét nghiệm, hình ảnh y tế và chẩn đoán). Nhờ khả năng phân tích lượng lớn thông tin với tốc độ cực nhanh, các thuật toán AI có thể nhận diện các mẫu bệnh lý. Ví dụ, chúng có thể học cách phân biệt giữa khối u lành tính và ác tính trên mẫu mô, nhận biết các dấu hiệu sớm của suy tim, hoặc phân biệt giữa ruột già bình thường và ruột già bị viêm trên phim chụp CT. Khi được cung cấp một tình huống lâm sàng mới, AI sẽ so sánh thông tin đầu vào với những gì đã học được để đưa ra các chẩn đoán có thể xảy ra.
Trong quá trình phân tích, nhóm nghiên cứu đã sử dụng 70 ca lâm sàng khó của NEJM để đánh giá khả năng của mô hình thử nghiệm Llama. Những ca này từng được dùng để kiểm tra hiệu suất của GPT-4 trong một nghiên cứu trước đó, do Adam Rodman, phó giáo sư y khoa tại Trường Y Harvard (HMS) và Bệnh viện Beth Israel Deaconess, đồng thời là đồng tác giả của nghiên cứu hiện tại dẫn đầu. Để đảm bảo tính khách quan và tránh việc Llama đã “học” được đáp án từ 70 ca bệnh cũ trong quá trình huấn luyện cơ bản, nhóm nghiên cứu đã bổ sung thêm 22 ca lâm sàng mới. Những ca này chỉ được công bố sau khi quá trình huấn luyện của Llama kết thúc.
Mô hình nguồn mở Llama đã chứng minh năng lực đáng kinh ngạc, vượt trội hơn GPT-4 trong các bài kiểm tra chẩn đoán y tế. Cụ thể, Llama đưa ra chẩn đoán chính xác trong 70% trường hợp, so với 64% của GPT-4. Không chỉ vậy, Llama còn xếp hạng chẩn đoán đúng là gợi ý đầu tiên trong 41% trường hợp, trong khi con số này ở GPT-4 chỉ là 37%. Khi thử nghiệm trên tập dữ liệu mới gồm 22 trường hợp, hiệu suất của Llama còn ấn tượng hơn nữa, đạt độ chính xác 73% và xác định đúng chẩn đoán cuối cùng trong 45% trường hợp.
“Là một bác sĩ, tôi nhận thấy xu hướng tập trung vào các mô hình ngôn ngữ lớn, mạnh mẽ nhưng lại mang tính độc quyền, khiến chúng ta không thể sử dụng chúng một cách cục bộ,” Rodman chia sẻ. “Nghiên cứu của chúng tôi đã chứng minh rằng các mô hình nguồn mở cũng có thể đạt được sức mạnh tương đương, mang lại cho các bác sĩ và hệ thống y tế quyền kiểm soát lớn hơn đối với việc sử dụng những công nghệ này“.
Theo một báo cáo năm 2023, mỗi năm tại Hoa Kỳ có khoảng 795.000 bệnh nhân tử vong hoặc phải chịu tàn tật vĩnh viễn do sai sót trong quá trình chẩn đoán. Chẩn đoán sai hoặc muộn không chỉ gây hại trực tiếp cho bệnh nhân mà còn tạo gánh nặng tài chính lớn cho hệ thống y tế. Các xét nghiệm không cần thiết, phương pháp điều trị không phù hợp và biến chứng nghiêm trọng đều làm tăng chi phí theo thời gian. “Nếu được sử dụng đúng cách trong hệ thống y tế, AI có thể hỗ trợ đắc lực cho bác sĩ, nâng cao độ chính xác và tốc độ chẩn đoán. Tuy nhiên, bác sĩ vẫn cần đóng vai trò chủ đạo để đảm bảo AI hoạt động hiệu quả”, Manrai cho biết.
Theo: vista.gov.vn