Các nhà khoa học Đan Mạch gần đây đã phát triển một mô hình AI có tên “life2vec”, phân tích dữ liệu cuộc sống của khoảng 6 triệu người ở Đan Mạch, bao gồm thu nhập, nghề nghiệp, cư trú, lịch sử sức khỏe… và dự đoán thành công thời gian tử vong của những người trong độ tuổi từ 35 đến 65 sau 4 năm, với tỷ lệ chính xác lên tới 78%. Kết quả nghiên cứu được công bố trên tạp chí Nature Computational Science vào ngày 18/12/2023 và đã thu hút sự chú ý rộng rãi trong cộng đồng khoa học.
Nguyên lý hoạt động của mô hình “life2vec” dựa trên mô hình ngôn ngữ lớn (tương tự như mô hình ngôn ngữ đằng sau ChatGPT), tóm tắt các mẫu và mẫu bằng cách phân tích chuỗi các sự kiện trong cuộc sống của con người. Các thuật toán này trước tiên phân tích một lượng lớn văn bản, tìm kiếm các mẫu trong từ và chuỗi câu. Mô hình AI sau đó sử dụng thông tin họ học để dự đoán những từ nào sẽ xuất hiện tiếp theo trong câu. “Lý do chính khiến chúng ta đang trải qua ‘thời đại dự đoán tương lai’ là sự xuất hiện của lượng dữ liệu khổng lồ cùng với các thuật toán mạnh mẽ của máy móc”, Lehmann nói.
Sử dụng thông tin từ Sổ đăng ký quốc gia Đan Mạch, các nhà nghiên cứu đã dịch hơn một thập kỷ thông tin cuộc sống từ hầu hết khoảng 6 triệu công dân Đan Mạch – bao gồm các chi tiết như thu nhập, nghề nghiệp, nơi cư trú, chấn thương, giờ làm việc, thăm khám và chẩn đoán bệnh viện, và thậm chí cả lịch sử mang thai – sang một ngôn ngữ tổng hợp khiến mọi sự kiện trong cuộc sống trở thành một “câu”. Bằng cách sắp xếp các “câu” này theo thứ tự thời gian, mô hình AI tái tạo câu chuyện cuộc sống kỹ thuật số của mỗi người. Ví dụ: “Vào tháng 8/2010, Agnes làm nữ hộ sinh tại một bệnh viện ở Copenhagen kiếm được 30.000 DKK”.
Về mặt dự đoán thời gian tử vong, các nhà nghiên cứu đã thu thập dữ liệu từ một nhóm người trong độ tuổi từ 35 đến 65 vì “tỷ lệ tử vong trong dân số này rất khó dự đoán”. Các nhà nghiên cứu đã cung cấp dữ liệu từ năm 2008 đến năm 2016 và đảm bảo rằng thông tin sau năm 2016 không bị rò rỉ sang mô hình AI, sau đó yêu cầu AI dự đoán ai sẽ sống và ai sẽ chết vào năm 2020, và cuối cùng, vào cuối năm 2020, họ phát hiện ra rằng tỷ lệ chính xác đạt 78%.
AI cũng xác định một số yếu tố góp phần làm tăng nguy cơ tử vong sớm, bao gồm thu nhập thấp, được chẩn đoán mắc các vấn đề sức khỏe tâm thần và là nam giới. Hầu hết các trường hợp tử vong mà mô hình không dự đoán được liên quan đến tai nạn hoặc đau tim rất khó dự đoán.
Tuy nhiên, một số nhà khoa học nói rằng mô hình này có thể không hiệu quả đối với những người không phải là người Đan Mạch. Youyou Wu, một nhà tâm lý học tại Đại học College London, nói rằng nếu mô hình được tinh chỉnh bằng cách sử dụng dữ liệu từ các quốc gia khác, nó có thể tiết lộ một mô hình phổ quát áp dụng cho con người và thậm chí làm nổi bật ảnh hưởng tinh tế của các nền văn hóa khác nhau đối với thời điểm các cá nhân chết.
Lehmann nói rằng kết quả nghiên cứu đang được tích cực công khai, nhưng để bảo vệ thông tin riêng tư cá nhân của công dân Đan Mạch được sử dụng để đào tạo hệ thống, AI hiện không mở cửa cho công chúng hoặc các công ty.
Theo GenK
2 Comments