The future of data and AI
AI tạo sinh (Generative AI) có thể giúp lấp đi khoảng trống dữ liệu, cho phép bất kỳ ai, không chỉ những người có các kỹ năng chuyên gia, để xuất bản, tìm kiếm, và hiểu dữ liệu.
Tue Jun 11, 2024
Theo: https://theodi.org/insights/projects/the-future-of-data-and-ai/
Bài được đưa lên Internet ngày: 11/06/2024
AI tạo sinh (Generative AI) có tiềm năng để lấp đi ‘khoảng trống dữ liệu’ bằng cách giúp dữ liệu và các công cụ sử dụng dữ liệu dễ tiếp cận hơn. Các công nghệ đó có thể dân chủ hóa thông tin, cho phép mọi người không có các kỹ năng chuyên gia tương tác với và diễn giải dữ liệu một cách trực quan thông qua các tác nhân đàm thoại. Tuy nhiên, việc cải thiện AI và sáng dữ liệu là cơ bản để khai thác đầy đủ tiềm năng này, cho phép người dùng đưa ra các quyết định có đầy đủ thông tin, được dữ liệu xúc tác. Quả thực, tất cả các công cụ đó làm việc tốt nhất với ‘con người trong vòng lặp’. Để đạt được những lợi ích đó, việc nâng cao quyền truy cập tới dữ liệu là rất quan trọng, không chỉ để tăng tốc đổi mới mà còn xúc tác cho xã hội hiện thực hóa giá trị đầy đủ của dữ liệu.
Bất chấp hứa hẹn này, có các thách thức đáng kể trong hệ sinh thái AI. Cộng đồng AI hiện đang dựa vào một nhúm các tập dữ liệu máy học, thiếu các khung quản trị mạnh mẽ. Điều này đặt ra các rủi ro đáng kể, vì quản trị dữ liệu bất bình đẳng có thể dẫn tới các định kiến và các thực hành phi đạo đức, chống trụ cho lòng tin và trách nhiệm của các ứng dụng AI trong các lĩnh vực quan trọng và các khung chính sách mạch lạc dẫn đến sự không nhất quán về chất lượng, tính minh bạch, và tính công bằng của dữ liệu, đe dọa sự phục hồi của các hệ thống AI và có rủi ro sụp đổ phạm vi rộng tương tự như một ‘thời điểm dot com’ đối với AI.
Ngoài ra, sự thiếu minh bạch về đào tạo dữ liệu cản trở các nỗ lực giải quyết các định kiến và đảm bảo tuân thủ pháp lý. Tài liệu được tiêu chuẩn hóa, tương tự với báo cáo tài chính, là cần thiết để cải thiện tính minh bạch và lòng tin. Các chính phủ và các bên liên quan phải hành động quyết liệt, cập nhật các luật sở hữu trí tuệ, tăng cường bảo vệ dữ liệu, và đảm bảo truy cập dữ liệu rộng rãi. Việc trao quyền cho các cá nhân trong việc chia sẻ và sử dụng dữ liệu là sống còn để tạo ra một hệ sinh thái AI minh bạch, công bằng và hiệu quả.
Xây dựng dựa trên tuyên ngôn (bản dịch sang tiếng Việt) gần đây của chúng tôi, chúng tôi đang làm việc về các khuyến nghị cho những can thiệp chính sách mà sẽ giúp xây dựng cơ sở hạ tầng dữ liệu mạnh, cơ bản cho AI có trách nhiệm, vì vậy hãy theo dõi không gian này trong những tuần tới.
Generative AI can help close the data divide, allowing anyone, not just those with specialist skills, to publish, find, and make sense of data.
Generative AI has the potential to bridge the 'data divide' by making data and the tools to use it more accessible. These technologies can democratise information, allowing people without specialist skills to interact with and interpret data intuitively through conversational agents. However, improving AI and data literacy is essential to fully harness this potential, enabling users to make informed, data-enabled decisions. Indeed, all these tools work best with ‘humans in the loop’. To achieve these benefits, increased access to data is crucial, not only to accelerate innovation but also to enable society to realise the full value of data.
Despite this promise, there are substantial challenges within the AI ecosystem. The AI community currently relies on a handful of machine learning datasets, which lack robust governance frameworks. This poses significant risks, as inadequate data governance can lead to biases and unethical practices, undermining the trust and reliability of AI applications in critical areas such as healthcare, finance, and public services. The absence of standardisation and cohesive policy frameworks results in inconsistencies in data quality, transparency, and fairness, threatening the resilience of AI systems and risking a widescale collapse akin to a 'dot com moment' for AI.
Moreover, the lack of transparency about training data hampers efforts to address biases and ensure legal compliance. Standardised documentation, akin to financial reporting, is needed to enhance transparency and trust. Governments and stakeholders must act decisively, updating intellectual property laws, enforcing data protection, and ensuring broad data access. Empowering individuals in data sharing and use is vital to creating a transparent, equitable, and effective AI ecosystem.
Building on our recent manifesto, we're working on recommendations for policy interventions that will help build the strong data infrastructure essential for responsible AI, so watch this space over the coming weeks.
Dịch: Lê Trung Nghĩa
letrungnghia.foss@gmail.com
Tác giả: Nghĩa Lê Trung
Ý kiến bạn đọc
Những tin mới hơn
Những tin cũ hơn
Blog này được chuyển đổi từ http://blog.yahoo.com/letrungnghia trên Yahoo Blog sang sử dụng NukeViet sau khi Yahoo Blog đóng cửa tại Việt Nam ngày 17/01/2013.Kể từ ngày 07/02/2013, thông tin trên Blog được cập nhật tiếp tục trở lại với sự hỗ trợ kỹ thuật và đặt chỗ hosting của nhóm phát triển...
DigComp 3.0: Khung năng lực số châu Âu
Các bài toàn văn trong năm 2025
Các bài trình chiếu trong năm 2025
Các lớp tập huấn thực hành ‘Khai thác tài nguyên giáo dục mở’ tới hết năm 2025
Tập huấn thực hành ‘Khai thác tài nguyên giáo dục mở’ cho giáo viên phổ thông, bao gồm cả giáo viên tiểu học và mầm non tới hết năm 2025
Các tài liệu dịch sang tiếng Việt tới hết năm 2025
Loạt bài về AI và AI Nguồn Mở: Công cụ AI; Dự án AI Nguồn Mở; LLM Nguồn Mở; Kỹ thuật lời nhắc;
Tổng hợp các bài của Nhóm các Nhà cấp vốn Nghiên cứu Mở (ORFG) đã được dịch sang tiếng Việt
Tổng hợp các bài của Liên minh S (cOAlition S) đã được dịch sang tiếng Việt
Năm Khoa học Mở & Chuyển đổi sang Khoa học Mở - Tổng hợp các bài liên quan
Bàn về 'Lợi thế của doanh nghiệp Việt là dữ liệu Việt, bài toán Việt' - bài phát biểu của Bộ trưởng Nguyễn Mạnh Hùng ngày 21/08/2025
‘KHUYẾN NGHỊ VÀ HƯỚNG DẪN TRUY CẬP MỞ KIM CƯƠNG cho các cơ sở, nhà cấp vốn, nhà bảo trợ, nhà tài trợ, và nhà hoạch định chính sách’ - bản dịch sang tiếng Việt
50 công cụ AI tốt nhất cho năm 2025 (Đã thử và kiểm nghiệm)
‘Đặc tả Khung Tính mở Mô hình (MOF)’ của LF AI & Data - Tài sản chung của AI Tạo sinh - bản dịch sang tiếng Việt
‘LỘ TRÌNH CỦA TỔNG THƯ KÝ LIÊN HIỆP QUỐC VỀ HỢP TÁC KỸ THUẬT SỐ THÚC ĐẨY HÀNG HÓA CÔNG CỘNG KỸ THUẬT SỐ’ - bản dịch sang tiếng Việt
AI trong TVET - Một vài gợi ý triển khai trong thực tế
Tài sản chung kỹ thuật số và Hàng hóa Công cộng Kỹ thuật số - Tìm thấy nền tảng chung cho các nhà hoạch định chính sách
Tọa đàm ‘Vai trò của Tài nguyên Giáo dục Mở trong chuyển đổi số giáo dục đại học’ tại Viện Chuyển đổi số và Học liệu - Đại học Huế, ngày 12/09/2025
‘Hiệp ước Kỹ thuật số Toàn cầu’ của Liên hiệp quốc - bản dịch sang tiếng Việt
12 dự án AI Nguồn Mở hàng đầu để bổ sung vào kho công nghệ của bạn. 11. Hugging Face Transformers
Dự án DIAMAS đưa ra Khuyến nghị và Hướng dẫn Truy cập Mở Kim cương
50 công cụ AI tốt nhất cho năm 2025 (Đã thử và kiểm nghiệm) - Trợ lý AI tốt nhất (chatbots)
Hướng dẫn kỹ thuật lời nhắc. Kỹ thuật viết lời nhắc. Lời nhắc Tái Hành động (ReAct)
50 công cụ AI tốt nhất cho năm 2025 (Đã thử và kiểm nghiệm) - Trình tạo nhạc AI tốt nhất
Vì sao Singapore đang xây dựng hàng hóa công cộng kỹ thuật số
Nâng cao tính mở và khả năng sử dụng của Hàng hóa Công cộng Kỹ thuật số bằng cách chỉ chấp nhận các bộ sưu tập nội dung và bộ dữ liệu hoàn toàn được cấp phép mở
Hình dung lại dữ liệu cho AI Nguồn Mở: Lời kêu gọi hành động
Chiến lược 2023-2028 của DPGA
50 công cụ AI tốt nhất cho năm 2025 (Đã thử và kiểm nghiệm) - Công cụ AI quản lý kiến thức tốt nhất
Hướng dẫn nghiên cứu của khoa về ChatGPT và các công cụ AI