Tương lai của dữ liệu và AI

Thứ tư - 14/08/2024 06:30

The future of data and AI

AI tạo sinh (Generative AI) có thể giúp lấp đi khoảng trống dữ liệu, cho phép bất kỳ ai, không chỉ những người có các kỹ năng chuyên gia, để xuất bản, tìm kiếm, và hiểu dữ liệu.

Tue Jun 11, 2024

Theo: https://theodi.org/insights/projects/the-future-of-data-and-ai/

Bài được đưa lên Internet ngày: 11/06/2024

AI tạo sinh (Generative AI) có tiềm năng để lấp đi ‘khoảng trống dữ liệu’ bằng cách giúp dữ liệu và các công cụ sử dụng dữ liệu dễ tiếp cận hơn. Các công nghệ đó có thể dân chủ hóa thông tin, cho phép mọi người không có các kỹ năng chuyên gia tương tác với và diễn giải dữ liệu một cách trực quan thông qua các tác nhân đàm thoại. Tuy nhiên, việc cải thiện AI và sáng dữ liệu là cơ bản để khai thác đầy đủ tiềm năng này, cho phép người dùng đưa ra các quyết định có đầy đủ thông tin, được dữ liệu xúc tác. Quả thực, tất cả các công cụ đó làm việc tốt nhất với ‘con người trong vòng lặp’. Để đạt được những lợi ích đó, việc nâng cao quyền truy cập tới dữ liệu là rất quan trọng, không chỉ để tăng tốc đổi mới mà còn xúc tác cho xã hội hiện thực hóa giá trị đầy đủ của dữ liệu.

Bất chấp hứa hẹn này, có các thách thức đáng kể trong hệ sinh thái AI. Cộng đồng AI hiện đang dựa vào một nhúm các tập dữ liệu máy học, thiếu các khung quản trị mạnh mẽ. Điều này đặt ra các rủi ro đáng kể, vì quản trị dữ liệu bất bình đẳng có thể dẫn tới các định kiến và các thực hành phi đạo đức, chống trụ cho lòng tin và trách nhiệm của các ứng dụng AI trong các lĩnh vực quan trọng và các khung chính sách mạch lạc dẫn đến sự không nhất quán về chất lượng, tính minh bạch, và tính công bằng của dữ liệu, đe dọa sự phục hồi của các hệ thống AI và có rủi ro sụp đổ phạm vi rộng tương tự như một ‘thời điểm dot com’ đối với AI.

Ngoài ra, sự thiếu minh bạch về đào tạo dữ liệu cản trở các nỗ lực giải quyết các định kiến và đảm bảo tuân thủ pháp lý. Tài liệu được tiêu chuẩn hóa, tương tự với báo cáo tài chính, là cần thiết để cải thiện tính minh bạch và lòng tin. Các chính phủ và các bên liên quan phải hành động quyết liệt, cập nhật các luật sở hữu trí tuệ, tăng cường bảo vệ dữ liệu, và đảm bảo truy cập dữ liệu rộng rãi. Việc trao quyền cho các cá nhân trong việc chia sẻ và sử dụng dữ liệu là sống còn để tạo ra một hệ sinh thái AI minh bạch, công bằng và hiệu quả.

Xây dựng dựa trên tuyên ngôn (bản dịch sang tiếng Việt) gần đây của chúng tôi, chúng tôi đang làm việc về các khuyến nghị cho những can thiệp chính sách mà sẽ giúp xây dựng cơ sở hạ tầng dữ liệu mạnh, cơ bản cho AI có trách nhiệm, vì vậy hãy theo dõi không gian này trong những tuần tới.

Generative AI can help close the data divide, allowing anyone, not just those with specialist skills, to publish, find, and make sense of data.

Generative AI has the potential to bridge the 'data divide' by making data and the tools to use it more accessible. These technologies can democratise information, allowing people without specialist skills to interact with and interpret data intuitively through conversational agents. However, improving AI and data literacy is essential to fully harness this potential, enabling users to make informed, data-enabled decisions. Indeed, all these tools work best with ‘humans in the loop’. To achieve these benefits, increased access to data is crucial, not only to accelerate innovation but also to enable society to realise the full value of data.

Despite this promise, there are substantial challenges within the AI ecosystem. The AI community currently relies on a handful of machine learning datasets, which lack robust governance frameworks. This poses significant risks, as inadequate data governance can lead to biases and unethical practices, undermining the trust and reliability of AI applications in critical areas such as healthcare, finance, and public services. The absence of standardisation and cohesive policy frameworks results in inconsistencies in data quality, transparency, and fairness, threatening the resilience of AI systems and risking a widescale collapse akin to a 'dot com moment' for AI.

Moreover, the lack of transparency about training data hampers efforts to address biases and ensure legal compliance. Standardised documentation, akin to financial reporting, is needed to enhance transparency and trust. Governments and stakeholders must act decisively, updating intellectual property laws, enforcing data protection, and ensuring broad data access. Empowering individuals in data sharing and use is vital to creating a transparent, equitable, and effective AI ecosystem.

Building on our recent manifesto, we're working on recommendations for policy interventions that will help build the strong data infrastructure essential for responsible AI, so watch this space over the coming weeks.

Dịch: Lê Trung Nghĩa

letrungnghia.foss@gmail.com

Tác giả: Nghĩa Lê Trung