Là bản dịch tài liệu ‘From Human Content to Machine Data. Introducing CC Signals’ của các tác giả hàng đầu: Jack Hardinges, Sarah Pearson, & Rebecca Ross. Xuất bản, tháng 6/2025. Giấy phép CC BY 4.0.
“Tóm tắt
Những tiến bộ gần đây về AI nhờ việc sử dụng lượng lớn dữ liệu dẫn lối, bao gồm từ khắp nơi trên web.
Điều này không hoàn toàn mới. Trong hai thập kỷ qua, máy móc đã được sử dụng để truy cập và biên dịch nội dung web để thực hiện những việc như xây dựng công cụ tìm kiếm và tạo kho lưu trữ kỹ thuật số. Việc máy móc sử dụng lại dữ liệu web phần lớn được quản lý theo các chuẩn mực và tiêu chuẩn không chính thức. Hợp đồng xã hội này dựa trên một mức độ có đi có lại và thường phù hợp với kỳ vọng hợp lý của mọi người về cách tác phẩm của họ sẽ được sử dụng khi họ chia sẻ chúng công khai.
Tuy nhiên, ngày càng rõ ràng rằng hợp đồng xã hội hỗ trợ việc máy móc sử dụng dữ liệu web trong quá khứ không còn hiệu lực nữa. Ngày nay, máy móc không chỉ thu thập dữ liệu trên web để giúp tìm kiếm dễ dàng hơn hoặc giúp mở khóa những hiểu biết mới mà còn cung cấp các thuật toán làm thay đổi cơ bản (và đe dọa) web mà chúng ta biết.
Để ứng phó, một số nhà sáng tạo đang chọn đưa nội dung của họ ngoại tuyến. Những người khác đang cố gắng chặn máy móc truy cập vào tác phẩm của họ và dựng lên các bức tường thu phí. Những người nắm giữ bản quyền lớn đang thúc đẩy các nhà lập pháp mở rộng phạm vi các quyền sở hữu trí tuệ.
Điều này không bền vững và không dẫn đến tương lai mà chúng ta mong muốn. Tác động của các mô hình AI lớn, kết hợp với phản ứng dữ dội dễ hiểu này, có nguy cơ tạo ra một thế giới mà mọi người không còn có thể hoặc không muốn chia sẻ tác phẩm của mình. Kiến thức và sự sáng tạo có thể bị khóa chặt hơn nữa và nhiều thập kỷ tiến bộ đạt được của phong trào mở bị đảo ngược.
Điều này quan trọng, vì quyền tiếp cận phổ cập với kiến thức và văn hóa là quyền con người và rất quan trọng đối với khả năng giải quyết những thách thức cấp bách nhất của chúng ta trong tương lai. Tại thời điểm quan trọng này, chúng tôi tin rằng CC phải can thiệp để giúp hướng tới một tương lai kỹ thuật số công bằng hơn.
Chúng tôi đang nghiên cứu phiên bản đầu tiên của khung tín hiệu ưu tiên (Preference Signals Framework), tạm gọi là tín hiệu CC. Tín hiệu CC được thiết kế để cung cấp một cách mới cho những người quản lý các bộ sưu tập nội dung lớn để chỉ ra ưu tiên của họ về cách máy móc (và con người kiểm soát chúng) nên đóng góp trở lại cho cộng đồng khi chúng tái sử dụng và hưởng lợi từ việc sử dụng nội dung.
Sự can thiệp của chúng tôi dựa trên niềm tin rằng có nhiều mục đích hợp pháp để máy tái sử dụng nội dung cần được bảo vệ và một hệ sinh thái giải quyết tốt hơn những mối quan tâm hợp pháp của những người tạo ra và quản lý kiến thức của con người là điều khả thi và cần thiết.
Bài báo này mô tả lý do tại sao chúng tôi đi đến niềm tin này và đang thực hiện hành động này. Chúng tôi đang xuất bản bài báo này cùng với một nguyên mẫu ban đầu của tín hiệu CC và yêu cầu phản hồi.
Chúng tôi không thể biến điều này thành hiện thực nếu không có cộng đồng—hãy tham gia cùng chúng tôi.”
Tự do tải về bản dịch sang tiếng Việt của tài liệu có 42 trang tại địa chỉ: https://www.dropbox.com/scl/fi/5xuyuvwnqaq0su6zwcl8r/Human-Content-to-Machine-Data_Final_Vi-02072025.pdf?rlkey=2gjas7b0c2wp9raf0suojbs7n&st=133m0kab&dl=0
Xem thêm:
Blogger: Lê Trung Nghĩa
letrungnghia.foss@gmail.com
Tác giả: Nghĩa Lê Trung
Ý kiến bạn đọc
Những tin mới hơn
Những tin cũ hơn
Blog này được chuyển đổi từ http://blog.yahoo.com/letrungnghia trên Yahoo Blog sang sử dụng NukeViet sau khi Yahoo Blog đóng cửa tại Việt Nam ngày 17/01/2013.Kể từ ngày 07/02/2013, thông tin trên Blog được cập nhật tiếp tục trở lại với sự hỗ trợ kỹ thuật và đặt chỗ hosting của nhóm phát triển...
Các bài trình chiếu trong năm 2024
Tập huấn thực hành ‘Khai thác tài nguyên giáo dục mở’ cho giáo viên phổ thông, bao gồm cả giáo viên tiểu học và mầm non tới hết năm 2024
Các lớp tập huấn thực hành ‘Khai thác tài nguyên giáo dục mở’ tới hết năm 2024
Các tài liệu dịch sang tiếng Việt tới hết năm 2024
‘Digcomp 2.2: Khung năng lực số cho công dân - với các ví dụ mới về kiến thức, kỹ năng và thái độ’, EC xuất bản năm 2022
Tổng hợp các bài của Nhóm các Nhà cấp vốn Nghiên cứu Mở (ORFG) đã được dịch sang tiếng Việt
Tổng hợp các bài của Liên minh S (cOAlition S) đã được dịch sang tiếng Việt
Năm Khoa học Mở & Chuyển đổi sang Khoa học Mở - Tổng hợp các bài liên quan
Hội nghị Đối tác Dữ liệu Mở châu Á năm 2021 do Việt Nam lần đầu tiên chủ trì
Các khung năng lực trong hành động
Phong trào Bình dân học vụ số: Mục tiêu, đối tượng, nội dung, nguồn lực, phương thức tổ chức thực hiện
Lễ công bố công khai Trung tâm Năng lực Kim cương châu Âu và dự án ALMASI
Khung năng lực AI cho giáo viên
Sư phạm Mở là gì (Trang của Đại học British Columbia, Canada)
Ngày Phần mềm Tự do, Ngày Phần cứng tự do, Ngày Tài liệu Tự do
‘Khung năng lực AI cho giáo viên’ - bản dịch sang tiếng Việt
Bạn cần biết những gì về các khung năng lực AI mới của UNESCO cho học sinh và giáo viên
Bàn về 'Lợi thế của doanh nghiệp Việt là dữ liệu Việt, bài toán Việt' - bài phát biểu của Bộ trưởng Nguyễn Mạnh Hùng ngày 21/08/2025
Các bài trình chiếu trong năm 2024
Triển khai Khuyến nghị Khoa học Mở của UNESCO, cập nhật 15/10/2024
Các tài liệu dịch sang tiếng Việt tới hết năm 2024
‘Tài liệu quan điểm của KR21 về Giữ lại Quyền Tác giả: Giữ lại các quyền trong kết quả đầu ra nghiên cứu để cho phép phổ biến mở kiến thức’ - bản dịch sang tiếng Việt
‘LƯU Ý KHÁI NIỆM: Hội nghị Tài nguyên Giáo dục Mở Thế giới lần 3 năm 2024 của UNESCO “Tài sản Công cộng Kỹ thuật số: Giải pháp Mở và AI vì Quyền truy cập Toàn diện tới Tri thức”’ - bản dịch sang tiếng Việt
Tập huấn thực hành ‘Khai thác tài nguyên giáo dục mở’ cho giáo viên phổ thông, bao gồm cả giáo viên tiểu học và mầm non tới hết năm 2024
‘KHUYẾN NGHỊ VÀ HƯỚNG DẪN TRUY CẬP MỞ KIM CƯƠNG cho các cơ sở, nhà cấp vốn, nhà bảo trợ, nhà tài trợ, và nhà hoạch định chính sách’ - bản dịch sang tiếng Việt
DeepSeek đã gây ra sự hoảng loạn trên thị trường — nhưng một số người cho rằng việc bán tháo là quá mức
Dữ liệu để phân loại AI
“Chúng tôi không có hào nước”: Sự đổi mới đột phá của AI nguồn mở
Ứng dụng và phát triển Tài nguyên Giáo dục Mở (OER) tại Việt Nam
Nhà khoa học AI hàng đầu của Meta cho biết thành công của DeepSeek cho thấy 'các mô hình nguồn mở đang vượt trội hơn các mô hình độc quyền'