Open / FAIR Data
Theo: https://sparceurope.org/what-we-do/open-data/
Trong kỷ nguyên số, dữ liệu là vật liệu thô dựa vào đó các phát hiện được xây dựng, và quyền truy cập không có ràng buộc tới dữ liệu nghiên cứu, dù trong Khoa học Đời sống hay Khoa học Xã hội. Là rất quan trọng để tăng tốc sự tiến bộ trong nghiên cứu. Dữ liệu đóng vai trò trung tâm trong khả năng của chúng ta để giúp giải quyết cuộc khủng hoảng Coronavirus, dự báo trước và đối phó chống các thảm họa tự nhiên, để hiểu sinh học của con người, hoặc để phát triển các tiến bộ trong công nghệ điện toán.
Bất kể tầm quan trọng khổng lồ của nó, ngày nay, dữ liệu nghiên cứu phần lớn vẫn bị phân mảnh - bị cô lập khắp hàng triệu máy tính cá nhân, bị khóa bởi các hạn chế khác nhau về kỹ thuật, pháp lý và tài chính.
Lượng dữ liệu khoa học và học thuật tăng trưởng theo số mũ mỗi năm, chúng ta vẫn còn thiếu hạ tầng, các chính sách và thực hành để khai thác nguồn rất quan trọng này. Trong khi vài dự án nổi tiếng — ví dụ như Dự án Gen của con người và Máy va đập Hạt Lớn (Large Hadron Collider) — làm cho dữ liệu của chúng sẵn sàng mở, rất thường thấy dữ liệu không được chia sẻ ngoài những người đã tạo ra nó. Internet đã được các nhà nghiên cứu xây dựng để chia sẻ dữ liệu, nhưng việc chia sẻ dữ liệu còn chưa là chuẩn mục trong nghiên cứu. Dữ liệu nghiên cứu cũng cần phải là Tìm thấy được, Truy cập được, Tương hợp được, Sử dụng lại được - FAIR (Findable, Accessible, Interoperable or Reusable).
Khoảng trống khổng lồ giữa những gì là có thể với công nghệ số và hạ tầng lỗi thời của chúng ta đã dẫn tới lời kêu gọi về Dữ liệu Mở.
Những lợi ích của Dữ liệu Mở và dữ liệu FAIR là rõ ràng (bản dịch sang tiếng Việt).
In the digital age, data is the raw material on which discoveries are built, and unfettered access to research data, whether in the Life Sciences or the Social Sciences. It is crucial to accelerating progress in research. Data plays a central role in our ability to help solve the Coronavirus crisis, predict and counter natural disasters, to understand human biology, or to develop advances in computing technology.
Despite its tremendous importance, today, research data remains largely fragmented—isolated across millions of individual computers, blocked by disparate technical, legal and financial restrictions.
The amount of scientific and scholarly data grows exponentially each year, yet we still lack the infrastructure, policies, and practices to harness this vital resource. While some high profile projects—such as the Human Genome Project and the Large Hadron Collider—make their data openly accessible, too often data isn’t shared beyond those who generate it. The Internet was built by researchers to share data, but data sharing isn’t yet the norm in research. Research data also needs to be FAIR (Findable, Accessible, Interoperable or Reusable).
The tremendous gap between what is possible with digital technology and our outdated infrastructure has led to the call for Open Data.
The benefits of Open and FAIR Data are clear.
Dịch: Lê Trung Nghĩa
letrungnghia.foss@gmail.com
Tác giả: Nghĩa Lê Trung
Ý kiến bạn đọc
Những tin mới hơn
Những tin cũ hơn
Blog này được chuyển đổi từ http://blog.yahoo.com/letrungnghia trên Yahoo Blog sang sử dụng NukeViet sau khi Yahoo Blog đóng cửa tại Việt Nam ngày 17/01/2013.Kể từ ngày 07/02/2013, thông tin trên Blog được cập nhật tiếp tục trở lại với sự hỗ trợ kỹ thuật và đặt chỗ hosting của nhóm phát triển...
Các bài trình chiếu trong năm 2024
Tập huấn thực hành ‘Khai thác tài nguyên giáo dục mở’ cho giáo viên phổ thông, bao gồm cả giáo viên tiểu học và mầm non tới hết năm 2024
Các lớp tập huấn thực hành ‘Khai thác tài nguyên giáo dục mở’ tới hết năm 2024
Các tài liệu dịch sang tiếng Việt tới hết năm 2024
‘Digcomp 2.2: Khung năng lực số cho công dân - với các ví dụ mới về kiến thức, kỹ năng và thái độ’, EC xuất bản năm 2022
Tổng hợp các bài của Nhóm các Nhà cấp vốn Nghiên cứu Mở (ORFG) đã được dịch sang tiếng Việt
Tổng hợp các bài của Liên minh S (cOAlition S) đã được dịch sang tiếng Việt
Năm Khoa học Mở & Chuyển đổi sang Khoa học Mở - Tổng hợp các bài liên quan
Hội nghị Đối tác Dữ liệu Mở châu Á năm 2021 do Việt Nam lần đầu tiên chủ trì
Các khung năng lực trong hành động
Phong trào Bình dân học vụ số: Mục tiêu, đối tượng, nội dung, nguồn lực, phương thức tổ chức thực hiện
Lễ công bố công khai Trung tâm Năng lực Kim cương châu Âu và dự án ALMASI
Khung năng lực AI cho giáo viên
Sư phạm Mở là gì (Trang của Đại học British Columbia, Canada)
Ngày Phần mềm Tự do, Ngày Phần cứng tự do, Ngày Tài liệu Tự do
‘Khung năng lực AI cho giáo viên’ - bản dịch sang tiếng Việt
Bạn cần biết những gì về các khung năng lực AI mới của UNESCO cho học sinh và giáo viên
Bàn về 'Lợi thế của doanh nghiệp Việt là dữ liệu Việt, bài toán Việt' - bài phát biểu của Bộ trưởng Nguyễn Mạnh Hùng ngày 21/08/2025
Các tài liệu dịch sang tiếng Việt tới hết năm 2024
Các bài trình chiếu trong năm 2024
‘Tài liệu quan điểm của KR21 về Giữ lại Quyền Tác giả: Giữ lại các quyền trong kết quả đầu ra nghiên cứu để cho phép phổ biến mở kiến thức’ - bản dịch sang tiếng Việt
‘KHUYẾN NGHỊ VÀ HƯỚNG DẪN TRUY CẬP MỞ KIM CƯƠNG cho các cơ sở, nhà cấp vốn, nhà bảo trợ, nhà tài trợ, và nhà hoạch định chính sách’ - bản dịch sang tiếng Việt
DeepSeek đã gây ra sự hoảng loạn trên thị trường — nhưng một số người cho rằng việc bán tháo là quá mức
Tập huấn thực hành ‘Khai thác tài nguyên giáo dục mở’ cho giáo viên phổ thông, bao gồm cả giáo viên tiểu học và mầm non tới hết năm 2024
“Chúng tôi không có hào nước”: Sự đổi mới đột phá của AI nguồn mở
Dữ liệu để phân loại AI
Ứng dụng và phát triển Tài nguyên Giáo dục Mở (OER) tại Việt Nam
Nhà khoa học AI hàng đầu của Meta cho biết thành công của DeepSeek cho thấy 'các mô hình nguồn mở đang vượt trội hơn các mô hình độc quyền'
‘Tầm quan trọng của các kỹ năng tư duy phản biện và linh hoạt về năng lực AI của sinh viên TVET’ - bản dịch sang tiếng Việt
Mark Zuckerberg: DeepSeek cho thấy vì sao nước Mỹ phải là ‘tiêu chuẩn nguồn mở toàn cầu’ của AI; không có lý do gì để suy nghĩ lại về việc chi tiêu