Điều gì tạo nên dữ liệu mở chất lượng
Đánh giá dữ liệu mở hữu dụng như thế nào không thể được làm nhanh.
Có một số tiêu chuẩn và dấu chất lượng dựa vào cộng đồng có thể giúp bạn đánh giá dữ liệu hữu dụng như thế nào.
Trong bài này chúng ta khai thác những điều sau:
-
Điều gì tạo lên dữ liệu hữu dụng
-
Các tiêu chuẩn giúp gia tăng khả năng sử dụng dữ liệu như thế nào
-
Đánh dấu chất lượng
Đánh giá chất lượng của dữ liệu mở - trong 2 phút
Giảng viên David Tarrant của ODI giải thích dữ liệu chất lượng là gì, cách nhận biết nó và các dấu chất lượng nào những người tiêu dùng dữ liệu mở nên tìm kiếm.
Chất lượng dữ liệu mở là gì?
Dữ liệu mở trở nên hữu dụng khi con người có thể hiểu nó và máy có thể điều khiển nó.
Những người sử dụng dữ liệu mở cần sự cho phép của nhà xuất bản của nó, được trao bằng một giấy phép mở. Nhưng một mình giấy phép mở đó là không đủ để đảm bảo tính hữu dụng của dữ liệu.
Là không có khả năng mọi người sẽ có thể tham gia với dữ liệu để từ đó rút ra được sự thấu hiểu và thể hiện những lợi ích trừ phi nó là hữu dụng.
Các tiêu chuẩn do cộng đồng dẫn dắt
Các tiêu chuẩn do cộng đồng dẫn dắt xác định các yêu cầu pháp lý, thực hành, kỹ thuật và xã hội cho tập hợp dữ liệu để trở thành hữu dụng.
Các yêu cầu pháp lý
Ngoài giấy phép mở ra, có 3 yêu cầu pháp lý cần được cân nhắc: Bạn phải:
-
Bảo vệ thông tin nhạy cảm như dữ liệu cá nhân.
-
Giữ lại các quyền của chủ sở hữu dữ liệu.
-
Thúc đẩy sử dụng đúng dữ liệu đó.
Các yêu cầu thực hành
Là quan trọng rằng dữ liệu mở có thể được những người sử dụng tìm thấy và tin tưởng.
Điều này ngụ ý rằng các nhà xuất bản dữ liệu mở phải:
-
Liên kết tới dữ liệu đó từ website của họ.
-
Cập nhật dữ liệu thường xuyên nếu nó thay đổi.
-
Cam kết tiếp tục làm cho dữ liệu đó sẵn sàng.
Các yêu cầu kỹ thuật
Có 3 khuyến cáo xác định các khía cạnh kỹ thuật của dữ liệu mở:
-
Định dạng theo đó dữ liệu được xuất bản.
-
Cấu trúc của dữ liệu đó.
-
Các kênh qua đó dữ liệu đó là sẵn sàng.
Các yêu cầu xã hội
Để sử dụng dữ liệu là bền vững, là quan trọng để có cộng đồng những người sử dụng tham gia. Các tập hợp dữ liệu tốt nhất có:
-
Các kênh hỗ trợ tích cực.
-
Các nhóm thảo luận và diễn đàn.
-
Các hướng dẫn cách làm được xuất bản để làm việc với các dữ liệu đó.
Các dấu chất lượng
Các dấu chất lượng cung cấp cho những người sử dụng sự tin cậy về chất lượng và khả năng sử dụng dữ liệu mở.
Có 2 chỉ số chính về chất lượng dữ liệu mở:
5 Sao (5 Stars)
‘5 Sao của dữ liệu mở liên kết’ (5 Stars of linked open data) bao gồm định nghĩa pháp lý cơ bản và sự xuất sắc về kỹ thuật của dữ liệu được xuất bản đó.
5 Sao đã được nhà phát minh ra Web, Ngài Tim Berners-Lee phát triển, vào năm 2001. Nguyên tắc 5 sao đó tạo ra các khuyến cáo về định dạng và cấu trúc của dữ liệu.
Các chứng chỉ Dữ liệu Mở của ODI
Các chứng chỉ Dữ liệu Mở của Viện Dữ liệu Mở là các hướng dẫn thực hành, xã hội, pháp lý để cẩn nhắc khi xuất bản hoặc sử dụng dữ liệu mở.
Các chứng chỉ đó hành động như là bảng câu hỏi tự đánh giá cho các nhà xuất bản, và trong một vài trường hợp cho những người sử dụng, để đánh giá và đo lường tính khả dụng đầy đủ của tập hợp dữ liệu.
Bạn sẵn sàng cho dữ liệu mở chất lượng?
Bạn có thể nhớ lại các yêu cầu thực hành, kỹ thuật, pháp lý và xã hội cho tập hợp dữ liệu mở để trở thành hữu dụng chứ?
Dữ liệu mở chất lượng là gì?
Dữ liệu mở trở nên hữu dụng khi ...
-
nó được nhập khẩu vào hệ thống của chúng ta
-
con người có thể hiểu nó, máy có thể điều khiển nó và nó có giấy phép mở
-
chính phủ xuất bản nó
Đáp án đúng!
Dữ liệu mở trở nên hữu dụng khi con người có thể hiểu nó, máy có thể điều khiển nó và nó được làm cho sẵn sàng theo một giấy phép mở.
Bạn chắc chắn chứ?
Dữ liệu mở trở nên hữu dụng khi con người có thể hiểu nó, máy có thể điều khiển nó và nó được làm cho sẵn sàng theo một giấy phép mở.
Các cân nhắc pháp lý
Có 3 cân nhắc pháp lý như một phần của các tiêu chuẩn để xuất bản dữ liệu mở, một trong số đó là...
-
không phá vỡ luật cấp phép
-
xuất bản bất kỳ dạng dữ liệu nào
-
bảo vệ thông tin nhạy cảm như dữ liệu cá nhân
Đáp án đúng!
Ngoài một giấy phép mở ra, có 3 yêu cầu pháp lý cần phải được xem xét. Bảo vệ thông tin nhạy cảm như dữ liệu cá nhân, giữ lại các quyền của các chủ sở hữu dữ liệu và thúc đẩy sử dụng đúng dữ liệu đó.
Bạn chắc chắn chứ?
Ngoài một giấy phép mở ra, có 3 yêu cầu pháp lý cần phải được xem xét. Bảo vệ thông tin nhạy cảm như dữ liệu cá nhân, giữ lại các quyền của các chủ sở hữu dữ liệu và thúc đẩy sử dụng đúng dữ liệu đó.
Các cân nhắc kỹ thuật
Có 3 cân nhắc kỹ thuật như một phần của các tiêu chuẩn để xuất bản dữ liệu mở, một trong số đó là ...
-
ở định dạng nào dữ liệu mở đó được xuất bản
-
liệu nó có thể được sử dụng trên một máy tính hay không
-
liệu nó có chiếm nhiều băng thông rộng hay không
Đáp án đúng!
Có 3 khuyến cáo xác định các khía cạnh kỹ thuật của dữ liệu mở. Định dạng ở đó dữ liệu được xuất bản, cấu trúc dữ liệu đó và các kênh qua đó dữ liệu là sẵn sàng.
Bạn chắc chắn chứ?
Có 3 khuyến cáo xác định các khía cạnh kỹ thuật của dữ liệu mở. Định dạng ở đó dữ liệu được xuất bản, cấu trúc dữ liệu đó và các kênh qua đó dữ liệu là sẵn sàng.
Các dấu chất lượng
Viện Dữ liệu Mở biện hộ cho sử dụng dấu chất lượng của riêng nó được biết như...
-
Các Chứng chỉ Dữ liệu Mở
-
Dấu màu xanh lá cây lớn của ODI
-
Dấu phê chuẩn của ODI
Đáp án đúng!
Viện Dữ liệu Mở đã phát triển các Chứng chỉ Dữ liệu Mở bao gồm các yêu cầu thực hành và xã hội cùng với các hướng dẫn sâu về pháp lý và kỹ thuật để cân nhắc khi xuất bản dữ liệu mở.
Bạn chắc chắn chứ?
Viện Dữ liệu Mở đã phát triển các Chứng chỉ Dữ liệu Mở bao gồm các yêu cầu thực hành và xã hội cùng với các hướng dẫn sâu về pháp lý và kỹ thuật để cân nhắc khi xuất bản dữ liệu mở.
Các tiêu chuẩn + các dấu = dữ liệu mở chất lượng
Dữ liệu mở trở nên hữu dụng khi con người có thể hiểu nó và máy có thể điều khiển nó.
Cả 2 điều đó đòi hỏi sự cho phép của nhà xuất bản, được trao qua giấy phép mở. Tuy nhiên, một mình giấy phép mở đó là không đủ để đảm bảo tính khả dụng của dữ liệu. Đơn giản đặt một tệp lên website với một giấy phép mở không tạo nên dữ liệu mở.
Là không có khả năng những người sử dụng sẽ có thể tham gia đúng với dữ liệu không sử dụng được để dẫn xuất những thấu hiểu và thể hiện những lợi ích.
Trong bài tiếp sau, chúng ta so sánh các sáng kiến dữ liệu mở và xem xét các chỉ số năng suất chính của các sáng kiến thành công.
Về bài trước ………. Tới bài sau
Dịch: Lê Trung Nghĩa