Bài 8 - Làm quen nắm bắt các nền tảng

Thứ hai - 16/03/2020 04:40
Bài 8 - Làm quen nắm bắt các nền tảng

Làm quen nắm bắt các nền tảng

Nền tảng là mẩu phần mềm chính trên đó các mẩu phần mềm nhỏ hơn và nội dung có thể chạy được. Đối với dữ liệu mở, nền tảng lớn nhất là Web. Tuy nhiên, nhiều phần mềm được xây dựng theo các mục đích khác nhau có thể giúp bạn xuất bản dữ liệu mở, hoặc cung cấp các công cụ tương tác để giúp bạn khai thác nó.
Trong bài này chúng ta sẽ khai thác những điều sau:
  • Nhận biết các nền tảng dữ liệu mở
  • Hiểu vì sao các nền tảng là quan trọng đối với những người sử dụng
  • Đánh giá các lựa chọn nền tảng chính
  • Sử dụng các nền tảng để khai thác dữ liệu
 

Các nền tảng dữ liệu mở – trong 2 phút

Giảng viên David Tarrant của ODI giải thích các nền tảng dữ liệu mở là gì, các nền tảng khác nhau sẵn sàng và các ưu điểm của các nền tảng đó cho những người sử dụng.
Nền tảng dữ liệu mở là gì?
Các nền tảng dữ liệu mở là các mẩu phần mềm làm cho đơn giản hơn để xuất bản và quản lý dữ liệu mở trên Web.
Đối với các nhà xuất bản, nền tảng dữ liệu mở cung cấp cách thức để xuất bản dữ liệu. Các nền tảng hướng dẫn cho các nhà xuất bản quy trình xuất bản dữ liệu, và chào cho những người sử dụng sự nhất quán và dễ dàng truy cập được tới dữ liệu mở từ khắp trên thế giới.

Các đặc tính chính của các nền tảng dữ liệu mở

Các nền tảng dữ liệu mở làm cho dữ liệu phát hiện đượcsử dụng được theo một cách thức nhất quán.

Dữ liệu phát hiện được

Các nền tảng dữ liệu mở quảng bá dữ liệu mở tới những người sử dụng. Các nền tảng được thiết kế để cho phép những người sử dụng nhanh chóng tìm ra và sử dụng lại dữ liệu mở thích hợp.
Các nền tảng được tối ưu hóa để tìm kiếm làm cho dễ dàng hơn để tìm ra các tài nguyên thích hợp. Các nền tảng cũng cung cấp các bộ cấp dữ liệu (datafeeds) có thể được phát hiện và được đánh chỉ mục trong các hệ thống khắp trên Web.
Các bộ cấp dữ liệu đó cho phép các máy tìm kiếm như Enigma.io đánh chỉ mục cho dữ liệu mở và làm cho dễ dàng hơn để tìm ra.
 

Kinh nghiệm nhất quán của người sử dụng

 
Có số lượng có giới hạn các nền tảng dữ liệu mở, ngụ ý bạn không cần hiểu nhiều về các công nghệ khác nhau để phát hiện lượng lớn các dữ liệu mở.
Các nền tảng dữ liệu mở được thiết kế với người sử dụng trong đầu - trình bày và thiết kế của chúng có thể làm dễ dàng hơn để phát hiện ra dữ liệu.
Các ví dụ các trang sử dụng các nền tảng dữ liệu mở, hãy xem tại: data.gov.uk, africaopendata.orgdata.gov.md. Lưu ý là nhiều chính phủ sử dụng quy ước đặt tên tiêu chuẩn cho địa chỉ Web của nền tảng dữ liệu, vì thế điểm khởi đầu đơn giản để tìm kiếm dữ liệu mở đối với một quốc gia là đi vào data.gov. [miền mức cao nhất của một quốc gia].

Truy cập nhất quán tới dữ liệu

Sự phát triển các tiêu chuẩn mở bởi cộng đồng Web đã dẫn tới các Giao diện Lập trình Ứng dụng - APIs (Application Programming Interfaces) nhất quán cho việc phát hiện, truy cập và sử dụng dữ liệu.
Số lượng có giới hạn các nền tảng dữ liệu mở và các đặc tính nhất quán của chúng làm dễ dàng cho mọi người để sử dụng các đặc tính khác nhau trong khi cảm thấy thuận tiện với các phần mềm đó.
Các nền tảng đó cũng có các cấu trúc và định dạng tương tự cho việc phơi lộ siêu dữ liệu, cũng như bản thân dữ liệu đó.

Các tiếp cận thiết kế nền tảng dữ liệu mở

Các nền tảng cung cấp các tiếp cận khác nhau để xuất bản và phơi lộ dữ liệu mở. Hãy phát hiện các tiếp caanhj khác nhau đó bên dưới:

Các catalog dữ liệu

Catalog dữ liệu mở là nền tảng liệt kê các tập hợp dữ liệu trên Web. Các catalog dữ liệu là giống như các thư mục. Chúng biết dữ liệu mở nào đang có, về cái gì, nằm ở đâu và làm thế nào để nắm giữ nó.
Catalog dữ liệu mở liên kết những người sử dụng với dữ liệu nằm ở đâu đó trên Web. Chúng chào cách thức nhất quán để định vị tập hợp đa dạng các dữ liệu nằm rải rác rộng khắp.
Nền tảng CKAN, được những nơi như Amsterdam (Xem cổng CKAN của Amsterdam), Berlin (Xem cổng CKAN của Berlin) và Copenhagen (Xem cổng CKAN của Copenhagen) sử dụng, có thể được sử dụng như là catalog dữ liệu.

Quản lý dữ liệu

Các nền tảng quản lý dữ liệu mở cũng có thể đóng vai trò tích cực trong cách thức một nhà xuất bản quản lý và duy trì một tập hợp dữ liệu. Các nhà xuất bản có thể cập nhật dữ liệu trực tiếp trên nền tảng đó và thường xuyên cung cấp các bản cập nhật.
Đối với những người sử dụng, việc tìm kiếm và điều khiển dữ liệu mở không phải tải nó về có thể sử dụng lại nó dễ dàng hơn nhiều.
Tuy nhiên đối với các nhà xuất bản, có thách thức lớn hơn nhiều trong xây dựng và định dạng dữ liệu cho nền tảng đó. Điều này có thể vượt qua được nếu nhà xuất bản đó cũng sử dụng nền tảng xuất bản đó để truy cập dữ liệu đó.
Nền tảng Socrata, được vùng Lombardy của nước Ý sử dụng (Xem cổng dữ liệu mở của Lombardy), và nền tảng Open Data Soft được thành phố Issy-les-Moulineaux ở Pháp sử dụng (Xem cổng dữ liệu mở của Issy) là các ví dụ tốt về các nền tảng quản lý dữ liệu.

So sánh

Các catalog dữ liệu cung cấp:
  • Tìm kiếm liên đoàn xuyên khắp miền rộng lớn
  • Các cơ chế để phát hiện.
  • Siêu dữ liệu chính có liên quan tới giấy phép và dữ liệu được cập nhật như thế nào.
 
 
Các nền tảng quản lý dữ liệu cung cấp:
  • Các nguồn dữ liệu có thẩm quyền.
  • Chất lượng dữ liệu được nâng cao.
  • Khả năng tìm kiếm và điều khiển dữ liệu.
 
Những khác biệt giữa các nền tảng quản lý dữ liệu và các catalog dữ liệu cũng có thể khác nhau giữa các nhà cung cấp. Xem phân tích đối sánh các nền tảng dữ liệu

Các nền tảng dữ liệu mở khắp châu Âu

Châu Âu là nhà của hàng trăm nền tảng dữ liệu mở ở mức địa phương, vùng và quốc gia. Khi tìm kiếm dữ liệu mở, có thể hữu dụng để truy cập thư mục các nền tảng đó để giúp bạn định vị các nguồn dữ liệu nào là sẵn sàng. Dự án OpenDataMonitor là sự đánh chỉ mục của châu Âu các trang dữ liệu mở và cung cấp hướng dẫn tham chiếu hữu dụng. Vì sao không khai thác sự đánh chỉ mục đó để phát hiện dữ liệu nào là sẵn sàng đối với các quốc gia, vùng và thành phố khác nhau?
Bạn sẵn sàng khai thác các nền tảng dữ liệu mở?
Có 3 điều hữu ích để nhớ khi nghĩ về các nền tảng dữ liệu mở. Bạn nhớ chúng chứ?
Nền tảng dữ liệu mở là gì?
Nền tảng dữ liệu mở là...
  • nền tảng bán hàng cho các doanh nghiệp
  • mẩu phần mềm giúp có được dữ liệu mở trên Web
  • công cụ quản lý dữ liệu nội bộ

 
Đáp án đúng!
Nền tảng dữ liệu mở là mẩu phần mềm giúp có được dữ liệu mở trên Web. Nó cung cấp cho các nhà xuất bản quy trình được hợp lý hóa để xuất bản dữ liệu và cho những người sử dụng cách thức nhất quán để truy cập, sử dụng và chia sẻ dữ liệu.
Bạn chắc chắn chứ?
Nền tảng dữ liệu mở là mẩu phần mềm giúp có được dữ liệu mở trên Web. Nó cung cấp cho các nhà xuất bản quy trình được hợp lý hóa để xuất bản dữ liệu và cho những người sử dụng cách thức nhất quán để truy cập, sử dụng và chia sẻ dữ liệu.
Catalog dữ liệu là gì?
Catalog dữ liệu là...
  • danh sách các tập hợp dữ liệu mở sẵn sàng trên Web
  • danh sách các tập hợp dữ liệu mở một tổ chức nắm giữ
  • danh sách các tập hợp dữ liệu và giá thành

 
Đáp án đúng!
Catalog dữ liệu liệt kê các tập hợp dữ liệu là sẵn sàng trên Web, chúng tất cả không thuộc sở hữu của người chủ sở hữu của catalog đó. Hầu hết các catalog là đặc thù theo chủ đề hoặc lĩnh vực để duy trì ngữ cảnh đơn giản hơn để hiểu.
 
Bạn chắc chắn chứ?
Catalog dữ liệu liệt kê các tập hợp dữ liệu là sẵn sàng trên Web, chúng tất cả không thuộc sở hữu của người chủ sở hữu của catalog đó. Hầu hết các catalog là đặc thù theo chủ đề hoặc lĩnh vực để duy trì ngữ cảnh đơn giản hơn để hiểu.
 
3 điều nào các nền tảng dữ liệu mở trợ giúp?
Hãy chọn 3 lựa chọn
  • tạo thuận lợi để phát hiện dữ liệu mở
  • cung cấp ngữ cảnh
  • đảm bảo sự nhất quán
  • xây dựng cộng đồng
  • hỗ trợ truy cập dữ liệu mở

 
Đáp án đúng!
3 lợi ích chính của các nền tảng dữ liệu mở là khám phá, nhất quántruy cập. Dù chúng có thể hỗ trợ bằng việc thiết lập ngữ cảnh và cộng đồng, các khía cạnh đó đòi hỏi nỗ lực bổ sung từ nhà xuất bản và vẫn là 2 thách thức chính trong dữ liệu mở.
Bạn chắc chắn chứ?
3 lợi ích chính của các nền tảng dữ liệu mở là khám phá, nhất quántruy cập. Dù chúng có thể hỗ trợ bằng việc thiết lập ngữ cảnh và cộng đồng, các khía cạnh đó đòi hỏi nỗ lực bổ sung từ nhà xuất bản và vẫn là 2 thách thức chính trong dữ liệu mở.

Các nền tảng dữ liệu mở

Các nền tảng dữ liệu mở là các mẩu phần mềm làm cho đơn giản hơn để xuất bản và quản lý dữ liệu mở trên Web.
Đối với các nhà xuất bản, nền tảng dữ liệu mở cung cấp cách thức để xuất bản dữ liệu, hướng dẫn họ qua suốt quy trình đó.
Đối với những người sử dụng, các nền tảng có thể giúp làm cho dữ liệu mở từ khắp trên thế giới nhất quán và dễ dàng truy cập được.

 
Dịch: Lê Trung Nghĩa
letrungnghia.foss@gmail.com

Tổng số điểm của bài viết là: 0 trong 0 đánh giá

Click để đánh giá bài viết

  Ý kiến bạn đọc

Những tin mới hơn

Những tin cũ hơn

Về Blog này

Blog này được chuyển đổi từ http://blog.yahoo.com/letrungnghia trên Yahoo Blog sang sử dụng NukeViet sau khi Yahoo Blog đóng cửa tại Việt Nam ngày 17/01/2013.Kể từ ngày 07/02/2013, thông tin trên Blog được cập nhật tiếp tục trở lại với sự hỗ trợ kỹ thuật và đặt chỗ hosting của nhóm phát triển...

Bài đọc nhiều nhất trong năm
Thăm dò ý kiến

Bạn quan tâm gì nhất ở mã nguồn mở?

Thống kê truy cập
  • Đang truy cập102
  • Máy chủ tìm kiếm2
  • Khách viếng thăm100
  • Hôm nay22,193
  • Tháng hiện tại686,504
  • Tổng lượt truy cập36,745,097
Bạn đã không sử dụng Site, Bấm vào đây để duy trì trạng thái đăng nhập. Thời gian chờ: 60 giây