Chỉ dẫn của người sử dụng lại về cấp phép dữ liệu mở

Thứ tư - 14/02/2018 07:23
Reuser's Guide to Open Data Licensing
Theo: https://theodi.org/guides/reusers-guide-open-data-licensing
Xem thêm: Dữ liệu Mở Liên kết - LOD (Linked Open Data)
Thực tế bạn có thể nắm giữ vài thông tin không nhất thiết ngụ ý bạn có thể làm bất kỳ điều gì bạn muốn với nó. Bạn cần có sự cho phép từ chủ sở hữu thông tin đó để làm những gì bạn muốn làm. Một giấy phép nói cho bạn những gì bạn có thể làm.
Nhưng cấp phép cho dữ liệu ngụ ý gì? Các yêu cầu nào một giấy phép có thể đặt ra cho bạn? Các giấy phép khác nhau nào cho các nhà xuất bản để sử dụng? Làm thế nào bạn có thể tìm ra giấy phép đang được gắn vào một tập hợp dữ liệu là sẵn sàng. Chỉ dẫn này trả lời cho các câu hỏi đó.
Lưu ý: Chỉ dẫn này tập trung vào dữ liệu được các tổ chức có trụ sở ở Vương quốc Anh xuất bản. Luật cấp phép là khác nhau ở các quốc gia khác nhau, vì thế vài thông tin này có thể không áp dụng được cho bạn nếu bạn đang sử dụng lại thông tin được xuất bản ở đâu đó khác. Nó không đề cập tới các cân nhắc pháp lý tiềm tàng khác, như sự tuân thủ với Luật Bảo vệ Dữ liệu (Data Protection Act).
Cấp phép là gì?
Khi ai đó đặt sự quan tâm và suy nghĩ vào việc tạo ra thứ gì đó, như viết bài trên blog hoặc chụp ảnh, họ sở hữu tác phẩm đó. Điều này ngụ ý họ có quyền xác định cách nó được sử dụng.
Nếu bạn muốn sử dụng nội dung hoặc dữ liệu, bạn hoặc phải hiểu rõ họ không còn có các quyền đối với tác phẩm đó (vì họ đã từ bỏ chúng), hoặc hỏi sự cho phép của họ để sử dụng nó. Các giấy phép là cách họ rõ ràng trao cho bạn sự cho phép để sử dụng tác phẩm của họ.
Các nhà xuất bản sở hữu cái gì?
Ở châu Âu, có 2 dạng quyền mà các nhà xuất bản - các tổ chức hoặc cá nhân làm cho nội dung hoặc dữ liệu sẵn sàng - được trao cho các tác phẩm họ đã tạo ra:
  • họ có bản quyền (copyright) đối với các tác phẩm (nội dung – content) họ tạo ra và nó là bản gốc đối với họ, như văn bản họ viết hoặc các ảnh họ chụp
  • họ có quyền cơ sở dữ liệu (database right) đối với các bộ sưu tập dữ liệu (data) họ đã có nỗ lực đáng kể để có, thẩm định hoặc trình bày
Lưu ý: Theo chúng tôi biết quyền cơ sở dữ liệu là độc nhất với Liên minh châu Âu. Ở một số quốc gia có lẽ không có sự bảo vệ cho các bộ sưu tập dữ liệu.
Nếu ai đó áp dụng phán xét gốc trong việc đặt ra một cơ sở dữ liệu, ví dụ trong việc chọn các hạng mục nào để đưa vào trong cơ sở dữ liệu đó hoặc thông tin nào về chúng để đưa vào, thì họ có bản quyền đối với cơ sở dữ liệu đó, vì nó là tác phẩm sáng tạo.
Ví dụ, nếu ai đó đã xây dựng một cơ sở dữ liệu về 100 chiếc ô tô tốt nhất, thì điều này có thể có liên quan:
  • việc chọn các ô tô nào được tính như là các ô tô tốt nhất
  • viết mô tả về từng ô tô
  • nghiên cứu và thu thập các số liệu về chúng
Họ muốn có bản quyền đối với cơ sở dữ liệu đó, vì họ chọn các ô tô nào là “tốt nhất”. Họ muốn có bản quyền đối với các mô tả, vì họ đã viết chúng. Và họ có lẽ muốn có quyền cơ sở dữ liệu cho cơ sở dữ liệu họ đã xây dựng, vì họ đã nỗ lực trong việc thu thập thông tin về chúng. Quan trọng, họ không sở hữu các số liệu về các ô tô - bạn hoặc bất kỳ ai khác cũng có thể xây dựng cơ sở dữ liệu của riêng bạn gồm chính xác các số liệu đó mà không vi phạm quyền cơ sở dữ liệu của họ - nhưng không ai khác có thể sử dụng lại cơ sở dữ liệu của họ hoặc các mô tả của họ mà không có sự cho phép của họ vì họ sở hữu bản quyền đối với chúng.
Các nhà xuất bản có lẽ không có quyền cơ sở dữ liệu nếu họ tạo ra các số liệu trong một cơ sở dữ liệu, ngược lại với việc thu thập chúng từ đâu đó khác, trừ phi họ có nỗ lực đáng kể trong việc thẩm định hoặc trình bày cơ sở dữ liệu đó. Ví dụ, nếu ai đó sở hữu một nhà hàng và tạo ra một cơ sở dữ liệu các món ăn họ chào và khi họ chào chúng, họ có lẽ không có quyền cơ sở dữ liệu đối với cơ sở dữ liệu đó, dù họ có lẽ có bản quyền vì phán xét có tính sáng tạo có liên quan trong việc nhận diện các món ăn nào cần phải được chào vào những ngày đặc biệt để cung cấp thực đơn cân xứng.
Thế còn dữ liệu từ các bên thứ 3?
Các nhà xuất bản có thể không sở hữu tất cả nội dung hoặc dữ liệu bản thân họ xuất bản. Đặc biệt, thay vì tự bản thân họ tạo nội dung hoặc thu thập dữ liệu, vài trong số các nội dung và dữ liệu họ xuất bản có thể:
  • hoàn toàn được họ cấp phép từ ai đó khác
  • bao gồm sự trích xuất nội dung hoặc dữ liệu họ đã cấp phép từ ai đó khác
  • được dẫn xuất từ nội dung hoặc dữ liệu họ đã cấp phép từ ai đó khác
Khi họ xuất bản dữ liệu, nhà xuất bản cần nói cho bạn về nội dung hoặc dữ liệu nào được tổ chức khác sở hữu, và theo giấy phép nào nó đang được xuất bản lại.
Thế còn về nhãn hiệu thì sao?
Các nhãn hiệu thường được bảo vệ thông qua thương hiệu (trade mark). Thương hiệu hạn chế cách thức bạn có thể sử dụng logo của một tổ chức hoặc tên công ty. Họ cũng sẽ có bản quyền về logo đó.
Các giấy phép cho nội dung hoặc dữ liệu thường loại trừ rõ ràng các logo và các tên công ty, nên bạn không thể, ví dụ, tùy biến thích nghi logo bằng việc thay đổi màu sắc được sử dụng với nó .Bạn cũng không thể sử dụng tên công ty hoặc logo để mượn danh cho sản phẩm của bạn mà không có sự cho phép làm như vậy. Tuy nhiên, các yêu cầu ghi công của giấy phép có thể đòi hỏi bạn sử dụng tên và logo công ty để chỉ định bạn đã sử dụng lại dữ liệu được công ty đó sở hữu.
Những gì bạn không thể làm?
Có ít điều bạn có thể làm với nội dung hoặc dữ liệu mà không cần giấy phép, nhưng nói chung bạn cần được nhà xuất bản trao giấy phép nếu bạn muốn sử dụng lại nội dung hoặc dữ liệu của họ. Việc có sự truy cập tới vài nội dung hoặc dữ liệu - ví dụ bằng việc tải nó về từ website của nhà xuất bản - không trao cho bạn quyền để sử dụng lại nó.
Xuất bản lại và gia tăng giá trị
Bạn không tự nhiên có quyền xuất bản lại, một cách toàn bộ, nội dung hoặc dữ liệu ai đó khác sở hữu, thậm chí nếu họ trao cho bạn giấy phép để sử dụng nó cho một mình bạn. Bạn cần kiểm tra các điều khoản của giấy phép về nội dung hoặc dữ liệu để chắc chắn bạn có thể xuất bản lại nó.
Điều y hệt áp dụng nếu bạn đang gia tăng giá trị cho nội dung hoặc dữ liệu đó, ví dụ bằng việc tự động thêm các đường liên kết hoặc kiểu cho nội dung, hoặc thêm các cột với thông tin bổ sung trong một tập hợp dữ liệu. Nội dung hoặc dữ liệu mới gồm toàn bộ nội dung hoặc dữ liệu của ai đó khác, nên bạn không thể xuất bản nó trừ phi bạn có được sự cho phép của họ.
Xuất bản các trích đoạn
Bạn có quyền xuất bản các trích đoạn nội dung hoặc các cơ sở dữ liệu bạn có sự truy cập tới, bất kể giấy phép nói gì, miễn là trích đoạn đó là không “đáng kể”. Tuy nhiên, thường khó để nói liệu trích đoạn bạn đã làm ra có là “đáng kể” hay không.
Giấy phép bạn được trao có thể cho phép bạn tái xuất bản bất kỳ lượng nội dung hoặc dữ liệu nào (các giấy phép mở làm điều này). Nếu không, bạn cần có tư vấn pháp lý về việc liệu các trích đoạn bạn muốn xuất bản có khả năng được coi là đáng kể hay không.
Xuất bản nội dung hoặc dữ liệu phái sinh (dẫn xuất)
Bạn có thể muốn tạo ra nội dung hoặc các cơ sở dữ liệu mới bằng việc tùy biến thích nghi, hoặc xử lý vài nội dung hoặc dữ liệu. Để làm điều đó, trước hết bạn phải chắc chắn bạn được trao giấy phép để sử dụng dữ liệu đó. Sau đó bạn cần xem giấy phép nói gì về việc tạo ra các tác phẩm phái sinh.
Ví dụ, bạn nói đã được trao giấy phép để sử dụng một ảnh chụp trên website của bạn. Bạn có thể tạo phiên bản mới của ảnh chụp đó bằng việc thay đổi nó từ có màu sang đen trắng, hoặc bằng việc thêm lời chú cho nó.
Trong trường hợp này, ảnh chụp đó là tác phẩm có tính sáng tạo, và người chụp nó sở hữu bản quyền. Vì ảnh chụp đó được bản quyền bảo vệ, bạn chỉ có thể tạo ra các ảnh mới nếu giấy phép theo đó bạn sử dụng ảnh cho phép bạn làm thế.
Bản quyền có thể tồn tại trong các mẩu nhỏ nội dung, như các mệnh đề. Ví dụ, nếu bạn phân tích vài nội dung để tạo ra cơ sở dữ liệu mới, bạn nên chắc chắn bạn có quyền sử dụng lại bất kỳ mẩu nội dung nào bạn có thể giữ trong cơ sở dữ liệu mới. Nếu nội dung đó gồm trình bày dữ liệu từ một cơ sở dữ liệu, bạn phải xem cả các quyền cơ sở dữ liệu nữa: việc lấy dữ liệu từ trang đó có thể tương đương với việc tạo ra một trích đoạn.
Các quyền cơ sở dữ liệu là khá khác nhau, vì chúng thỉ mở rộng cho việc tạo các trích đoạn hoặc sử dụng lại (xuất bản lại) cơ sở dữ liệu.
Ví dụ, bạn đã phân tích dữ liệu về các đơn thuốc từng thứ thuốc trong từng thực hành GP ở Vương quốc Anh, cùng với dữ liệu khác về bảo hiểm của từng thực hành, để tạo ra tập hợp dữ liệu mới cung cấp chi tiêu trung bình mỗi bệnh nhân của từng thực hành. Miễn là bạn đã không có các bổn phận hợp đồng riêng rẽ nào đối với các chủ sở hữu của 2 tập hợp dữ liệu bạn đã mang theo, bạn có thể tự do để làm những gì bạn muốn với kết quả đó, vì có lẽ không thể xây dựng lại các cơ sở dữ liệu gốc ban đầu từ các dữ liệu được tổng hợp.
Các giấy phép nói gì?
Các giấy phép nói cho bạn những gì bạn có thể làm với nội dung hoặc dữ liệu bạn truy cập. Một giấy phép sẽ nói cho bạn liệu bạn có thể:
  • xuất bản lại nội dung hoặc dữ liệu lên website của riêng bạn
  • dẫn xuất nội dung hoặc dữ liệu mới từ nó
  • kiếm tiền bằng việc bán các sản phẩm sử dụng nó
  • xuất bản lại nó trong khi vẫn lấy phí truy cập
Nhiều giấy phép sẽ cho phép bạn truy cập nội dung hoặc dữ liệu miễn phí, nhưng nói rằng bạn không thể tái xuất bản nó hoặc tùy biến thích nghi nó, hoặc sử dụng nó trong các sản phẩm thương mại. Nếu bạn vi phạm các điều khoản của giấy phép đó, chủ sở hữu nội dung hoặc dữ liệu đó có thể kiện bạn ra tòa.
Các giấy phép mở nói gì?
Giấy phép mở là giấy phép đặt ra rất ít hạn chế về những gì bạn có thể làm với nội dung hoặc dữ liệu đang được cấp phép.
Theo Định nghĩa Mở Open Definition, chỉ có 2 dạng hạn chế một giấy phép có thể đặt ra:
  • là bạn phải thừa nhận ghi công (attribution) cho nguồn nội dung hoặc dữ liệu
  • là bạn phải xuất bản bất kỳ nội dung hoặc dữ liệu phái sinh nào theo giấy phép y hệt (điều này được gọi là chia sẻ tương tự – share-alike)
Một giấy phép mở có thể hoặc làm 1 trong 2 điều trên hoặc cả 2. Vì thế, bạn có thể gặp nội dung hoặc dữ liệu sẵn sàng theo 1 trong 3 mức giấy phép:
  1. giấy phép phạm vi công cộng (public domain) không có các hạn chế hoàn toàn (về kỹ thuật, chúng chỉ ra rằng người sở hữu các quyền đã từ bỏ các quyền của họ đối với nội dung hoặc dữ liệu)
  2. giấy phép ghi công (attribution) chỉ nó là bạn phải thừa nhận ghi công cho nhà xuất bản
  3. giấy phép ghi công & chia sẻ tương tự (attribution & share-alike) nói bạn phải thừa nhận ghi công và chia sẻ bất kỳ nội dung hoặc dữ liệu phái sinh nào theo giấy phép y hệt
Bạn đưa ra sự ghi công như thế nào?
Bạn cần đưa ra sự ghi đông thậm chí nếu giấy phép không đòi hỏi điều đó .Việc thừa nhận ghi công là cách thừa nhận cả những nỗ lực nhà xuất bản đã làm để đưa ra cùng nội dung hoặc dữ liệu bạn đang sử dụng lại, và sự hào phóng của họ trong việc làm cho nó sẵn sàng để sử dụng lại.
Khi nội dung hoặc dữ liệu được cấp phép bằng việc sử dụng giấy phép bao gồm sự ghi công, nhà xuất bản có thể chỉ định:
  • ngôn từ để thừa nhận ghi công
  • nơi và cách ghi công nên được trình bày
Bạn cần tuân theo những gì nhà xuất bản yêu cầu bạn làm. Nếu nó không là thực hành được, ví dụ nếu bạn đang cung cấp dịch vụ không có chỗ cho tuyên bố ghi công họ yêu cầu, thì hãy liên hệ với họ và hỏi làm thế nào.
Là thực hành tốt để cung cấp tên của tổ chức đã xuất bản dữ liệu hoặc nội dung đó, và đường liên kết tới trang chủ của họ. Việc chỉ định tên tập hợp dữ liệu và cung cấp đường liên kết tới vị trí của nó cũng giúp cho những người sử dụng lại khác tìm thấy dữ liệu bạn đang sử dụng lại.
Nếu bạn đang xây dựng công cụ sử dụng lại vài nội dung hoặc dữ liệu, bạn cần thử đưa vào sự ghi công trên từng trang hoặc màn hình theo đó nội dung hoặc dữ liệu đó được sử dụng. Nếu điều này không làm được (ví dụ vì bạn đang kéo thông tin từ nhiều nguồn khác nhau), bạn cần cung cấp đường liên kết rõ ràng tới trang hoặc màn hình sau đó cung cấp thông tin ghi công.
Nếu bạn đang xuất bản lại dữ liệu hoặc nội dung, những người sử dụng lại nó sẽ có ràng buộc bởi các yêu cầu ghi công đó đối với dữ liệu hoặc nội dung gốc ban đầu. Để làm dễ hơn cho họ để hiểu và hoàn thành các yêu cầu đó, là thực hành tốt để đưa sự ghi công đó đối với dữ liệu hoặc nội dung nguồn vào sự ghi công bạn yêu cầu. Điều này đôi khi là phi thực tế, ví dụ vì bạn đang tạo ra dữ liệu hoặc nội dung phái sinh gồm dữ liệu hoặc nội dung từ số lượng lớn các nguồn. Trong các trường hợp đó, bạn cần cung cấp danh sách đầy đủ các nguồn và yêu cầu sự ghi công liên kết tới danh sách đó.
Bạn chia sẻ tương tự như thế nào?
Giấy phép chia sẻ tương tự yêu cầu bạn xuất bản lại nội dung hoặc dữ liệu mới bạn tạo ra bằng việc sử dụng nội dung hoặc dữ liệu được trao theo giấy phép y hệt, chia sẻ tương tự. Việc tạo ra các cách thức mới trình bày dữ liệu không được coi như là dẫn xuất hoặc tùy biến thích nghi, mà là kết hợp 2 tập hợp dữ liệu để tạo ra một tập hợp mới.
Việc xuất bản nội dung và dữ liệu bạn tạo ra từ dữ liệu mở, như là dữ liệu mở, là điều tốt lành để làm thậm chí nếu giấy phép không yêu cầu điều đó. Việc mở ra nội dung và dữ liệu của bạn xúc tác cho những người khác sử dụng lại và xây dựng dựa vào tác phẩm của bạn, và có thể gia tăng giá trị cho tác phẩm của bạn.
Có các giấy phép mở nào?
Nội dung có tính sáng tạo, như văn bản, ảnh chụp, slide, và những thứ khác, cần phải được cấp phép bằng việc sử dụng một giấy phép Creative Commons. Có 3 giấy phép bạn nên cân nhắc sử dụng cho nội dung mở:
Mức cấp phép Giấy phép Creative Commons
phạm vi công cộng - public domain CC0
ghi công - attribution CC-by
ghi công - chia sẻ tương tự - attribution & share-alike CC-by-sa



Có các phiên bản khác nhau cho từng giấy phép đó, phiên bản gần đây nhất là 4.0. Cũng có các biến thể khác nhau tính tới các khác biệt về luật ở các quốc gia khác nhau. Các đường liên kết trong bảng ở trên là cho các phiên bản 4.0, nó áp dụng toàn cầu, nhưng bạn cũng có thể thấy các nhà xuất bản sử dụng các phiên bản khác. Bạn có thể ử dụng lại nội dung theo các giấy phép đó bất kể bạn ở nước nào.
Có các dạng giấy phép Creative Commons khác mà không phải là các giấy phép mở. Ví dụ, giấy phép Creative Commons Attribution-NonCommercial (CC BY-NC) không cho phép sử dụng lại thương mại nội dung, và vì thế không phải là một giấy phép mở. Các tóm tắt người đọc được của các giấy phép Creative Commons nêu chính xác những gì bạn có thể làm theo từng giấy phép.
Các giấy phép mở cho các cơ sở dữ liệu
Bạn có thể gặp tập hợp tương tự các giấy phép sẵn sàng cho các cơ sở dữ liệu từ Open Data Commons. Một lần nữa có 3 mức:
Mức cấp phép Giấy phép Chung Dữ liệu Mở
phạm vi công cộng - public domain PDDL
ghi công - attribution ODC-by
ghi công & chia sẻ tương tự - attribution & share-alike ODbL



Các giấy phép khác
Có các giấy phép khác xúc tác cho sử dụng lại và bạn có thể gặp, đặc biệt xung quanh thông tin của khu vực nhà nước:
  • Giấy phép Chính phủ Mở - Open Government Licence là giấy phép ghi công bao trùm cả bản quyền và quyền cơ sở dữ liệu và chủ yếu được sử dụng cho thông tin được chính phủ trung ương ở Vương quốc Anh làm cho sẵn sàng
  • Giấy phép Mở OS - OS Open Licence là giấy phép ghi công chính xác y hệt như Open Government Licence nhưng đảm bảo sự ghi công là theo Ordnance Survey
Giấy phép được chỉ ra như thế nào?
Giấy phép theo đó thông tin được xuất bản cần phải là rõ ràng cả ở nội dung người đọc được và như là dữ liệu máy đọc được. Nếu bạn không thể tìm ra giấy phép cho thông tin bạn phát hiện trên web, bạn cần liên hệ với chủ sở hữu của trang đó để hỏi: thiếu thông tin cấp phép ngụ ý bạn không thể giả sử quyền sử dụng lại nội dung hoặc dữ liệu đó.
Các mô tả và đánh dấu người đọc được mà bạn có thể gặp được chỉ ra trên các website của Creative Commons và Open Data Commons: Ở những nơi có thể, nhà xuất bản cần phải nhúng thông tin về giấy phép trực tiếp vào bên trong nội dung hoặc bản thân dữ liệu. Tuy nhiên, thường thì bạn sẽ phải xem xét trang từ đó bạn truy cập tới nội dung hoặc dữ liệu, hoặc thông tin giấy phép cho toàn bộ website, nó thường được liên kết tới từ chân trang đó.
Nếu nhà xuất bản thâm tập hợp dữ liệu của họ vào một catalog, như data.gov.uk hoặc Data Hub, họ có thể chỉ ra giấy phép theo đó tập hợp dữ liệu là sẵn sàng theo siêu dữ liệu được catalog đó cung cấp. Bạn cần kiểm tra rằng điều này là nhất quán với bất kỳ thông tin cấp phép nào họ cung cấp trên trang của riêng họ hoặc bên trong bản thân dữ liệu đó: nếu không có, bạn cần hỏi họ để làm rõ.
Đọc thêm
Hỏi đáp thường gặp về cấp phép Open Data Commons
Thừa nhận
Rất cảm ơn Francis Davey, Leigh Dodds, Tony Hirst, và các bình luận viên nặc danh đã đóng góp các bình luận cho bản thảo này.
The fact that you can get hold of some information does not necessarily mean that you can do whatever you want with it. You need to have permission from the owner of that information to do what you want to do. A licence tells you what you can do.
But what does it mean to license data? What requirements can a licence place on you? What different licences to publishers use? How can you find out what licence a dataset is available under? This guide answers these questions.
Note: This guide focuses on data published by organisations based in the UK. Licensing law is different in different countries, so some of this information might not apply to you if you are reusing information that is published elsewhere. It does not address other potential legal considerations, such as compliance with the Data Protection Act.

What Is Licensing?

When someone puts care and thought into creating something, such as writing a blog post or taking a photograph, they own that work. This means they have the right to determine how it gets used.
If you want to use the content or data, you have to either establish that they no longer have the rights to that work (because they have waived them), or ask their permission to use it. Licences are how they explicitly give you permission to use their work.

What Do Publishers Own?

In Europe, there are two kinds of rights that publishers — organisations or individuals who make available content or data — are given over things that they have created:
  • they get copyright over works (content) that they create and which are original to them, such as text that they write or photographs they take
  • they get a database right over collections of data that they have put a substantial effort into obtaining, verifying or presenting
Note: As far as we know the database right is unique to the European Union. In some countries there may be no protection for collections of data.
If someone applies original judgement in putting together a database, for example in choosing which items to include within the database or which information about them to include, they have a copyright over that database, because it is a creative work.
For example, if someone were to build a database about the best 100 cars, this might involve:
  • choosing which cars count as the best cars
  • writing a description about each car
  • researching and gathering facts about them
They would have copyright over the database, because they chose which cars were "best". They would have copyright over the descriptions, because they wrote them. And they would probably have the database right for the database they've built, because they put substantial effort into gathering information about the cars. Importantly, they don't own the facts about the cars — you or anyone else could build your own database containing exactly those facts without violating their database right — but no one else can reuse their database or their descriptions without their permission because they own the copyright over them.
Publishers probably do not have a database right if they create the facts in a database, as opposed to gathering them from elsewhere, unless they put substantial effort into verifying or presenting the database. For example, if someone owns a restaurant and creates a database of the dishes that they offer, and when they offer them, they probably do not have a database right over that database, though they might have copyright because of the creative judgement involved in working out which dishes should be offered on particular days to provide a balanced menu.

What About Data From Third Parties?

Publishers might not own all the content or data that they publish themselves. In particular, rather than creating the content or gathering the data themselves, some of the content and data they publish might be:
  • completely licensed by them from someone else
  • include an extract of content or data that they have licensed from someone else
  • be derived from the content or data that they have licensed from someone else
When they publish the data, the publisher should tell you about which content or data is owned by another organisation, and under which licence it is being republished.

What About Brands?

Brands are usually protected through a trade mark. A trade mark restricts how you can use an organisation's logo or company name. They will also have copyright on the logo.
Licences for content or data usually explicitly exclude logos and company names, so you cannot, for example, adapt a logo by changing the colours used within it. You also cannot use the company name or logo to lend weight to your product without permission to do so. However, the attribution requirements of a licence may require you to use the company name and logo to indicate that you have reused data owned by that company.

What Can't You Do?

There are a few things that you can do with content or data without a licence, but in general you need to be given a licence by a publisher if you want to reuse their content or data. Having access to some content or data — for example by downloading it from a publisher's website — does not give you the right to reuse it.

Republishing and Adding Value

You do not automatically have the right to republish, in its entirety, content or data that someone else owns, even if they have given you a licence to use it yourself. You need to check the terms of the licence for the content or data to make sure that you can republish it.
The same applies if you are adding value to the content or data, for example by automatically adding links or styling to content, or adding columns with extra information into a dataset. The new content or data includes the entirety of someone else's content or data, so you cannot publish it unless you have their permission.

Publishing Extracts

You have the right to publish extracts of content or databases that you have access to, regardless of what the licence says, so long as the extract is not "substantial". However, it is often hard to tell if the extract that you have made is "substantial".
The licence that you have been given might let you republish any amount of the content or data (open licences do this). Otherwise, you should take legal advice about whether the extracts that you want to publish are likely to count as substantial or not.

Publishing Derived Content or Data

You might want to create new content or databases by adapting, deriving, or otherwise processing some content or data. To do that, you first have to ensure you have been given a licence to use the data in the first place. You then need to look at what the licence says about creating derived works.
For example, say you have been given a licence to use a photograph on your website. You could create a new version of that photograph by changing it from colour to black & white, or by adding a speech bubble to it.
In this case, the photograph is a creative work, and the person who took it owns the copyright. Because the photograph is protected by copyright, you can only create these new images if the licence under which you are using the photograph allows you to do so.
Copyright can exist in small pieces of content, such as phrases. For example, if you analyse some content to create a new database, you should make sure that you have the right to reuse any snippets of content that you might keep in the new database. If the content includes a presentation of data from a database, you have to consider database rights as well: scraping data from the page might equate to creating an extract.
Database rights are slightly different, because they only extend to creating extracts or re-utilising (republishing) a database.
For example, say you analysed the data about prescriptions of each drug within each GP practice within the UK, along with other data about the coverage of each practice, to create a new dataset that provided the average spend per patient of each practice. So long as you had no separate contractual obligations to the owners of the two datasets you have brought together, you might well be free to do what you liked with the result, as it would not be possible to reconstruct the original databases from the aggregated data.

What Do Licences Say?

Licences tell you what you can do with the content or data that you access. A licence will tell you whether you can:
  • republish the content or data on your own website
  • derive new content or data from it
  • make money by selling products that use it
  • republish it while charging a fee for access
Many licences will let you access content or data for free, but say that you cannot republish it or adapt it, or use it within commercial products. If you break the terms of the licence, the owner of the content or data can take you to court.

What Do Open Licences Say?

An open licence is one that places very few restrictions on what you can do with the content or data that is being licensed.
According to the Open Definition, There are only two kinds of restrictions that an open licence can place:
  • that you must give attribution to the source of the content or data
  • that you must publish any derived content or data under the same licence (this is called share-alike)
An open licence might do neither or one or both of these. So, you might encounter content or data available under one of three levels of licence:
  1. a public domain licence has no restrictions at all (technically, these indicate that the rights owner has waived their rights to the content or data)
  2. an attribution licence just says that you must give attribution to the publisher
  3. an attribution & share-alike licence says that you must give attribution and share any derived content or data under the same licence

How Do You Provide Attribution?

You should provide attribution even if the licence does not require it. Giving attribution is a way of recognising both the efforts that the publisher has made to put together the content or data you are reusing, and their generosity in making it available for reuse.
When content or data is licensed using a licence that includes attribution, the publisher might specify:
  • what wording the attribution should include
  • where and how the attribution should be presented
You should follow what the publisher asks you to do. If it is not practical, for example if you are providing a service that does not have room for the attribution statement that they request, then get in touch with them to ask what to do.
It is good practice to provide the name of the organisation that published the data or content, and a link to their home page. Specifying the name of the dataset and providing a link to its location also helps other reusers to find the data you are reusing.
If you are building a tool that reuses some content or data, you should try to include attribution on every page or screen in which the content or data is used. If this is impractical (for example because you are pulling together information from lots of different sources), you should provide a clear link to a page or screen that then provides attribution information.
If you are republishing data or content, its reusers are still bound by the attribution requirements of the original data or content. To make it easier for them to understand and fulfil those requirements, it is good practice to include the attribution for the source data or content in the attribution that you ask for. This might sometimes be impractical, for example because you are creating derived data or content includes data or content from a large number of sources. In these cases, you should provide a full list of the sources and request an attribution which links to that list.

How Do You Share-Alike?

A share-alike licence requires you to republish new content or data that you create using the given content or data under the same, share-alike licence. Creating new ways of presenting data does not count as derivation or adaptation, but combining two sets of data to create a new set probably does.
Publishing the content and data that you create from open data, as open data, is a good thing to do even if the licence does not require it. Opening up your content and data enables others to reuse and build on your work, and can add value to your work.

What Open Licences Are There?

There are two sets of open licences that you may encounter.

Open Licences for Creative Content

Creative content, such as text, photographs, slides and so on, may be licensed using a Creative Commons Licence. There are three of these that you might encounter:
Level of Licence Creative Commons Licence
public domain CC0
attribution CC-by
attribution & share-alike CC-by-sa
There are different versions for each of these licences, the most recent being version 4.0. There are also different variants which take into account differences in the law in different countries. The links in the table above are to the version 4.0 versions, which apply internationally, but you may find publishers using other versions. You can reuse content under these licences no matter what country you are in.
There are other types of Creative Commons licences that are not open licences. For example, the Creative Commons Attribution-NonCommercial licence does not allow commercial reuse of content, and therefore is not an open licence. The human-readable summaries of the Creative Commons licences spell out exactly what you can do under each licence.

Open Licences for Databases

You might encounter a similar set of licences which is available for databases from the Open Data Commons. There are again three levels:
Level of Licence Open Data Commons Licence
public domain PDDL
attribution ODC-by
attribution & share-alike ODbL

Other Licences

There are other licences that enable reuse and which you may encounter, particularly around public sector information:
  • Open Government Licence is an attribution licence that covers both copyright and database right and is mainly used for information made available by UK central government
  • OS Open Licence is an attribution licence that is exactly the same as the Open Government Licence but ensures that the attribution is to the Ordnance Survey

How is the Licence Indicated?

The licence under which information is published should be clear both in human-readable content and as machine-readable data. If you cannot work out the licence for information that you discover on the web, you should contact the owner of the site to ask: the lack of licensing information means that you cannot assume the right to reuse the content or data.
Human-readable descriptions and marks that you may encounter are shown on the Creative Commons and Open Data Commons websites: Where possible, the publisher should have embedded information about the licence directly within the content or data itself. Often, however, you will have to look at the page from which you access the content or data, or the licence information for the entire website, which is often linked to from the footer of the page.
If a publisher adds their dataset to a catalog, such as data.gov.uk or the Data Hub, they may indicate the licence under which the dataset is available in the metadata supplied by the catalog. You should check that this is consistent with any licence information they supply on their own site or within the data itself: if it is not, you should ask them for clarification.

Further Reading

Acknowledgements

Very many thanks to Francis Davey, Leigh Dodds, Tony Hirst, and the anonymous commenters who contributed comments on this draft.
Dịch: Lê Trung Nghĩa
letrungnghia.foss@gmail.com
 

Tổng số điểm của bài viết là: 0 trong 0 đánh giá

Click để đánh giá bài viết

  Ý kiến bạn đọc

Những tin mới hơn

Những tin cũ hơn

Về Blog này

Blog này được chuyển đổi từ http://blog.yahoo.com/letrungnghia trên Yahoo Blog sang sử dụng NukeViet sau khi Yahoo Blog đóng cửa tại Việt Nam ngày 17/01/2013.Kể từ ngày 07/02/2013, thông tin trên Blog được cập nhật tiếp tục trở lại với sự hỗ trợ kỹ thuật và đặt chỗ hosting của nhóm phát triển...

Bài đọc nhiều nhất trong năm
Thăm dò ý kiến

Bạn quan tâm gì nhất ở mã nguồn mở?

Thống kê truy cập
  • Đang truy cập119
  • Máy chủ tìm kiếm17
  • Khách viếng thăm102
  • Hôm nay18,197
  • Tháng hiện tại466,976
  • Tổng lượt truy cập36,525,569
Bạn đã không sử dụng Site, Bấm vào đây để duy trì trạng thái đăng nhập. Thời gian chờ: 60 giây