Thí điểm Dữ liệu Nghiên cứu Mở là gì?

Thứ hai - 29/05/2017 05:34

What is the Open Research Data Pilot?

Updated on 15 November 2016

Theo: https://www.openaire.eu/opendatapilot

Bài được cập nhật trên Internet ngày: 15/11/2016

Xem thêm: Khoa học Mở - Open Science


 

Thí điểm Dữ liệu Nghiên cứu Mở là gì?

Dữ liệu Mở là dữ liệu được tự do để chia sẻ, sử dụng lại, tái mục đích, và phân phối lại. Thí điểm Dữ liệu Nghiên cứu Mở (Open Research Data Pilot) nhằm làm cho dữ liệu nghiên cứu được tạo ra bởi các dự án được lựa chọn của chương trình Horizon 2020 là truy cập được với càng ít hạn chế có thể càng tốt, trong khi cùng lúc bảo vệ các dữ liệu nhạy cảm khỏi sự truy cập không thích hợp.

Nếu dự án Horizon 2020 của bạn là một phần của thí điểm, và dữ liệu của bạn đáp ứng được các điều kiện nhất định, thì bạn phải ký gửi dữ liệu của bạn vào một kho dữ liệu nghiên cứu nơi mà chúng có khả năng được những người khác tìm thấy và truy cập. Đừng hoảng hốt nhé - bạn chưa có kinh nghiệm chia sẻ các dữ liệu nhạy cảm hoặc chưa vi phạm bất kỳ thỏa thuận nào về quyền sở hữu trí tuệ (IPR) với các đối tác công nghiệp. Bạn cũng không cần phải ký gửi tất cả các dữ liệu bạn tạo ra trong quá trình dự án đó - chỉ các dữ liệu chống trụ cho các phát hiện nghiên cứu được xuất bản và/hoặc có giá trị trong dài hạn. Hơn nữa, để hỗ trợ cho tính toàn vẹn nghiên cứu của bạn, tính mở có nhiều lợi ích khác. Tính trực quan được nâng cao ngụ ý nghiên cứu của bạn sẽ với tới được nhiều người hơn và có ảnh hưởng lớn hơn - đối với khoa học, xã hội và sự nghiệp của riêng bạn. Các nghiên cứu gấn đây đã chỉ ra rằng các trích dẫn gia tăng khi dữ liệu được làm cho sẵn sàng cùng với xuất bản phẩm; các tài liệu đó cũng có cuộc sống trên giá sách lâu hơn.

Các thành phần nào của H2020 được yêu cầu tham gia?

Các dự án bắt đầu vào tháng 01/2017 mặc định là một phần của Thí điểm Dữ liệu Mở. Nếu dự án của bạn đã bắt đầu sớm hơn trước đó và xuất phát từ một trong những lĩnh vực đó của Horizon 2020, thì bạn cũng tự động là một phần của thí điểm đó:

  • Các công nghệ đang nổi lên và trong tương lai

  • Các hạ tầng nghiên cứu (bao gồm cả các hạ tầng điện tử)

  • Lãnh đạo trong các công nghệ thúc đẩy và công nghiệp - các CNTT-TT

  • Các công nghệ nano, các vật liệu tiên tiến, Sản xuất và Xử lý tiên tiến, công nghệ sinh học: các chủ đề ‘an toàn nano’ và ‘mô hình hóa’

  • Thách thức xã hội: An toàn thực phẩm, nông nghiệp và nghề rừng bền vững, nghiên cứu về nước biến, hàng hải và nội địa và kinh tế sinh học - các chủ đề được lựa chọn trong các lời gọi H2020-SFS-2016/2017, H2020-BG-2016/2017, H2020-RUR-2016/2017 và H2020-BB-2016/2017, như được chỉ định trong chương trình làm việc.

  • Thách thức xã hội: Hành động về Khí hậu, Môi trường, Hiệu quả của Tài nguyên và các tư liệu thô - ngoại trừ các tư liệu thô

  • Thách thức xã hội: Châu Âu trong thế giới đang thay đổi - các xã hội có tính tham gia, có tính đổi mới và có tính phản hồi.

  • Khoa học với và vì xã hội

  • Các hoạt động liên ngành - các lĩnh vực trọng tâm - phần cho các Thành phố Thông minh và Bền vững

Có thể việc chia sẻ dữ liệu là không thích hợp với dự án của bạn; Chỉ dẫn của EC về Truy cập Mở tới các Xuất bản phẩm Khoa học và Dữ liệu Nghiên cứu liệt kê các điều kiện có thể cho phép hoặc yêu cầu bạn lựa chọn đối với thí điểm. Trong trường hợp đó, xin cân nhắc liệu một phần lựa chọn có là có khả năng hay không.

Kế hoạch Quản lý Dữ liệu - DMP (Data Management Plan) là gì?

Để giúp bạn tối ưu hóa tiềm năng cho việc chia sẻ và sử dụng lại trong tương lai, DMP có thể giúp bạn cân nhắc bất kỳ vấn đề nào hoặc thách thức nào có thể xảy ra và giúp bạn nhận diện các cách thức để vượt qua chúng. DMP nên được hiểu như là tài liệu “sống” phác thảo cách dữ liệu nghiên cứu được thu thập hoặc được sinh ra sẽ được thao tác trong và sau dự án nghiên cứu. Hãy nhớ, kế hoạch đó nên là thực tế và dựa vào xung quanh các tài nguyên có sẵn với bạn và các đối tác dự án của bạn. Không có điểm cho một kế hoạch được mạ vàng nếu nó không thể triển khai được!

Nên mô tả:

  • Tập hợp dữ liệu: Dạng dữ liệu nào dự án sẽ thu thập hoặc sinh ra, và chúng có thể là hữu dụng cho ai sau này? Thí điểm áp dụng cho: (1) dữ liệu và siêu dữ liệu cần thiết để thẩm định các kết quả trong các xuất bản phẩm khoa học; và (2) dữ liệu và siêu dữ liệu thô và/hoặc được tuyển chọn khác mà có thể được yêu cầu vì các mục đích thẩm định hoặc với giá trị sử dụng lại được.

  • Các tiêu chuẩn và siêu dữ liệu: Các chỉ tiêu nào theo quy định bạn sẽ áp dụng trong dự án? Dữ liệu là về cái gì? Ai đã tạo ra nó và vì sao? Ở các dạng nào nó là sẵn sàng? Siêu dữ liệu sẽ trả lời các câu hỏi như vậy để xúc tác cho dữ liệu được tìm ra và được hiểu, lý tưởng là tuân theo các tiêu chuẩn đặc thù của nguyên tắc khoa học của bạn. Siêu dữ liệu, tài liệu và các tiêu chuẩn giúp làm cho dữ liệu của bạn có khả năng tìm thấy được, truy cập được, tương hợp được và sử dụng lại được hoặc ngắn gọn FAIR (Findable, Accessible, Interoperable and Re-usable).

  • Chia sẻ dữ liệu: Mặc định càng nhiều dữ liệu kết quả càng tốt nên được lưu trữ như là Truy cập Mở. Vì thế các lý do hợp pháp cho việc không chia sẻ các dữ liệu kết quả nên được giải thích trong DMP. Hãy nhớ, không ai kỳ vọng bạn làm hỏng sự bảo vệ dữ liệu hoặc vi phạm bất kỳ thỏa thuận IPR nào. Chia sẻ dữ liệu nên được làm có trách nhiệm. Các chỉ dẫn DMP vì thế yêu cầu bạn mô tả bất kỳ vấn đề đạo đức hay pháp lý nào có thể có ảnh hưởng tới việc chia sẻ dữ liệu. Hơn nữa,

  • Việc lưu trữ và bảo tồn: Các cơ quan cấp vốn sẵn sàng đảm bảo rằng các đầu ra nghiên cứu được cấp vốn công khai có thể có ảnh hưởng tích cực tới nghiên cứu trong tương lai, để phát triển chính sách, và thay đổi xã hội. Họ hiểu ảnh hưởng đó có thể mất nhiều thời gian để hiện thực hóa và, vì vậy, kỳ vọng dữ liệu sẽ là sẵn sàng trong một giai đoạn phù hợp vượt ra khỏi vòng đời của dự án. Hãy nhớ, đơn giản là không đủ để đảm bảo rằng một chút gì đó được lưu giữ trong một kho dữ liệu nghiên cứu, nhưng cũng hãy cân nhắc khả năng sử dụng dữ liệu của bạn. Về khía cạnh này, bạn nên cân nhắc duy trì phần mềm hoặc bất kỳ mã nào được sản xuất để thực hiện các phân tích nhất định hoặc để trả về dữ liệu cũng như là rõ ràng về bất kỳ công cụ sở hữu độc quyền hoặc nguồn mở nào sẽ là cần thiết để thẩm định và sử dụng dữ liệu được duy trì gìn giữ đó.

DMP không phải là tài liệu cố định. Phiên bản đầu tiên của DMP được kỳ vọng sẽ được phân phối trong vòng 6 tháng đầu của dự án của bạn, nhưng bạn còn chưa phải cung cấp các câu trả lời chi tiết cho tất cả các câu hỏi. DMP cần phải được cập nhật trong quá trình làm việc của dự án ở bất cứ khi nào có những thay đổi đáng kể phát sinh, như các dữ liệu hoặc các thay đổi mới trong các chính sách của nhóm hoặc trong sự tổng hợp của nhóm. DMP nên được cập nhật ít nhất vào đúng thời điểm với đánh giá và ước tính định kỳ của dự án cũng như vào thời điểm rà soát lại cuối cùng. Hãy cân nhắc việc rà soát lại DMP của bạn thường xuyên định kỳ trong dự án và xem xét cách bạn có thể sử dụng WP được lập lịch và/hoặc các cuộc họp của các nhân viên dự án để tạo thuận lợi cho sự rà soát lại này.

Các bước thực hành nào bạn nên tiến hành?

  1. Khi dự án của bạn là một phần của thí điểm, bạn nên tạo ra Kế hoạch Quản lý Dữ liệu (DMP). Cơ sở của bạn có thể chào hỗ trợ Quản lý Dữ liệu Nghiên cứu để giúp bạn lên kế hoạch.

  2. Hơn nữa, bạn nên lựa chọn kho dữ liệu mà sẽ duy trì dữ liệu, siêu dữ liệu và các công cụ có thể của bạn về lâu dài. Được khuyến cáo liên hệ với kho theo lựa chọn của bạn khi viết phiên bản đầu tiên DMP của bạn. Các kho có thể chào các chỉ dẫn về các định dạng dữ liệu bền vững và các tiêu chuẩn siêu dữ liệu, cũng như hỗ trợ làm việc với các dữ liệu nhạy cảm và việc cấp phép.

  3. Như được nêu trước đó, bạn không cần phải giữ mọi điều. Việc tuyển chọn dữ liệu đòi hỏi thời gian và nỗ lực nên bạn muốn chắc chắn bạn đang đặt nỗ lực của bạn vào các kết quả đầu ra thực sự đúng vấn đề. Hãy chọn dữ liệu nào bạn sẽ cần giữ lại để hỗ trợ thẩm định phát hiện của bạn nhưng cũng hãy cân nhắc bất kỳ kết quả đầu ra dữ liệu nào mà cũng có thể có giá trị về lâu dài - cho bạn và cho những người khác.

Các đường liên kết

What is the Open Research Data Pilot?

Open data is data that is free to access, reuse, repurpose, and redistribute. The Open Research Data Pilot aims to make the research data generated by selected Horizon 2020 projects accessible with as few restrictions as possible, while at the same time protecting sensitive data from inappropriate access.

If your Horizon 2020 project is part of the pilot, and your data meets certain conditions, you must deposit your data in a research data repository where they will be findable and accessible for others. Don’t panic - you are not expected to share sensitive data or breach any IPR agreements with industrial partners. You do not need to deposit all the data you generate during the project either – only that which underpins published research findings and/or has longer-term value. In addition to supporting your research’s integrity, openness has many other benefits. Improved visibility means your research will reach more people and have a greater impact – for science, society and your own career. Recent studies have shown that citations increase when data is made available alongside the publication; these papers also have a longer shelf-life.

Which H2020 strands are required to participate?

Projects starting from January 2017 are by default part of the Open Data Pilot. If your project started before earlier and stems from one of these Horizon 2020 areas, you are automatically part of the pilot as well:

  • Future and Emerging Technologies

  • Research infrastructures (including e-Infrastructures)

  • Leadership in enabling and industrial technologies – Information and Communication Technologies

  • Nanotechnologies, Advanced Materials, Advanced Manufacturing and Processing, and Biotechnology: ‘nanosafety’ and ‘modelling’ topics

  • Societal Challenge: Food security, sustainable agriculture and forestry, marine and maritime and inland water research and the bioeconomy - selected topics in the calls H2020-SFS-2016/2017, H2020-BG-2016/2017, H2020-RUR-2016/2017 and H2020-BB-2016/2017, as specified in the work programme

  • Societal Challenge: Climate Action, Environment, Resource Efficiency and Raw materials – except raw materials

  • Societal Challenge: Europe in a changing world – inclusive, innovative and reflective Societies

  • Science with and for Society

  • Cross-cutting activities - focus areas – part Smart and Sustainable Cities.

Maybe data sharing is not appropriate for your project; the EC’s Guide on Open Access Scientific Publications and Research Data lists conditions that would allow or require you to opt out of the pilot. In that case please consider if a partial opt-out is possible.

What is a Data Management Plan (DMP)?

To help you optimise the potential for future sharing and reuse, a Data Management Plan (DMP) can help you to consider any problems or challenges that may be encountered and helps you to identify ways to overcome these. A DMP should be thought of as a  “living” document outlining how the research data collected or generated will be handled during and after a research project. Remember, the plan should be realistic and based around the resources available to you and your project partners. There is no point in writing a gold plated plan if it cannot be implemented!

It should describe:

  • The data set: What kind of data will the project collect or generate, and to whom might they be useful later on? The pilot applies to (1) the data and metadata needed to validate results in scientific publications and (2) other curated and/or raw data and metadata that may be required for validation purposes or with reuse value.

  • Standards and metadata: What disciplinary norms will you adopt in the project? What is the data about? Who created it and why? In what forms it is available? Metadata answers such questions to enable data to be found and understood, ideally according to the particular standards of your scientific discipline. Metadata, documentation and standards help to make your data Findable, Accessible, Interoperable and Re-usable or FAIR for short.

  • Data sharing: By default as much of the resulting data as possible should be archived as Open Access. Therefore legitimate reasons for not sharing resulting data should be explained in the DMP. Remember, no one expects you to compromise data protection or breach any IPR agreements. Data sharing should be done responsibly. The DMP Guidelines therefore ask you to describe any ethical or legal issues that can have an impact on data sharing. Furthermore,

  • Archiving and preservation: Funding bodies are keen to ensure that publicly funded research outputs can have a positive impact on future research, for policy development, and for societal change. They recognise that impact can take quite a long time to be realised and, accordingly, expect the data to be available for a suitable period beyond the life of the project. Remember, it is not simply enough to ensure that the bits are stored in a research data repository, but also consider the usability of your data. In this respect, you should consider preserving software or any code produced to perform specific analyses or to render the data as well as being clear about any proprietary or open source  tools that will be needed to validate and use the  preserved data.

The DMP is not a fixed document. The first version of the DMP is expected to be delivered within the first 6 months of your project, but you don’t have to provide detailed answers to all the questions yet. The DMP needs to be updated over the course of the project whenever significant changes arise, such as new data or changes in the consortium policies or consortium composition. The DMP should be updated at least in time with the periodic evaluation or assessment of the project as well as in time for the final review. Consider reviewing your DMP at regular intervals in the project and consider how you might make use of scheduled WP and/or project staff meetings to facilitate this review.

What practical steps should you take?

1. When your project is part of the pilot, you should create a Data Management Plan. Your institution may offer Research Data Management support to help you planning.

2. Also, you should select a data repository that will preserve your data, metadata and possibly tools in the long term. It is advisable to contact the repository of your choice when writing the first version of your DMP. Repositories may offer guidelines for sustainable data formats and metadata standards, as well as support for dealing with sensitive data and licensing.

3. As noted earlier, you do not need to keep everything. Curating data requires time and effort so you want to make sure that you are putting your effort into the outputs that really matter. Select what data you’ll need to retain to support validation of your finding but nalso consider any data outputs that may have longer term value as well – for you and for others.

Links

EC’s Guide on Open Access
 to Scientific Publications and Research Data in Horizon 2020 (updated August 25, 2016) http://ec.europa.eu/research/participants/data/ref/h2020/grants_manual/hi/oa_pilot/h2020-hi-oa-pilot-guide_en.pdf

EC’s Guidelines on Data Management in Horizon 2020 (updated July 26, 2016): http://ec.europa.eu/research/participants/data/ref/h2020/grants_manual/hi/oa_pilot/h2020-hi-oa-data-mgt_en.pdf
EC’s Agenda on Open Science: https://ec.europa.eu/digital-agenda/en/open-science

DMPonline tool: https://dmponline.dcc.ac.uk/
DCC How to Write a DMP guide:http://www.dcc.ac.uk/resources/how-guides/develop-data-plan
DCC How to Select What Data to Keep guide: http://www.dcc.ac.uk/resources/how-guides/five-steps-decide-what-data-keep

DCC How to Licence Research Data guide: http://www.dcc.ac.uk/resources/how-guides/license-research-data

RDNL video The what, why and how of data management planning: http://datasupport.researchdata.nl/en/start-de-cursus/ii-planfase/datamanagementplanning/
Software Sustainability Institute’s Software Management Plan: https://www.software.ac.uk/sites/default/files/images/content/SMP_Checklist_2016_v0.1.pdf

Dịch: Lê Trung Nghĩa

letrungnghia.foss@gmail.com

Tổng số điểm của bài viết là: 0 trong 0 đánh giá

Click để đánh giá bài viết

  Ý kiến bạn đọc

Chương trình 'Huấn luyện huấn luyện viên nguồn mở' - Khóa 4 - Ngày 1

  Các bài trình bày trong chương trình 'Huấn luyện huấn luyện viên nguồn mở', khóa 4, ngày đầu tiên, do Trung tâm Nghiên cứu và Phát triển Quốc gia về Công nghệ Mở và trường Đại học Văn Lang, thành phố Hồ Chí Minh, đồng tổ chức đã diễn ra, gồm: Khóa học có sự tham gia của các giáo...

Bài đọc nhiều nhất trong năm
Thăm dò ý kiến

Bạn quan tâm gì nhất ở mã nguồn mở?

Thống kê truy cập
  • Đang truy cập65
  • Máy chủ tìm kiếm17
  • Khách viếng thăm48
  • Hôm nay3,581
  • Tháng hiện tại112,163
  • Tổng lượt truy cập6,447,920
Bạn đã không sử dụng Site, Bấm vào đây để duy trì trạng thái đăng nhập. Thời gian chờ: 60 giây