Tài nguyên bổ sung. Tổng quan Nghiên cứu Mở

Thứ tư - 27/05/2026 06:27
Tài nguyên bổ sung. Tổng quan Nghiên cứu Mở

Additional Resources

Open Research Overview

Nghiên cứu Mở là một tập hợp các nguyên tắc và thực hành nhằm mục đích làm cho các kết quả nghiên cứu tự do truy cập được và sử dụng được, từ đó tối đa hóa khả năng mang lại lợi ích cho cộng đồng. Nó được mô tả là "nghiên cứu học thuật mang tính cộng tác, minh bạch và có thể tái tạo, và các kết quả nghiên cứu là có sẵn công khai" (Lời khuyên tích hợp của Nền tảng Chính sách Khoa học Mở). Nó dựa trên nguyên tắc rằng kiến thức sẽ mang lại lợi ích lớn nhất nếu được chia sẻ rộng rãi nhất có thể.

Nghiên cứu Mở

Nghiên cứu Mở có liên quan đến tất cả các nhà nghiên cứu và tất cả các lĩnh vực, mặc dù các ứng dụng sẽ khác nhau tùy thuộc vào lĩnh vực và bối cảnh nghiên cứu. Có nhiều định nghĩa khác nhau về Nghiên cứu Mở, nhưng có thể xác định một số chủ đề (không phải tất cả đều phù hợp trong mọi trường hợp):

  • Làm cho các kết quả nghiên cứu, bao gồm các ấn phẩm, dữ liệu, phần mềm và các tài liệu nghiên cứu khác tự do truy cập được;

  • Giấy phép mở hoặc tiêu chuẩn cung cấp quyền sử dụng lại;

  • Sử dụng các công cụ và dịch vụ trực tuyến để tăng tính minh bạch của các quy trình và phương pháp nghiên cứu;

  • Làm cho nghiên cứu khoa học dễ tái tạo lại hơn bằng cách tăng số lượng và chất lượng thông tin được công khai;

  • Sử dụng các mô hình xuất bản và đánh giá ngang hàng (peer review) thay thế để đẩy nhanh và minh bạch hóa việc phổ biến và chứng nhận nghiên cứu;

  • Sử dụng các phương pháp cộng tác mở để tăng hiệu quả và mở rộng sự tham gia vào nghiên cứu.

Các nguyên tắc của Nghiên cứu Mở được phản ánh trong chính sách của nhiều nhà tài trợ công và tổ chức nghiên cứu thúc đẩy quyền truy cập công khai rộng rãi hơn tới nghiên cứu, và trong các mô hình truyền thông học thuật đang phát triển. Sự thay đổi cũng được thúc đẩy bởi nhu cầu của cộng đồng học thuật và các bên liên quan trong công chúng nói chung, trong ngành công nghiệp và ở các nước đang phát triển.

Trong bối cảnh này, Tuyên bố về Khoa học Mở của UNESCO là một tài liệu chiến lược quan trọng. Tuyên bố này nêu ra nhiều lý do cho chương trình nghị sự mở, bao gồm giải quyết vấn đề nghèo đói và bất bình đẳng; tiềm năng chuyển đổi của một cách tiếp cận khoa học mang tính tham gia nhiều hơn; hòa nhập giáo dục; tiến bộ khoa học; và tầm quan trọng của cơ sở hạ tầng. Các quốc gia thành viên UNESCO được kỳ vọng sẽ thực hiện tuyên bố này thông qua chính sách và luật pháp quốc gia khi cần thiết.

Ở châu Âu, Khoa học Mở (Open Science) thường được áp dụng cho nghiên cứu trong tất cả các lĩnh vực. Nhưng thuật ngữ này cũng thường được sử dụng để chỉ cụ thể các ngành khoa học thực nghiệm, nơi các vấn đề về khả năng tiếp cận, tính minh bạch và khả năng tái tạo là cấp thiết nhất. Mặc dù quyền truy cập tới các kết quả nghiên cứu rất quan trọng bất kể ngành học hay bản chất của nghiên cứu, nhưng nhiều thực hành mở chủ yếu hoặc chỉ liên quan đến khoa học. Các nhà nghiên cứu trong tất cả các lĩnh vực có thể chia sẻ dữ liệu và tài liệu gốc của họ để tối đa hóa giá trị của chúng và cho phép tái sử dụng chúng.

Vì vậy, Nghiên cứu Mở là có thể truy cập được, minh bạch và có thể tái tạo lại. Nhưng, để diễn giải lại lời của một tác giả, đó chẳng phải chỉ là nghiên cứu sao? Nói cách khác, vấn đề gì với nghiên cứu khiến mọi người cứ khăng khăng đòi hỏi nó phải được mở?

Trên thực tế, nghiên cứu có một số vấn đề:

  • Hai phần ba hồ sơ học thuật bị che giấu sau các bức tường phí. Trong số 2 triệu bài báo được đánh giá ngang hàng xuất bản năm 2018, hơn 1,4 triệu bài không thể tiếp cận được đối với nhiều nhà nghiên cứu cũng như công chúng rộng rãi, với những người bên ngoài mạng lưới học thuật của thế giới phát triển bị từ chối quyền truy cập vào các tài liệu khoa học quan trọng một cách không cân xứng. Tình trạng này không chỉ làm trầm trọng thêm sự bất bình đẳng toàn cầu, mà còn gây lãng phí vô số cơ hội tạo ra lợi ích công cộng và kinh tế từ nghiên cứu.

  • Nhiều sản phẩm có giá trị của quá trình nghiên cứu, đặc biệt là dữ liệu nghiên cứu và phần mềm, bị đánh giá thấp trong văn hóa học thuật và hệ thống khen thưởng, và không được cung cấp để người khác sử dụng lại: chúng có thể hoàn toàn không được chia sẻ, hoặc được chia sẻ với chú thích và tài liệu kém cỏi, và ở các định dạng (như PDF) không cho phép dễ dàng sử dụng lại. Lucas-Dominguez và cộng sự (2021) nhận thấy rằng mặc dù các trường hợp khẩn cấp về sức khỏe cộng đồng thường được coi là động lực thúc đẩy thực hành Nghiên cứu Mở (ví dụ: sự gia tăng các nhanh các bài báo trước xuất bản [preprints] về Covid), nhưng bức tranh thực tế phức tạp hơn. Trong số 5.905 bài báo liên quan đến COVID-19 được xuất bản từ ngày 1/12/2019 đến ngày 30/4/2020, chỉ có 13,6% công bố dữ liệu nghiên cứu cơ bản và 75% là tài liệu PDF hoặc Word, điều này có thể cản trở việc sử dụng lại.

  • Nghiên cứu thực nghiệm có đặc điểm là tỷ lệ tái tạo thấp, do nhiều nguyên nhân khác nhau, bao gồm những điểm yếu có thể tránh được trong thiết kế và phương pháp nghiên cứu, sự thiếu thông tin chi tiết về giả thuyết và phương pháp trong các kết quả đã công bố, và việc không chia sẻ dữ liệu hỗ trợ và mã nguồn được sử dụng trong phân tích kết quả. Một cuộc khảo sát do tạp chí Nature thực hiện năm 2016 cho thấy hơn 70% nhà khoa học không thể tái tạo công trình của người khác, và hơn 50% không thể tái tạo thí nghiệm của chính họ! Điều này thể hiện sự lãng phí nguồn lực khổng lồ, và trong các lĩnh vực như nghiên cứu y học và dược phẩm, nó làm suy giảm nghiêm trọng sự phát triển của các phương pháp điều trị hiệu quả. Năm 2015, người ta ước tính rằng nghiên cứu sinh học không thể tái tạo gây thiệt hại 28 tỷ USD mỗi năm.

  • Việc chứng nhận và công bố nghiên cứu cho công chúng phần lớn vẫn gắn liền với một quy trình đánh giá ngang hàng đóng kín (a closed process of peer review), dễ bị ảnh hưởng bởi phán xét của một số ít người đánh giá ngang hàng (thường là ẩn danh), không chịu trách nhiệm trước công chúng, và bị ảnh hưởng nặng nề bởi hiện tượng thiên vị xuất bản – xu hướng áp đảo là công bố các báo cáo về nghiên cứu mới và có hiệu quả đáng kể, bỏ qua các nghiên cứu không có kết quả hoặc có kết quả tiêu cực. Điều này dẫn đến việc kìm hãm một lượng lớn nghiên cứu dựa trên các đánh giá hạn chế, thiếu minh bạch và các yếu tố khác không liên quan đến chất lượng nghiên cứu.

  • Việc truyền đạt các kết quả nghiên cứu có giá trị có thể bị trì hoãn kéo dài khi các bài báo trải qua hệ thống nộp bài và đánh giá ngang hàng đóng kín của nhà xuất bản, làm chậm tốc độ năng suất cá nhân và tiến bộ khoa học. Các tác giả có thể bị mắc kẹt trong quy trình nộp bài nối tiếp kéo dài hàng tháng, thậm chí hàng năm khi họ tìm cách đảm bảo bài báo được chấp nhận. Kết quả thực tế là kìm hãm nghiên cứu do sự chậm trễ.

Các thực hành mở

Các thực hành mở sau đây có thể hỗ trợ nghiên cứu mở:

  • sử dụng việc xuất bản theo một giấy phép mở để truyền đạt các kết quả nghiên cứu, có thể bao gồm các ấn phẩm, dữ liệu, mã phần mềm và các tài liệu khác;

  • phổ biến kết quả nghiên cứu bằng cách sử dụng các máy chủ hoặc tạp chí tiền ấn phẩm;

  • gửi bài báo đến một tạp chí theo quy trình đánh giá ngang hàng mở (open peer review process) chính thức do nhà xuất bản quản lý, hoặc đóng vai trò là người đánh giá ngang hàng theo hệ thống đánh giá ngang hàng mở do nhà xuất bản quản lý;

  • tạo ra một bảncông khai trước đăng ký về thiết kế nghiên cứu hoặc xuất bản nghiên cứu dưới dạng báo cáo đã đăng ký;

  • xuất bản một mô tả các nguồn tài nguyên nghiên cứu được đánh giá ngang hàng chính thức, chẳng hạn như bài báo về dữ liệu hoặc bài báo về phần mềm;

  • kết hợp các phương pháp mở và có sự tham gia vào thiết kế và tiến hành nghiên cứu, ví dụ: bằng cách sử dụng các phương pháp dựa trên các ghi chép mở hoặc tạo ra dự án bằng cách sử dụng nền tảng khoa học công dân (citizen science) trực tuyến;

  • giới thiệu các khái niệm, thực hành và nguồn tài nguyên Nghiên cứu Mở vào giảng dạy và học tập;

  • tạo ra các công cụ hoặc công nghệ để hỗ trợ các thực hành Nghiên cứu Mở, ví dụ: để kết hợp hoặc tái sử dụng các tập dữ liệu và các kết quả nghiên cứu khác từ các địa điểm hoặc lĩnh vực khác nhau, hoặc để khai thác nội dung; sử dụng phần cứng mở (open hardware)

  • thực hiện các hoạt động để phát triển môi trường cho Nghiên cứu Mở, ví dụ: bằng cách tham gia vào các hoạt động truyền thông cấp cao, bằng cách khiến một tạp chí áp dụng các chính sách ủng hộ Nghiên cứu Mở, hoặc bằng cách tham gia vào các sáng kiến cộng đồng để phát triển các tiêu chuẩn dữ liệu hoặc siêu dữ liệu.

Giấy phép Mở

Quyền truy cập và sử dụng một hạng mục, để làm cơ sở mà người dùng khác có thể dựa vào, cần phải được nêu rõ ràng, được cấp không thể thu hồi và được pháp luật công nhận. Các điều kiện này được đáp ứng bằng cách cung cấp cho một hạng mục để khả dụng theo một giấy phép.

Giấy phép trong ngữ cảnh này là sự cho phép chính thức để sử dụng tài liệu được chỉ định. Nó cho người dùng tiềm năng biết họ được phép và không được phép làm gì với một tài sản trí tuệ. Một hạng mục không có giấy phép có thể không sử dụng được cho một số mục đích thực tế. Một nhà nghiên cứu không sử dụng được tập dữ liệu nếu họ không được phép sửa đổi hoặc phân phối lại nó; Một công ty sẽ không dựa vào phần mềm của bên thứ ba để vận hành hoạt động thương mại nếu không có sự đảm bảo rằng phần mềm đó có thể được sử dụng cho mục đích cần thiết.

Giấy phép cũng cung cấp sự bảo vệ cho người sáng tạo và chủ sở hữu tài sản trí tuệ. Kèm theo tuyên bố về quyền, giấy phép thiết lập quyền sở hữu hợp pháp đối với hạng mục được cấp phép và khẳng định quyền của người sáng tạo được công nhận là người sáng tạo. Điều kiện ghi công, phổ biến trong nhiều giấy phép mở, là cơ sở pháp lý cho quyền của bạn được ghi nhận là người sáng tạo ra tài liệu được cấp phép. Nhiều giấy phép cũng bao gồm các tuyên bố từ chối trách nhiệm chính thức đối với bất kỳ thiệt hại nào có thể phát sinh từ việc người khác sử dụng tài liệu đó.

Các giấy phép mở đã được sử dụng rộng rãi để cấp phép cho các kết quả nghiên cứu (cũng như các tài liệu có bản quyền khác) nhằm tối đa hóa tiềm năng tái sử dụng của chúng. Các ví dụ về giấy phép mở bao gồm:

Tất cả các giấy phép mở đều có một số đặc điểm chung:

  • Giấy phép được thể hiện dưới dạng một bộ các điều khoản tiêu chuẩn (mã pháp lý) được nhà cung cấp giấy phép công bố. Trong tuyên bố giấy phép đính kèm với một tác phẩm, mã pháp lý phải được tham chiếu rõ ràng bằng URL của nó hoặc bằng cách đưa toàn bộ vào tài liệu được cấp phép.

  • Giấy phép về cơ bản là cho phép (trái ngược với các giấy phép bản quyền giữ lại tất cả các quyền [all rights reserved] và giấy phép sở hữu độc quyền [proprietary license], vốn mang tính hạn chế). Mục đích của nó là cho phép người khác sử dụng tài liệu được cấp phép. Giấy phép mở cuối cùng cho phép bất kỳ ai cũng có thể tự do truy cập, sử dụng, sửa đổi và chia sẻ một hạng mục vì bất kỳ mục đích nào. Giấy phép cấm sử dụng cho mục đích thương mại hoặc cấm phân phối các tài liệu phái sinh không đáp ứng đầy đủ định nghĩa của giấy phép mở, vì những hạn chế mà các điều khoản này đặt ra đối với việc tái sử dụng, nhưng nó vẫn nằm trong phạm vi mở. Có thể có những lý do chính đáng để xuất bản theo giấy phép mở với một số hạn chế, chẳng hạn như để bảo vệ lợi ích thương mại hoặc ngăn chặn việc lạm dụng các tác phẩm được tạo ra trong lĩnh vực nhân văn, nơi hình thức biểu đạt là yếu tố không thể thiếu đối với giá trị của chúng.

  • Giấy phép thường bao gồm các biện pháp bảo vệ cho người sáng tạo và chủ sở hữu của tài liệu được cấp phép, dưới hình thức tuyên bố miễn trừ trách nhiệm và yêu cầu ghi công. Việc Hiến tặng vào Phạm vi công cộng (như CC0) không bao gồm yêu cầu ghi công, vì theo định nghĩa, đó là sự khước từ quyền đối với tài liệu, nhưng vẫn có thể bao gồm tuyên bố miễn trừ trách nhiệm.

Bộ giấy phép Creative Commons bao gồm các phiên bản với các điều khoản Phi thương mại (Non-Commercial) và Không phái sinh (No-Derivatives). Những giấy phép này có thể được coi là mở, ở chỗ chúng cho phép truy cập tài liệu một cách tự do, mặc dù chúng không mở theo nghĩa đầy đủ nhất vì những hạn chế mà chúng đặt ra đối với việc tái sử dụng. Nếu không thể cung cấp tài liệu theo giấy phép mở hoàn toàn, thì việc xuất bản theo giấy phép tiêu chuẩn gần nhất vẫn là một lựa chọn khôn ngoan. Giấy phép CC BY-NC có thể không phải là giấy phép mở nhất, nhưng nó cho phép sử dụng rộng rãi trong nghiên cứu, giảng dạy và các hoạt động phi thương mại khác.

Dữ liệu Mở (Open Data)

Việc chia sẻ dữ liệu nghiên cứu ngày càng trở thành một kỳ vọng của các nhà tài trợ. Điều này thường được thực hiện để hỗ trợ việc chứng minh bằng chứng nghiên cứu hoặc để cho phép tái tạo các kết quả khoa học. Dữ liệu nghiên cứu ngày càng được coi là một sản phẩm nghiên cứu có giá trị riêng và việc làm thành dữ liệu mở là một con đường tốt để tạo ra tác động và khả năng tái sử dụng lớn hơn.

Có nhiều tùy chọn cấp phép cho dữ liệu mở, và người tạo ra các tập dữ liệu có nhiều quyền tự do hơn trong việc lựa chọn giấy phép phù hợp. Điều này là do các tập dữ liệu có thể phức tạp: chúng có thể bao gồm tài sản trí tuệ từ nhiều nguồn khác nhau và có thể phải tuân theo nhiều hạn chế của bên thứ ba, ví dụ, liên quan đến việc tái sử dụng cho mục đích thương mại.

Theo nguyên tắc, bạn nên chọn tùy chọn giấy phép mở nhất, và chỉ đưa ra các hạn chế khi những hạn chế này được biện minh bởi bản chất của tài liệu hoặc bởi bất kỳ yêu cầu nào của bên thứ ba. (Ví dụ, nếu một tập dữ liệu là sản phẩm của nghiên cứu được thực hiện với một đối tác thương mại, đối tác đó có thể yêu cầu phát hành tập dữ liệu theo giấy phép phi thương mại để bảo vệ đặc quyền thương mại của họ.)

Theo Định nghĩa Mở (Open Definition), dữ liệu mở 'có thể được bất kỳ ai tự do sử dụng, sửa đổi và chia sẻ vì bất kỳ mục đích nào'. Nhưng chỉ riêng sự cho phép thôi là chưa đủ nếu không có phương tiện để tìm kiếm, truy cập và sử dụng dữ liệu. Dữ liệu mở cũng phải đáp ứng các điều kiện sau:

  • được xác định rõ ràng và được ghi chép chính thức trong hồ sơ công khai trên trực tuyến, để có thể trích dẫn và tìm thấy một cách chính xác chúng;

  • có thể truy cập được, để có thể mở, đọc và xử lý chúng;

  • được trình bày và ghi chép theo cách dễ hiểu và dễ sử dụng chúng.

Những điều kiện về khả năng sử dụng này được thể hiện trong Nguyên tắc Dữ liệu FAIR (FAIR Data Principles), theo đó dữ liệu phải có thể Tìm thấy được, Truy cập được, Tương hợp được và Tái sử dụng được (Findable, Accessible, Interoperable, Re-usable). Nguyên tắc FAIR lần đầu tiên được một nhóm các bên liên quan từ giới học thuật, công nghiệp, các cơ quan tài trợ và các nhà xuất bản học thuật đưa ra vào năm 2016. Các Nguyên tắc này đặc biệt nhấn mạnh khả năng của máy móc trong việc tự động tìm kiếm và sử dụng dữ liệu và/hoặc siêu dữ liệu liên quan, ngoài việc hỗ trợ các cá nhân tái sử dụng. Dữ liệu FAIR không nhất thiết phải là dữ liệu mở, và có thể có những lý do chính đáng khiến chúng không thể là dữ liệu mở (pháp lý, đạo đức, thương mại). Trong những trường hợp như vậy, FAIR vẫn hỗ trợ tái sử dụng.

Tìm thấy được và Truy cập được (Findable and Accessible)

FAIR có nghĩa là gì trong thực tế? Chúng ta hãy xem xét các Nguyên tắc FAIR một cách chi tiết hơn. Khá phổ biến đối với các bài báo báo cáo kết quả dựa trên việc thu thập và phân tích dữ liệu sơ bộ là nói rằng: "Dữ liệu hỗ trợ cho những phát hiện này có thể được cung cấp theo yêu cầu". Quyền truy cập dữ liệu đã được cho phép, nhưng liệu chúng có thể tìm thấy và truy cập được không?

Dữ liệu không có trong hồ sơ công khai - không có mô tả rõ ràng về dữ liệu hoặc trích dẫn chính thức, vì vậy tập dữ liệu không thể được xác định chính xác. Sự tồn tại của dữ liệu không được xác minh độc lập, và không có gì đảm bảo rằng chúng và thông tin về chúng sẽ tiếp tục tồn tại và có sẵn. Việc truy cập dữ liệu phụ thuộc vào việc người yêu cầu có thể tìm thấy tác giả (người có thể đã chuyển đi, nghỉ hưu hoặc qua đời), vào việc tác giả sẵn lòng cung cấp dữ liệu kịp thời, vào việc tác giả có thể đối chiếu dữ liệu được cung cấp với dữ liệu đã được mô tả trước đó và hiện đang được yêu cầu, và vào việc tác giả có thể truy xuất dữ liệu và dữ liệu đó không bị hư hỏng. Với chuỗi phụ thuộc này, xác suất dữ liệu trở nên không thể tìm thấy và không thể truy cập được sẽ tăng dần theo thời gian. Một nghiên cứu được công bố năm 2014 cho thấy tỷ lệ truy cập được dữ liệu liên quan đến các nghiên cứu đã công bố giảm 17% mỗi năm, với địa chỉ email không hợp lệ và thiết bị lưu trữ lỗi thời là nguyên nhân chính gây ra lỗi truy cập.

Để dữ liệu có thể Tìm thấy và Truy cập được, cần phải công bố đầy đủ thông tin để có thể xác định, định vị và truy cập chúng một cách rõ ràng; thông tin này, và bản thân các tập dữ liệu, cần phải được duy trì theo thời gian; và phương thức cung cấp quyền truy cập cần được quản lý về mặt tổ chức và được xác định theo quy trình thủ tục, để chúng không bị phụ thuộc vào một điểm lỗi duy nhất.

Tương hợp được (Interoperable)

Điều này có nghĩa là thông tin về dữ liệu phải được công bố ở định dạng máy đọc được, tức là dưới dạng bản ghi siêu dữ liệu có cấu trúc trực tuyến sử dụng các từ vựng hoặc bản thể học (ontologies) tiêu chuẩn để ghi lại các phần tử siêu dữ liệu. Khả năng máy đọc được nên mở rộng đến chính bản thân đối tượng dữ liệu càng nhiều càng tốt. Điều này có thể bao gồm việc lưu trữ dữ liệu ở các định dạng tệp mở và có thể chỉnh sửa với việc mã hóa ngữ nghĩa, chứ không phải các định dạng sở hữu độc quyền với việc mã hóa không minh bạch hoặc không có ngữ nghĩa. Ví dụ: dữ liệu đồ họa và bảng thường được cung cấp dưới dạng thông tin bổ sung cùng với các bài báo tạp chí ở định dạng PDF. Đây là định dạng gần như vô dụng để lưu trữ dữ liệu định lượng có cấu trúc, vì nó không cho phép dữ liệu được trích xuất, chỉnh sửa và phân tích một cách dễ dàng. 

Một ví dụ khác: mặc dù các tệp Microsoft Excel có thể được mở trong nhiều ứng dụng phần mềm và có thể được xuất sang định dạng XML, nhưng việc định dạng và công thức được nhúng có thể bị mất trong quá trình chuyển đổi. Tốt hơn hết là nên bảo tồn dữ liệu ở các định dạng mở, chẳng hạn như CSV cho dữ liệu dạng bảng, có thể truy cập được phổ biến và không chứa các thành phần được nhúng có thể không hoạt động trong một số ứng dụng.

Tái sử dụng được (Re-usable)

Ngay cả khi giả sử một tệp dữ liệu có thể được truy xuất và truy cập được về mặt kỹ thuật, nó vẫn có thể không sử dụng được.

Hãy tưởng tượng một bảng các giá trị, với các hàng dành cho người tham gia nghiên cứu và các cột dành cho các biến số. Người dùng có thể xác định rõ ràng biến số từ tiêu đề cột không? Đơn vị đo lường có được chỉ định không? Các giá trị thiếu được ghi lại như thế nào? Các giá trị đã được làm tròn lên hay được tính trung bình từ nhiều phép đo? Đây có phải là tất cả dữ liệu hay các bất thường và ngoại lệ đã được loại bỏ, và nếu vậy, theo tiêu chí nào? Các giao thức nào đã được tuân theo để thu thập dữ liệu? Những công cụ nào đã được sử dụng? Những biến ngữ cảnh bổ sung nào có thể liên quan? (ví dụ: dữ liệu được thu thập ở đâu? vào thời điểm nào trong năm? thời gian trong ngày? thời tiết? đối tượng nghiên cứu còn được nuôi hay là không?) Dữ liệu được thu thập để trả lời câu hỏi nghiên cứu nào và dữ liệu đã được phân tích như thế nào?

Chúng ta có thể thấy rằng xung quanh dữ liệu thô là nhiều cấp độ thông tin khác nhau, điều này cho phép bạn và những người dùng khác hiểu dữ liệu theo nhiều cách khác nhau. Đối với bạn, phần lớn thông tin này sẽ là ngầm định và có thể không cần phải ghi lại, nhưng đối với người dùng khác, những người không có kinh nghiệm về bối cảnh hoặc phương pháp nghiên cứu, thông tin cần phải được làm rõ.

Do đó, dữ liệu phải được cung cấp đầy đủ thông tin và tài liệu hỗ trợ để có thể hiểu và sử dụng được.

Để là mở và tuân thủ nguyên tắc FAIR, dữ liệu nên được lưu trữ trong một kho dữ liệu. Đây là một dịch vụ tồn tại để bảo tồn và cung cấp quyền truy cập tới dữ liệu nghiên cứu. Kho dữ liệu là một phương tiện đảm bảo tính bền vững trong tương lai, giúp đảm bảo dữ liệu vẫn có thể truy cập và sử dụng được trong thời gian dài. Nó được ưu tiên hơn so với việc chia sẻ dữ liệu dưới dạng các tệp bổ sung cùng với một bài báo đã xuất bản, hoặc thông qua các dịch vụ lưu trữ tệp dựa trên đám mây, hoặc duy trì dữ liệu trong bộ nhớ riêng và chỉ chia sẻ theo yêu cầu.

Không nên nhầm lẫn kho dữ liệu (data repository) với các dịch vụ dựa trên đám mây cung cấp lưu trữ và chia sẻ tệp, chẳng hạn như Google Drive hoặc Open Science Framework. Kho dữ liệu thực hiện một số chức năng cụ thể:

  • Nó chủ động bảo tồn dữ liệu, ví dụ: sao chép và xác thực các tập dữ liệu, chuyển đổi sang các định dạng lưu trữ;

  • Công bố siêu dữ liệu để cho phép tìm kiếm trực tuyến;

  • Gán mã định danh thường trực duy nhất (persistent unique identifier) (ví dụ: DOI) cho các tập dữ liệu và làm cho chúng có thể trích dẫn được;

  • Nó kiểm soát chất lượng các tập dữ liệu và cải thiện siêu dữ liệu, ví dụ: bằng cách áp dụng các từ vựng chuẩn (không phải tất cả các kho lưu trữ đều làm vậy);

  • Nó quản lý quyền truy cập dữ liệu để người khác có thể sử dụng;

  • Nó áp dụng các thông báo cấp phép, để làm rõ các điều khoản sử dụng và yêu cầu ghi công.

Ví dụ về các kho lưu trữ dữ liệu bao gồm: các trung tâm dữ liệu chuyên ngành và các cơ sở dữ liệu thành phần của chúng, chẳng hạn như các trung tâm dữ liệu NERC và các cơ sở dữ liệu của Viện Tin sinh học Châu Âu; các kho lưu trữ dữ liệu của các tổ chức; và các dịch vụ chia sẻ dữ liệu đa năng, chẳng hạn như Zenodofigshare.

Khi dữ liệu được thu thập từ các tổ chức thương mại, hoặc khi nghiên cứu được thực hiện hợp tác với các công ty, người ta có thể cho rằng dữ liệu không thể được chia sẻ. Điều này không nhất thiết đúng.

Không phải tất cả thông tin do các tổ chức thương mại cung cấp đều là thông tin bí mật thương mại, và các công ty có thể sẵn sàng cho phép dữ liệu do họ cung cấp được làm thành sẵn sàng mở - với việc biên tập lại nếu cần thiết.

Việc xuất bản mở dữ liệu không nhất thiết là kẻ thù của các mục tiêu thương mại, và trên thực tế có thể thúc đẩy chúng. Các tập đoàn mà mở dữ liệu của họ ra, và có liên kết với các tổ chức nghiên cứu uy tín, sẽ thu được lợi ích về danh tiếng. Việc mở ra có thể là một chiến lược có giá trị để xây dựng lòng tin và là nền tảng cho sự cộng tác lâu dài. Nhiều doanh nghiệp thương mại thành công dựa trên mô hình kinh doanh Phần mềm Nguồn mở. Trong một số lĩnh vực - ví dụ như ngành dược phẩm - tiềm năng chuyển đổi của Nghiên cứu Mở đã và đang được tích cực thảo luận và khám phá.

Việc hạn chế quyền truy cập dữ liệu là chấp nhận được nếu chúng là thông tin bí mật thương mại hoặc có hướng đi thương mại cho nghiên cứu, ví dụ như liên quan đến một đối tác công nghiệp đã được xác định. Nếu cần bảo hộ sở hữu trí tuệ, cần phải cho phép công bố dữ liệu sau khi việc bảo hộ được xác nhận.

Một số tập dữ liệu có thể tự thân là kết quả nghiên cứu có giá trị. Ví dụ, điều này có thể xảy ra với các quan sát môi trường hoặc dữ liệu khảo sát, vốn dĩ là độc nhất và không thể thay thế.

Nếu bạn đã tạo ra một tập dữ liệu mở có giá trị trong quá trình làm việc, bạn có thể quảng bá rộng rãi tập dữ liệu đó và nhận được sự ghi nhận học thuật với tư cách là người tạo ra nó bằng cách xuất bản một bài báo dữ liệu. Đây là một bài báo được đánh giá ngang hàng, được xuất bản trong một tạp chí học thuật, mô tả một tập dữ liệu được tạo ra trong bối cảnh nghiên cứu.

Một bài báo dữ liệu có thể là một phương tiện hiệu quả để quảng bá một tập dữ liệu có giá trị và khuyến khích người khác sử dụng và trích dẫn nó. Một bài báo dữ liệu cũng là một kết quả có thể trích dẫn được, và là một phương tiện để đảm bảo rằng sự ghi nhận thích đáng được dành cho những người tham gia tạo ra tập dữ liệu đó. Một bài báo dữ liệu cũng có thể cung cấp cho người dùng tiềm năng của dữ liệu đó thông tin có giá trị về cách thức và lý do tại sao tập dữ liệu được tạo ra, cách nó đã được sử dụng và cách nó có thể được sử dụng hoặc phát triển hơn nữa. 

Cần lưu ý rằng mục đích chính của bài báo dữ liệu là thúc đẩy việc tái sử dụng, và nhiều tạp chí sẽ yêu cầu tập dữ liệu được mô tả phải được cung cấp theo giấy phép mở. Một số hạn chế của giấy phép tiêu chuẩn, chẳng hạn như điều khoản sử dụng phi thương mại, có thể không được chấp nhận.

Một ví dụ về bài báo phần mềm được các thành viên của trường đại học xuất bản được cung cấp bên dưới.

nhiều tạp chí sẽ xuất bản các bài báo dữ liệu, bao gồm các tạp chí chuyên về dữ liệu và các tạp chí "hỗn hợp", sẽ xuất bản cả bài báo dữ liệu và các bài báo nghiên cứu thông thường.

Ví dụ về các tạp chí chuyên về dữ liệu là: Data in Brief, Earth System Science Data, Journal of Open Archaeology Data, Nature Scientific Data, Open Health DataPolar Data Journal.

Đây là ví dụ về các tạp chí/nền tảng cũng sẽ xuất bản các bài báo về dữ liệu: F1000Research, GigaScience, PLOS ONEWellcome Open Research.

Đánh giá ngang hàng mở (Open Peer Review)

Theo truyền thống, đánh giá ngang hàng đối với các kết quả đầu ra nghiên cứu hoạt động theo mô hình đóng kín, trong đó tác giả của sản phẩm không biết danh tính của người đánh giá. Điều này được gọi là đánh giá ngang hàng "mù" (blind) hoặc đóng kín (closed). Có các biến thể của mô hình này - đánh giá ngang hàng mù đôi (double blind peer review) là khi danh tính của tác giả được giấu kín với người đánh giá và danh tính của người đánh giá được giấu kín với tác giả. Trên thực tế, do lĩnh vực nghiên cứu hẹp của một số nhà nghiên cứu, cả người đánh giá và tác giả thường có thể đoán được danh tính của nhau.

Ưu điểm của mô hình truyền thống

Nhược điểm của mô hình truyền thống

Người đánh giá có thể cởi mở và thẳng thắn trong bài đánh giá của họ.Người đánh giá có thể thô lỗ và tiêu cực trong nhận xét về kết quả đầu ra vì họ sẽ không bị/được tiết lộ danh tính cho tác giả.
Đánh giá ngang hàng mù đôi có thể giảm thiểu sự thiên vị của người đánh giáNgười đánh giá có thể có sự thiên vị
Các nhà nghiên cứu trẻ có thể bình luận ẩn danh về công trình của các nhà nghiên cứu có kinh nghiệm hơn mà không sợ bị trả đũa.Người đánh giá có thể cố tình trì hoãn việc xuất bản nếu công trình đang được xem xét có thể vượt mặt công trình của họ.

 
Người đánh giá có thể bị ảnh hưởng bởi vị thế của tác giả trong cộng đồng.

Để làm cho quá trình đánh giá ngang hàng công bằng hơn, minh bạch hơn và ít bị thiên vị hơn, nhiều mô hình đánh giá ngang hàng mở đã được phát triển. Trong một số trường hợp, danh tính của người bình duyệt chỉ được tiết lộ khi quyết định về kết quả nghiên cứu đã được đưa ra. Trong những trường hợp khác, danh tính của người bình duyệt và nội dung bài đánh giá được công bố cùng với bài báo cuối cùng đã được xuất bản để người đọc có thể tự đánh giá chất lượng, tính chặt chẽ và tính công bằng của bài đánh giá. Có rất nhiều biến thể của mô hình đánh giá ngang hàng mở; Một nghiên cứu năm 2017 đã xác định 22 sự kết hợp khác nhau của 7 yếu tố cơ bản của đánh giá ngang hàng mở:

  1. Minh bạch về danh tính của người đánh giá và/hoặc tác giả

  2. Công bố nội dung của các bài đánh giá ngang hàng (đôi khi được kết hợp hoặc chỉnh sửa)

  3. Mở rộng đánh giá ngang hàng cho cộng đồng độc giả quan tâm rộng lớn hơn

  4. Cho phép tương tác giữa tác giả, biên tập viên và người đánh giá để làm cho đánh giá ngang hàng mang tính cộng tác và xây dựng hơn

  5. Đánh giá ngang hàng mở trước khi xuất bản bằng cách sử dụng bản thảo trước khi xuất bản (preprints)

  6. Cho phép bình luận sau khi xuất bản để độc giả có thể đưa ra nhận xét và tác giả/độc giả khác có thể phản hồi

  7. Một số nền tảng cho phép xuất bản trước khi đánh giá ngang hàng

Ưu điểm của mô hình mở

Nhược điểm của mô hình mở

Xung đột lợi ích sẽ dễ dàng nhận thấy đối với cả tác giả và độc giả.Người đánh giá có thể không quá khắt khe hoặc nghiêm túc vì nhận xét của họ sẽ được mọi người nhìn thấy.
Độc giả có thể thấy sự tiến bộ của tác phẩm thông qua đánh giá ngang hàng bằng cách đọc nhận xét của người đánh giá và phản hồi của tác giả.Các nhà nghiên cứu trẻ có thể lo sợ bị trả đũa nếu họ đưa ra đánh giá không thuận lợi cho một nhà nghiên cứu có thâm niên/có ảnh hưởng hơn.
Người đánh giá phải chịu trách nhiệm nhiều hơn về những bình luận của họ.Một số nhà nghiên cứu sẽ từ chối lời mời đánh giá công khai vì họ không muốn ý kiến hoặc danh tính của mình bị công khai.
Những đánh giá thiên vị hoặc không chính xác sẽ dễ dàng bị/được nhận ra đối với người đọc và các tác giả của sản phẩm nghiên cứu.
 
Các đánh giá mở có thể được sử dụng làm tài liệu đào tạo cho thế hệ người đánh giá ngang hàng tiếp theo – điều cần thiết để duy trì chất lượng đánh giá ngang hàng cao.
 
Giao tiếp trực tiếp giữa tác giả và người đánh giá ngang hàng có thể giảm thiểu sự nhầm lẫn hoặc hiểu lầm và dẫn đến việc sửa đổi mang tính xây dựng và nhanh chóng hơn.
 
Người đánh giá có thể nhận được tín nhiệm và sự công nhận cho những đóng góp của họ vào quá trình đánh giá ngang hàng. Nếu các bản đánh giá được công bố và được cấp DOI, chúng có thể được thêm vào hồ sơ ORCID và sơ yếu lý lịch.
 


 

Khả năng tái tạo 

Thảo luận về "khủng hoảng khả năng tái tạo" trong nghiên cứu khoa học đã làm nổi bật tỷ lệ thất bại cao trong việc tái tạo kết quả của các nghiên cứu đã được công bố. Một cuộc khảo sát các nhà nghiên cứu được công bố trên tạp chí Nature năm 2016 cho thấy hơn 70% nhà nghiên cứu đã cố gắng và thất bại trong việc tái tạo thí nghiệm của một nhà khoa học khác, và hơn một nửa đã thất bại trong việc tái tạo thí nghiệm của chính họ. Nghiên cứu mà kết quả không thể tái tạo được là không đáng tin cậy và lãng phí. Năm 2015, người ta ước tính rằng nghiên cứu sinh học không thể tái tạo gây thiệt hại 28 tỷ đô la Mỹ mỗi năm.

Nhiều lý do đã được đưa ra cho tỷ lệ tái tạo thấp, bao gồm việc báo cáo phương pháp nghiên cứu kém, điểm yếu trong thiết kế nghiên cứu và phân tích thống kê, và việc không cung cấp quyền truy cập vào dữ liệu và mã phần mềm hỗ trợ các kết quả đã được công bố.

Các nhà phê bình cũng cáo buộc những thiếu sót cơ bản trong hệ thống khen thưởng học thuật, vốn quá coi trọng việc công bố nhanh chóng các kết quả mới trên các tạp chí có ảnh hưởng cao, và thiếu các tiêu chuẩn tái tạo nghiêm ngặt, được áp dụng một cách có hệ thống. Các nhà nghiên cứu được khuyến khích đi theo con đường ngắn nhất để công bố, báo cáo quá mức về ý nghĩa và đánh giá thấp kết quả. Người ta lập luận rằng nếu hệ thống khen thưởng đặt trọng tâm cao hơn vào tính khả kiểm chứng, và nếu các nhà nghiên cứu có động lực hơn để công khai các giả thuyết, phương pháp và dữ liệu hỗ trợ các phát hiện khoa học, thì họ sẽ có nhiều hơn khả năng tạo ra các nghiên cứu có thể tái tạo và đáng tin cậy, và mức độ lãng phí cũng như nguy cơ gian lận sẽ giảm.

Nhiều nhà nghiên cứu trong các ngành khoa học thực nghiệm đang tích cực thúc đẩy cải cách. Trong bản tuyên ngôn về khoa học có thể tái tạo, một nhóm các nhà nghiên cứu quan tâm đề xuất một loạt các biện pháp mà các bên liên quan trong nghiên cứu khoa học, bao gồm các nhà nghiên cứu, tổ chức nghiên cứu, nhà tài trợ và nhà xuất bản, có thể thực hiện để cải thiện hiệu quả nghiên cứu và tính vững chắc của các phát hiện khoa học.

Khả năng tái tạo bắt đầu từ việc lập kế hoạch. Việc viết Kế hoạch Quản lý Dữ liệu - DMP (Data Management Plan) ngay từ đầu dự án có thể giúp bạn tối đa hóa khả năng tái tạo nghiên cứu của mình. Một số nhà tài trợ (bao gồm hầu hết các Hội đồng Nghiên cứu, Ủy ban Châu Âu, Hội Hoàng gia và Quỹ Wellcome Trust) sẽ yêu cầu các nhà nghiên cứu nộp DMP như một phần của đơn xin tài trợ. Ưu điểm của việc viết DMP là:

  • Nó giúp bạn lập kế hoạch quản lý dữ liệu bạn thu thập hoặc tạo ra trong suốt quá trình dự án và về lâu dài, đồng thời xác định sớm các yêu cầu cần được giải quyết, ví dụ như cần phải có được sự đồng thuận để chia sẻ dữ liệu;

  • Khi dữ liệu được quản lý trong một nhóm nghiên cứu hoặc trong một quan hệ đối tác, nó giúp ghi lại vai trò và trách nhiệm, để dữ liệu được quản lý hiệu quả và nhất quán theo các tiêu chuẩn đã thỏa thuận;

  • Trong các hoạt động nghiên cứu cộng tác, nó có thể giúp thiết lập quyền sở hữu trí tuệ và quyền sở hữu dữ liệu, cũng như cho phép những người khác sử dụng dữ liệu, để tránh nhầm lẫn hoặc bất đồng về quyền sở hữu và sử dụng dữ liệu;

  • Nó cho phép bạn xác định chi phí của các hoạt động quản lý dữ liệu, điều bạn có thể được chi trả thông qua khoản tài trợ của mình.

Trong một số lĩnh vực nghiên cứu, đặc biệt là trong khoa học sức khỏe và tâm lý, các thực hành đang được thiết lập để đăng ký giả thuyết và giao thức nghiên cứu trước khi tiến hành nghiên cứu. Lý do cho việc này là để đảm bảo tính minh bạch về các phương pháp nghiên cứu được sử dụng, và để loại bỏ những thực tiễn không tốt, chẳng hạn như đưa ra giả thuyết sau khi đã biết kết quả (HARKing) và lựa chọn kết quả một cách có chủ đích để "tạo ra" hoặc phóng đại ý nghĩa. Việc đăng ký thử nghiệm lâm sàng là bắt buộc ở nhiều quốc gia, và ngày càng nhiều nhà nghiên cứu sử dụng các nền tảng như Khung Khoa học Mở - OSF (Open Science Framework) để đăng ký các đề cương nghiên cứu.

Việc đăng ký công khai các giả thuyết và đề cương nghiên cứu có thể xác định thứ tự ưu tiên của một phương pháp nghiên cứu và bảo vệ tính toàn vẹn của kết quả. Nhiều mô hình để đưa việc đánh giá ngang hàng chính thức các quy trình nghiên cứu vào các giai đoạn sớm hơn của lộ trình nghiên cứu cũng đã xuất hiện. Điều này có thể nâng cao chất lượng thiết kế nghiên cứu và độ tin cậy/khả năng tái tạo của kết quả. Nó cũng cung cấp một giải pháp cho hiện tượng thiên vị xuất bản - trong đó quyết định công bố hoặc phổ biến nghiên cứu dựa trên nhận thức về tầm quan trọng hoặc sự quan tâm đến các kết quả. Một số nhà xuất bản hiện nay cung cấp các tùy chọn báo cáo được đăng ký, theo đó các nhà nghiên cứu có thể gửi thiết kế nghiên cứu để được đánh giá ngang hàng và khi được chấp nhận sẽ nhận được cam kết từ tạp chí về việc xuất bản các kết quả cuối cùng.

Để minh bạch và có thể tái tạo, các phát hiện nghiên cứu đã được công bố phải được dữ liệu và mã nguồn có thể truy cập mở hỗ trợ. Các tài liệu hỗ trợ nên được bảo quản và cung cấp bằng cách sử dụng các kho lưu trữ phù hợp, và được tham chiếu từ các ấn phẩm liên quan bằng cách sử dụng một trích dẫn DOI.

Cộng tác mở (Open Collaboration)

Các công cụ nghiên cứu và điện toán trực tuyến cho phép nhà nghiên cứu cung cấp quyền truy cập trực tiếp cho công chúng vào quy trình nghiên cứu. Các trang web, wiki và blog, môi trường nghiên cứu trực tuyến và nền tảng khoa học công dân đều có thể được sử dụng theo nhiều cách khác nhau để ghi lại và công bố các quy trình và tài liệu chính của nghiên cứu, đồng thời cho phép sự tham gia trực tiếp vào các hoạt động nghiên cứu của nhiều nhóm người dùng hơn.

Nhiều công cụ trong số này tạo ra khả năng cho một loại hình nghiên cứu mới, mở rộng vượt ra ngoài một nhóm đóng kín đến công chúng rộng lớn hơn, và cho phép quy trình nghiên cứu mang tính đồng sáng tạo, cộng tác quy mô lớn và phát triển dựa trên phản hồi mang tính xây dựng.

Mô hình cơ bản của nghiên cứu cộng tác mở trực tuyến có thể áp dụng cho tất cả các lĩnh vực nghiên cứu, không chỉ riêng khoa học. Có thể có nhiều công cụ chuyên biệt hơn dành cho các nhà khoa học thực nghiệm, nhưng các nền tảng như Zooniverse và các công cụ cộng tác cũng có thể hiệu quả không kém trong các lĩnh vực nghệ thuật và nhân văn hoặc nghiên cứu khoa học xã hội.

Ở dạng cơ bản và phổ quát nhất, cộng tác mở trực tuyến được xây dựng xung quanh các nền tảng trực tuyến chung như blog và wiki, cho phép công chúng truy cập và tham gia vào nghiên cứu. 

Một trong những ví dụ nền tảng là Dự án Polymath do nhà toán học Tim Gowers của Đại học Cambridge khởi xướng năm 2009, một ứng dụng dựa trên blog theo nguyên tắc nguồn đám đông (crowdsourcing) cho việc giải quyết các vấn đề toán học, chứng minh rằng các vấn đề có thể được giải quyết nhanh chóng và hiệu quả hơn nhiều nếu chúng được công bố và xử lý trực tuyến, với nhiều người đóng góp mang đến những mảnh ghép riêng của họ và cùng nhau hoàn thiện bức tranh. Cách tiếp cận này để giải quyết các vấn đề khoa học được thảo luận trong bài thuyết trình TEDx của Michael Nielsen, "Khoa học Mở ngay bây giờ!" (Open science now!).

Trang web, blog và wiki tiếp tục là những công cụ mạnh mẽ để thu hút các đối tượng và lôi kéo mọi người tham gia nghiên cứu. Chúng rất phù hợp để quản lý các tương tác đơn giản. Nhưng chúng không được xây dựng chuyên dụng để hỗ trợ các quy trình nghiên cứu và có một số hạn chế:

  • Chúng có thể không đủ năng động hoặc linh hoạt để quản lý quy trình nghiên cứu và các tương tác cộng tác phức tạp giữa nhiều người tham gia;

  • Chúng có thể thiếu tính năng kiểm soát phiên bản, khôi phục trạng thái trước đó và xuất thông tin, gây khó khăn trong việc lưu giữ hồ sơ quá trình nghiên cứu, điều này có thể rất cần thiết cho việc xác thực và sao chép kết quả;

  • Chúng có thể thiếu các tính năng quan trọng như lưu trữ tài liệu tập trung, chức năng quản lý nội dung và kiểm soát truy cập, có nghĩa là chúng phải được sử dụng kết hợp với các dịch vụ khác để cung cấp các thành phần thiết yếu.

Khái niệm khoa học sổ ghi chép mở (Open Notebook Science) được nhà hóa học Jean-Claude Bradley giới thiệu vào năm 2006. Nó liên quan rõ ràng đến mô hình Phần mềm Nguồn Mở (Open Source Software) và được định nghĩa bởi sự tồn tại của 'một URL đến sổ ghi chép của phòng thí nghiệm được cung cấp miễn phí và được lập chỉ mục trên các công cụ tìm kiếm phổ biến. Nó không nhất thiết phải trông giống như một cuốn sổ ghi chép giấy nhưng điều cần thiết là tất cả thông tin khả dụng mà các nhà nghiên cứu có để đưa ra kết luận của họ đều có sẵn cho toàn thế giới.'

Có rất nhiều loại Sổ ghi chép phòng thí nghiệm điện tử - ELN (Electronic Lab Notebook) khác nhau, từ các công cụ chung đến những công cụ được thiết kế để hoạt động với các loại thí nghiệm, thiết bị khoa học hoặc loại dữ liệu cụ thể. Một số ELN này sẽ yêu cầu cài đặt và/hoặc quản lý cục bộ, và có thể được cung cấp dưới dạng sản phẩm miễn phí/nguồn mở hoặc dịch vụ đăng ký, nhưng có một số dịch vụ hoàn toàn dựa trên web và miễn phí cho người dùng cá nhân hoặc nhóm. Viện Gurdon tại Đại học Cambridge cung cấp một cái nhìn tổng quan tuyệt vời về các sản phẩm này.

Không giống như sổ ghi chép thí nghiệm bằng giấy, ELN có thể được sử dụng để làm cho tài liệu thí nghiệm thành truy cập mở ở định dạng có cấu trúc và dễ sử dụng, hoặc bằng cách xuất sang các định dạng tài liệu hoặc, trong trường hợp một số dịch vụ trực tuyến, bằng cách cung cấp quyền truy cập công khai trực tiếp. Hầu hết các ELN được thiết kế dựa trên mô hình nhóm nghiên cứu hoặc nhóm dự án khép kín, và do đó có thể không cung cấp quy trình làm việc hiệu quả để làm cho thông tin thành truy cập công khai hoặc cho phép cộng tác mở. Ví dụ, ELN RSpace cho phép chia sẻ tài liệu hoặc sổ ghi chép với các thành viên của nhóm thí nghiệm và người dùng RSpace khác, nhưng không cung cấp quyền truy cập cộng tác mở. Nó tích hợp với nhiều dịch vụ lưu trữ đám mây phổ biến như Dropbox và OneDrive, và với công cụ cộng tác trực tuyến Slack, nhưng không cho phép chia sẻ toàn bộ dự án như Open Science Framework.

Công cụ giao thức cộng tác protocols.io áp dụng mô hình kiểm soát phiên bản của nền tảng kho lưu trữ mã nguồn như GitHub cho giao thức thí nghiệm. Các giao thức có thể được phát triển cộng tác trong một nhóm đóng kín, sau đó được phát hành dưới dạng các phiên bản công khai, được gán DOI để có thể trích dẫn từ các ấn phẩm liên quan. Các phiên bản công khai có thể được bình luận trực tiếp, nhưng cũng có thể được rẽ nhánh (forked) (tức là tạo ra bản sao) và sửa đổi, cho phép phát triển và tinh chỉnh các thí nghiệm một cách lặp đi lặp lại và có kiểm soát phiên bản.

Khung Khoa học Mở - OSF (Open Science Framework) là một nền tảng quản lý nghiên cứu vòng đời đầy đủ, được Trung tâm Khoa học Mở (Center for Open Science), một tổ chức phi lợi nhuận điều hành. Nền tảng này cung cấp:

  • Chức năng quản lý dự án dựa trên bảng điều khiển, với quyền truy cập cho cộng tác đóng kín và công khai, các tính năng kiểm soát phiên bản và phân tích dự án;

  • Kho lưu trữ tài liệu tập trung với tính năng chia sẻ tệp và kiểm soát phiên bản;

  • Tích hợp với Box, Dropbox, GoogleDrive và Amazon Web Services để lưu trữ và tính toán trên đám mây, với GitHub để quản lý mã nguồn, với figshare và Dataverse cho kho dữ liệu, và với Mendeley để quản lý tài liệu tham khảo;

  • Chức năng đăng ký trước để công bố các thiết kế nghiên cứu có dấu thời gian;

  • Máy chủ bản thảo trước xuất bản (preprint server) để truyền đạt kết quả nhanh chóng.

OSF đã khẳng định vị thế là một nền tảng phổ biến, đặc biệt trong lĩnh vực sức khỏe, khoa học xã hội và hành vi. Điều này là do cả tính khả dụng của nó như một môi trường nghiên cứu toàn diện, và vai trò của Trung tâm Khoa học Mở (COS) với tư cách là người tiên phong trong Nghiên cứu Mở, đặc biệt thông qua các can thiệp nổi bật như Dự án Khả năng Tái tạo do người sáng lập COS, Brian Nosek và các đồng nghiệp thực hiện, và thông qua việc phát triển và ủng hộ các giải pháp cho khoa học hiệu quả và có thể tái tạo hơn, bao gồm đăng ký trước nghiên cứu và mô hình xuất bản báo cáo đã đăng ký.

Khoa học công dân được định nghĩa trong Từ điển Tiếng Anh Oxford - OED (Oxford English Dictionary) là "công việc khoa học được các thành viên của công chúng thực hiện, thường là cộng tác với hoặc dưới sự chỉ đạo của các nhà khoa học và các tổ chức khoa học chuyên nghiệp". Không có lý do gì để mô hình nghiên cứu này bị giới hạn trong khoa học, mặc dù đây là lĩnh vực mà nó được thiết lập vững chắc nhất. Chúng ta có thể mở rộng định nghĩa của mình để bao gồm tất cả các ngành và nói về nghiên cứu công dân hoặc học thuật công dân.

Việc sử dụng các công nghệ trực tuyến để hỗ trợ các dự án khoa học công dân và có sự tham gia của cộng đồng cũng ngày càng tăng, chẳng hạn như các dự án do Zooniverse tổ chức, nơi các dự án có lượng dữ liệu lớn cần phân tích của con người có thể tận dụng sức mạnh xử lý của cộng đồng trực tuyến. Mô hình nghiên cứu này đặc biệt phù hợp với các dự án yêu cầu phân tích cơ bản hoặc xử lý lượng lớn dữ liệu mà máy tính không thể thực hiện được, ví dụ như xác định các đặc điểm hoặc mẫu trong hình ảnh, hoặc chuyển đổi hình ảnh của văn bản viết tay thành văn bản.

Các dự án khoa học công dân trực tuyến có thể tạo điều kiện thuận lợi cho khả năng tái tạo, mở ra những hướng nghiên cứu mới và dẫn đến những hiểu biết mới. Nguyên tắc "trí tuệ tập thể" có thể được sử dụng để giảm thiểu sai sót của con người bằng cách lấy giá trị trung bình và loại bỏ các giá trị ngoại lệ bất thường. Các nhà khoa học công dân có thể xác định các đặc điểm mới trong dữ liệu, hoặc được truyền cảm hứng để đặt ra những câu hỏi mới và hình thành những cách giải quyết vấn đề mới.

Văn hóa Nghiên cứu Mở (Open Research Culture)

Mọi người, từ sinh viên đến giáo sư, đều có thể đóng vai trò trong việc thúc đẩy sự phát triển của văn hóa Nghiên cứu Mở. Bạn có thể giúp thiết lập các chuẩn mực thực hành tốt nhất bằng cách thể hiện chúng trong hành vi của chính mình. Bạn có thể ảnh hưởng đến đồng nghiệp, sinh viên và mạng lưới rộng lớn hơn của những người cùng ngành. Bạn có thể lên tiếng ủng hộ các tiêu chuẩn cao nhất của Nghiên cứu Mở.

  • Nếu bạn là thành viên của một nhóm dự án hoặc nhóm nghiên cứu, hãy bắt đầu (một cách lịch sự) đặt câu hỏi: Chính sách của chúng ta về chia sẻ dữ liệu là gì? Dự án của chúng ta có Kế hoạch Quản lý Dữ liệu (DMP) không? Chúng ta quản lý và chia sẻ mã nguồn như thế nào? Chúng ta có thể công bố kết quả nghiên cứu dưới dạng bản thảo trước khi xuất bản không? Chúng ta có thể đăng ký trước thiết kế nghiên cứu hoặc gửi nó đến một tạp chí dưới dạng báo cáo đã đăng ký không? Có lẽ bạn có thể đưa ra thảo luận tại cuộc họp nhóm.

  • Nếu bạn chịu trách nhiệm giảng dạy, hãy giới thiệu cho sinh viên của mình – cả sinh viên đại học và sau đại học – về các khái niệm và thực hành của Nghiên cứu Mở. Ví dụ: giải thích tại sao Truy cập Mở (Open Access), chia sẻ dữ liệu và mã nguồn lại quan trọng; sử dụng dữ liệu mở trong giảng dạy và bài tập; yêu cầu sinh viên thực hiện các dự án thí nghiệm đăng ký trước giả thuyết và thiết kế nghiên cứu của họ; dạy về khả năng tái tạo bằng cách giao bài tập sao chép một nghiên cứu đã được công bố; hướng dẫn sinh viên học lập trình thiết lập kho lưu trữ mã nguồn trực tuyến trên GitHub; thành lập câu lạc bộ bản thảo trước xuất bản (preprints) và thực hiện bài tập đánh giá ngang hàng mở.

  • Sử dụng mạng xã hội và các kênh truyền thông nghiên cứu khác để công khai các kết quả nghiên cứu mở của bạn và thảo luận về các vấn đề Nghiên cứu Mở. Đừng chỉ đăng bài báo của bạn trên Twitter - hãy đăng cả bộ dữ liệu mở và mã nguồn mở của bạn. Bắt đầu hoặc đóng góp vào một cuộc thảo luận trong mạng lưới của bạn về các vấn đề Nghiên cứu Mở.

  • Khi bạn đọc một bài báo, hãy kiểm tra tuyên bố về quyền truy cập dữ liệu/tính khả dụng của dữ liệu: dữ liệu và mã nguồn hỗ trợ đã được chia sẻ chưa? Nếu chưa, và dữ liệu hỗ trợ đó bạn quan tâm, tại sao không (một cách lịch sự!) yêu cầu tác giả tương ứng chia sẻ chúng với bạn; Hoặc, tốt hơn nữa, hãy ký gửi lưu trữ chúng trong một kho lưu trữ công cộng phù hợp? Hãy cho người khác biết rằng việc chia sẻ dữ liệu và mã nguồn là một chuẩn mực và được mong đợi.

  • Luôn có cơ hội tham gia vào các dự án hoặc sáng kiến để phát triển các tiêu chuẩn và công cụ mở hỗ trợ các hoạt động thực hành mở trong lĩnh vực của bạn. Ví dụ, bất kỳ ai cũng có thể tham gia Liên minh Dữ liệu Nghiên cứu (Research Data Alliance) và tham gia vào các nhóm quan tâm và nhóm làm việc khác nhau để phát triển các tiêu chuẩn cộng đồng cho dữ liệu và siêu dữ liệu trong các lĩnh vực cụ thể.

  • Sử dụng sự tham gia của bạn với các bên liên quan đến nghiên cứu (chẳng hạn như các hội học thuật) để thúc đẩy các hoạt động và chính sách Nghiên cứu Mở.

  • Nếu bạn là thành viên ban biên tập của một tạp chí, hãy xem xét đưa ra các vấn đề này để thảo luận nếu các chính sách chưa được tranh luận hoặc thông qua:

    • Giới thiệu chính sách về tính khả dụng của dữ liệu và mã nguồn (xem ví dụ);

    • Giới thiệu hệ thống nộp bài đánh giá ngang hàng mở và chính sách thân thiện với bản thảo trước khi xuất bản;

    • Cung cấp tùy chọn báo cáo đã đăng ký;

    • Chuyển đổi tạp chí sang mô hình Truy cập Mở hoàn toàn, nếu nó chỉ dành cho người đăng ký thuê bao hoặc là Truy cập Mở lai (Hybrid Open Access).

Các tài nguyên bổ sung 

FORRT cung cấp cơ sở hạ tầng sư phạm và nguồn tài liệu giảng dạy được thiết kế để nhận biết và hỗ trợ việc giảng dạy và hướng dẫn về khoa học mở và có thể tái tạo.

Bộ công cụ Khoa học Mở của UNESCO được thiết kế để hỗ trợ việc thực hiện Khuyến nghị Khoa học Mở của UNESCO. Bộ công cụ này là một tập hợp các hướng dẫn, tóm tắt chính sách, bảng thông tin và chỉ mục.

Một nguồn tài liệu trực tuyến miễn phí được thiết kế để giúp trang bị cho sinh viên và nhà nghiên cứu những kỹ năng cần thiết để thành công trong môi trường nghiên cứu hiện đại. Đây là sản phẩm của sự cộng tác quốc tế liên tục giữa hàng trăm nhà nghiên cứu và chuyên gia thực hành, những người cam kết thúc đẩy sự tiến bộ Nghiên cứu Mở.

Cổng thông tin FOSTER là một nền tảng học tập điện tử tập hợp các nguồn tài liệu đào tạo tốt nhất dành cho những người cần tìm hiểu thêm về Khoa học Mở, hoặc cần phát triển các chiến lược và kỹ năng để thực hiện các hoạt động thực hành Khoa học Mở trong quy trình làm việc hàng ngày của họ. 

Một khóa học trực tuyến mở đại chúng (MOOC) về Khoa học Mở từ Đại học Kỹ thuật Delft (TU Delft), bao gồm các nguyên tắc chung về khoa học mở, quản lý dữ liệu nghiên cứu, xuất bản Truy cập Mở và sử dụng mạng xã hội để tăng khả năng hiển thị của bạn.

Một kho kiến thức toàn diện được thiết kế để phục vụ như một nguồn tài liệu tham khảo và giới thiệu thực hành, dễ hiểu cho các nhà khoa học mở mới vào nghề và giàu kinh nghiệm.

---------------------------------------------------

Thừa nhận: 

Nội dung này được dịch từ tài liệu của các tác giả: Farrow, R. (ed.), Weller, M., Pitt, R., Iniesto, F., Algers, A., Almousa, S., Baas, M., Bentley, P., Bozkurt, A., Butler, W., Cardoso, P., Chtena., N., Cox, G., Czerwonogora, A., Dabrowski, M.T., Derby, R., DeWaard, H., Elias, T., Essmiller, K., Funk, J., Hayman, J., Helton, E., Huth, K., Hutton, S. C., Iyinolakan, O., Johnson, K. R., Jordan, K., Kuhn, C., Lambert, S., Mittelmeier, J., Nagashima, T., Nerantzi, C., O’Reilly, J., Paskevicius, M., Peramunugamage, A., Pete, J., Power, V., Pulker, H., Rabin, E., Rets, I., Roberts, V., Rodés, V., Sousa, L., Spica, E., Vizgirda, V., Vladimirschi, V., & Witthaus, G. (2023). Sổ tay Nghiên cứu Mở của GO-GN.

Mạng lưới Cao học Toàn cầu về Tài nguyên Giáo dục Mở / Trung tâm Nghiên cứu Giáo dục Mở.

https://go-gn.net/gogn_outputs/open-research-handbook/.

 Giấy phép nội dung: CC BY 4.0 Quốc tế


---------------------------------------------------

VỀ TRANG MỤC LỤC

VỀ TRANG CÁC TÀI NGUYÊN BỔ SUNG

---------------------------------------------------

Xem thêm: 

Tác giả: Nghĩa Lê Trung

Tổng số điểm của bài viết là: 0 trong 0 đánh giá

Click để đánh giá bài viết

  Ý kiến bạn đọc

Về Blog này

Blog này được chuyển đổi từ http://blog.yahoo.com/letrungnghia trên Yahoo Blog sang sử dụng NukeViet sau khi Yahoo Blog đóng cửa tại Việt Nam ngày 17/01/2013.Kể từ ngày 07/02/2013, thông tin trên Blog được cập nhật tiếp tục trở lại với sự hỗ trợ kỹ thuật và đặt chỗ hosting của nhóm phát triển...

Bài đọc nhiều nhất trong năm
Thăm dò ý kiến

Bạn quan tâm gì nhất ở mã nguồn mở?

Thống kê truy cập
  • Đang truy cập31
  • Máy chủ tìm kiếm4
  • Khách viếng thăm27
  • Hôm nay4,630
  • Tháng hiện tại748,274
  • Tổng lượt truy cập52,529,575
Bạn đã không sử dụng Site, Bấm vào đây để duy trì trạng thái đăng nhập. Thời gian chờ: 60 giây