Zenodo’s Open Repository Streamlines Sharing Science
Theo: https://sparcopen.org/impact-story/zenodos-open-repository-streamlines-sharing-science/
Một thập kỷ trước, cộng đồng khoa học đã nhận thức được rằng để chuyển đổi từ truy cập mở sang khoa học mở, đã có nhu cầu về truy cập tự do không giới hạn tới kiến thức khoa học. Điều này ngụ ý việc đánh giá, chia sẻ và bảo tồn dữ liệu, phần mềm và các chế tác kỹ thuật số khác từ nghiên cứu, nhưng trên con đường để tham gia đó phải nhanh hơn và đơn giản hơn nếu việc thực hành thu hút được sự chú ý.

Liên minh châu Âu đã quyết định cấp vốn cho Tổ chức Nghiên cứu Hạt nhân châu Âu - CERN (European Organisation for Nuclear Research) thông qua dự án OpenAIRE để xây dựng một kho nắm giữ tất cả nhằm đảm bảo tất cả các nhà nghiên cứu có nơi dễ dàng để tải lên phần mềm, dữ liệu, các bài báo chưa được rà soát lại ngang hàng (Preprint) và các kết quả đầu ra kỹ thuật số khác.
Đó là sự bắt đầu của Zenodo, nó đã được CERN và OpenAIRE khởi xướng vào năm 2013. Kể từ đó, nền tảng toàn cầu tự do không mất tiền này đã mở rộng nhanh hơn so với dự kiến. Nó bây giờ có 25 triệu lượt viếng thăm một năm, chứa hơn 3 triệu bản tải lên và hơn 1 PB dữ liệu. Năm nay đánh dấu 10 năm nền tảng này và ngày nay Zenodo được rộng rãi coi như một nơi tin cậy để bảo tồn các tư liệu nghiên cứu có thể được những người khác sử dụng trong khoa học tiến bộ.
Ở CERN, Lars Holm Nielsen, là kỹ sư phần mềm và giám đốc dự án, và Tim Smith, người điều hành dự án và trưởng nhóm, có trách nhiệm hiện thực hóa kho mới này. Nielsen chỉ vừa mới rời khỏi một vị trí ở Đài quan sát Nam Âu - ESO (European Southern Observatory) nơi ông đã làm việc với Christopher Erdmann, một thủ thư, để giúp làm cho dữ liệu thiên văn học thành mở và khai phá được cho cả công chúng và các nhà khoa học. Họ vẫn liên lạc với nhau sau khi cả hai đã rời ESO.
Dù là một phần của đại dương, cả ba người đều đã là những người sáng tạo ra Zenodo - Nielsen ở CERN đã phát triển kỹ thuật, trong khi Smith và Erdmann đã thiết kế các giải pháp cho các thách thức và đã tập trung vào tiếp cận cộng đồng. Cả cơ sở của OpenAIRE ở châu Âu và cơ sở của Erdmann ở nước Mỹ và mạng nghề nghiệp rộng lớn đều quan trọng trong việc thu hút sự chú ý cho Zenodo.
Sau khi cân nhắc vài cái tên phổ biến hơn (Research Share - Chia sẻ Nghiên cứu, ví dụ thế), hệ thống đó đã được đặt tên là Zenodo, một cái gật đầu với Zenodotus, thủ thư đầu tiên tại Thư viện Cổ Alexandria và là người đầu tiên được ghi nhận là người tạo ra siêu dữ liệu.
Kho này đã được thúc đẩy như một cửa hàng một cửa đã chào đón nghiên cứu từ khắp trên thế giới và từ mọi ngành. Nó làm tăng tốc việc chia sẻ khoa học bằng việc cho phép các nhà nghiên cứu chia sẻ các chế tác bất cứ khi nào mà không phải chờ cho tới khi xuất bản các kết quả.
“Đây là nền tảng được xây dựng để trao quyền cho người sử dụng để mọi việc được hoàn thành, bảo tồn dữ liệu nghiên cứu và hỗ trợ cho khoa học”, Nielsen nói. “Chúng tôi muốn đảm bảo không có lý do gì để không chia sẻ dữ liệu”.
Bằng việc chỉ định cho từng hạng mục một Mã nhận diện Đối tượng Số - DOI (Digital Object Identifier), Zenodo cung cấp một dịch vụ có giá trị giám tuyển phần mềm, dữ liệu, các bài báo, các tư liệu hội nghị - bất kỳ thứ gì cần thiết để hiểu quy trình học thuật. Các nhà khoa học có khả năng có được sự thừa nhận cho các bước quan trọng trọng quy trình họ đã đóng góp thay vì tình trạng ‘bất kỳ ai hoặc không ai cả’ theo cách tiếp cận về danh sách các tác giả của tài liệu. Các bản tải lên được làm cho sẵn sàng trên trực tuyến một cách tức thì và DOI được đăng ký trong vài giây đồng hồ.
“Các nhà nghiên cứu từng có thời kỳ khó khăn để đi qua tất cả các bước đó để làm cho dữ liệu nằm trong một kho”, Erdmann nói, bây giờ sống ở Bắc Carolina và là phó giám đốc khoa học mở cho Quỹ Michael J. Fox. “Chúng tôi muốn cung cấp một cách tiếp cận linh hoạt hơn và loại bỏ vài rào cản để mọi người chỉ việc bắt đầu chia sẻ”.

Trong một thập kỷ qua, Nielsen, Smith, và Erdmann đã tiếp tực cộng tác về Zenodo, đặc biệt làm việc với Jose Benito Gonzalez Lopez và Alex Ioannidis trong một nhóm nhỏ đã giúp mở rộng Zenodo nhằm đáp ứng nhu cầu gia tăng theo cấp số mũ. Hệ thống này đã được phát triển theo chương trình OpenAIRE của châu Âu và được CERN vận hành cho cộng đồng nghiên cứu toàn thế giới, dựa vào uy tín của CERN và sự tinh thông về quản lý dữ liệu phạm vi rộng, bổ sung thêm sự tin cậy và tính bền vững của Zenodo.
Ban đầu, Zenodo từng được coi như là một kẻ phá bĩnh.
“Việc để cho các nhà nghiên cứu tự họ giám tuyển từng là một suy nghĩ cấp tiến”, Smith nói về khái niệm của họ. “Đây là một sự thay đổi trong quy trình, từ bỏ quyền kiểm soát và hạ thấp các rào cản để mọi người gửi tới.”
Vâng, sự tham gia trong Zenodo đã vượt quá các kỳ vọng của nhiều người - đặc biệt những người chỉ trích ban đầu nghĩ nó là quá mở. Qua thời gian, nó đã chiến thắng những kẻ hoài nghi khi các nhà nghiên cứu nói cho nhau và sự dễ sử dụng đã dẫn tới việc ký gửi nhiều hơn tác phẩm của họ.
“Đặc tính ‘các cộng đồng’ trên Zenodo đã cho phép bất kỳ ai tạo ra một kho cho các tài nguyên của họ và nó đã giúp hạ thấp các rào cản đối với một cộng đồng lớn hơn để bắt đầu chia sẻ nghiên cứu”, Erdmann nói.
Các học giả đã bắt đầu chia sẻ các tư liệu từ các cuộc họp và hội nghị lên Zenodo với một đường liên kết nên mọi thứ đã có thể khám phá được và trích dẫn được.
Trong số các ví dụ học thuật có tác động lớn được chia sẻ trên Zenodo:
Một mô hình vũ trụ 3D in được, một nghiên cứu rà soát lại tư liệu về COVID và phần mềm được sử dụng như một phần của Sự kiện Kính viễn vọng Horizon.
Nền tảng kỹ thuật của Zenodo là nguồn mở từ đầu, nhưng chưa bao giờ từng có ý định được những người khác sử dụng. Vâng, các cơ sở đã bắt đầu sử dụng nó để xây dựng các kho lưu trữ của riêng họ vì họ đã muốn cung cấp kinh nghiệm của Zenodo cho các nhà nghiên cứu của riêng họ.
Điều đó đã khiến Gonzalez Lopez và Nielsen nhận được một khoản tài trợ nhỏ từ Chuyển giao Tri thức CERN vào năm 2018 để làm cho nền tảng này có thể tái sử dụng dễ dàng. Ngày nay, nền tảng này có tên là InvenioRDM được đồng phát triển bởi sự hợp tác của 25 tổ chức nghiên cứu trên toàn thế giới – đôi bên cùng có lợi cho cả Zenodo và từng trong số các tổ chức đó.
“Là quan trọng rằng chúng tôi có một hạ tầng mở do cộng đồng quản lý”, Gonzalez Lopez nói. “Tư duy của chúng tôi là để kho lưu trữ đó được sử dụng khắp trên thế giới cho những ai không có các tài nguyên và một sân chơi bình đẳng”.
Nielsen nói ông hy vọng Zenodo tiếp tục là nơi hữu ích cho các nhà nghiên cứu để chia sẻ tác phẩm của họ và nền tảng đó tiếp tục dài lâu sau khi ông tham gia vào.
“Các vấn đề sẽ tới từ việc trở nên lớn hơn”, Nielsen nói. “Tầm nhìn của tôi về Zenodo là duy trì giải quyết các vấn đề đó trong khi chúng tôi vẫn đổi mới sáng tạo ở khía cạnh hàng đầu của truyền thông học thuật”.
A decade ago, the scientific community recognized that to move from open access to open science, there was a need for free unrestricted access to scientific knowledge. This meant valuing, sharing and preserving data, software and other digital artifacts from research, but the on-ramp to participate had to be faster and simpler if the practice was going to gain traction.
The European Union decided to fund CERN (the European Organisation for Nuclear Research) through the OpenAIRE project to build a catch-all repository to ensure all researchers had a place to easily upload software, data, preprints and other digital outputs.
That was the beginning of Zenodo, which CERN and OpenAIRE launched in 2013. Since, the free global platform has expanded faster than imagined. It now has 25 million visits a year, hosts 3+ million uploads and over 1 petabyte of data. This year marks the platform’s 10th anniversary and today Zenodo is widely viewed as a trusted place to preserve research materials that could be of use to others in advancing science.
At CERN, Lars Holm Nielsen, software engineer and project manager, and Tim Smith, project executive and group leader, were responsible for realizing the new repository. Nielsen had just left a position at the European Southern Observatory (ESO) where he had worked with Christopher Erdmann, a librarian, on helping to make astronomy data open and discoverable for both the public and scientists. They stayed in touch after they both left ESO.
Although an ocean apart, the three were instrumental in the creation of Zenodo — Nielsen at CERN did the technical development, while Smith and Erdmann designed solutions for challenges and focused on community outreach. Both OpenAIRE’s base in Europe as well as Erdmann’s base in the U.S. and large professional network were critical in gaining traction for Zenodo.
After considering several more generic names (Research Share, for example), the system was named Zenodo, a nod to Zenodotus, the first librarian at the Ancient Library of Alexandria and first recorded creator of metadata.
The repository was promoted as a one-stop-shop that welcomed research from all over the world and from every discipline. It accelerates the sharing of science by allowing researchers to share artifacts anytime without having to wait until publication of results.
“It’s a platform built to empower users to get things done, preserve research data and support science,” Nielsen said. “We wanted to make sure there wasn’t any excuse not to share data.”
By assigning each item a Digital Object Identifier (DOI), Zenodo provides a valued service of curating software, data, articles, conference materials—anything needed to understand the scholarly process. Scientists are able to get credit for important steps in the process they contributed to rather than the current ‘everyone or no-one’ on the paper author-list approach. Uploads are made available online immediately and the DOI is registered within seconds.
“Researchers were having a hard time going through all the steps to get data into a repository,” said Erdmann, now living in North Carolina and associate director of open science for the Michael J. Fox Foundation. “We wanted to provide a more flexible approach and to remove some of the barriers so people would just start sharing.”
In the past decade, Nielsen, Smith, and Erdmann continued to collaborate on Zenodo, working in particular with Jose Benito Gonzalez Lopez and Alex Ioannidis in a small team that helped expand Zenodo in response to the exponentially growing demand. The system was developed under the European OpenAIRE program and is operated by CERN for the research community worldwide, relying on CERN’s reputation and large-scale data management expertise, adding to Zenodo’s credibility and stability.
Initially, Zenodo was seen as a disruptor of sorts.
“Letting researchers curate themselves was a radical thought,” said Smith of their concept. “This was a change in the process, relinquishing control and lowering the barriers for people to submit.”
Yet, participation in Zenodo exceeded the expectations of many—especially early critics who thought it was too open. Over time, it has won over skeptics as researchers told others and the ease of use drew more to deposit their work.
“The ‘communities’ feature in Zenodo allowed anyone to create a repository for their resources and it helped lower barriers for the greater community to start sharing research,” Erdmann said.
Scholars began to share materials from meetings and conferences on Zenodo with one link so everything was discoverable and citable.
Among the examples of impactful scholarship shared on Zenodo:
a 3D-printable model of the universe, a COVID literature review study and software used as part of the Event Horizon Telescope.
Zenodo’s technical platform was open source from the beginning, but was never intended to be used by others. Yet, institutions started using it to build their own repositories because they wanted to provide the Zenodo-experience to their own researchers.
That sparked Gonzalez Lopez and Nielsen to get a small grant from CERN Knowledge Transfer in 2018 to make the platform easily reusable. Today, the platform named InvenioRDM is co-developed by a collaboration of 25 research institutions world-wide–a win-win for both Zenodo and each of the institutions.
“It’s important that we have an open, community-run infrastructure,” Gonzalez Lopez said. “Our mindset was for the repository to be used all over the world by people who don’t have resources and level the playing field.”
Nielsen said he hopes Zenodo continues to be a useful place for researchers to share their work and that the platform continues long after his involvement.
“Problems come from getting bigger,” Nielsen said. “My vision for Zenodo is to keep solving those problems while we stay innovative at the leading edge of scholarly communication.”
Dịch: Lê Trung Nghĩa
letrungnghia.foss@gmail.com
Tác giả: Nghĩa Lê Trung
Ý kiến bạn đọc
Những tin mới hơn
Những tin cũ hơn
Blog này được chuyển đổi từ http://blog.yahoo.com/letrungnghia trên Yahoo Blog sang sử dụng NukeViet sau khi Yahoo Blog đóng cửa tại Việt Nam ngày 17/01/2013.Kể từ ngày 07/02/2013, thông tin trên Blog được cập nhật tiếp tục trở lại với sự hỗ trợ kỹ thuật và đặt chỗ hosting của nhóm phát triển...
Các bài trình chiếu trong năm 2024
Tập huấn thực hành ‘Khai thác tài nguyên giáo dục mở’ cho giáo viên phổ thông, bao gồm cả giáo viên tiểu học và mầm non tới hết năm 2024
Các lớp tập huấn thực hành ‘Khai thác tài nguyên giáo dục mở’ tới hết năm 2024
Các tài liệu dịch sang tiếng Việt tới hết năm 2024
‘Digcomp 2.2: Khung năng lực số cho công dân - với các ví dụ mới về kiến thức, kỹ năng và thái độ’, EC xuất bản năm 2022
Tổng hợp các bài của Nhóm các Nhà cấp vốn Nghiên cứu Mở (ORFG) đã được dịch sang tiếng Việt
Tổng hợp các bài của Liên minh S (cOAlition S) đã được dịch sang tiếng Việt
Năm Khoa học Mở & Chuyển đổi sang Khoa học Mở - Tổng hợp các bài liên quan
Hội nghị Đối tác Dữ liệu Mở châu Á năm 2021 do Việt Nam lần đầu tiên chủ trì
Các khung năng lực trong hành động
Phong trào Bình dân học vụ số: Mục tiêu, đối tượng, nội dung, nguồn lực, phương thức tổ chức thực hiện
Lễ công bố công khai Trung tâm Năng lực Kim cương châu Âu và dự án ALMASI
Khung năng lực AI cho giáo viên
Ngày Phần mềm Tự do, Ngày Phần cứng tự do, Ngày Tài liệu Tự do
‘Khung năng lực AI cho giáo viên’ - bản dịch sang tiếng Việt
Bạn cần biết những gì về các khung năng lực AI mới của UNESCO cho học sinh và giáo viên
Bàn về 'Lợi thế của doanh nghiệp Việt là dữ liệu Việt, bài toán Việt' - bài phát biểu của Bộ trưởng Nguyễn Mạnh Hùng ngày 21/08/2025
Các tài liệu dịch sang tiếng Việt tới hết năm 2024
Các bài trình chiếu trong năm 2024
‘Tài liệu quan điểm của KR21 về Giữ lại Quyền Tác giả: Giữ lại các quyền trong kết quả đầu ra nghiên cứu để cho phép phổ biến mở kiến thức’ - bản dịch sang tiếng Việt
‘KHUYẾN NGHỊ VÀ HƯỚNG DẪN TRUY CẬP MỞ KIM CƯƠNG cho các cơ sở, nhà cấp vốn, nhà bảo trợ, nhà tài trợ, và nhà hoạch định chính sách’ - bản dịch sang tiếng Việt
DeepSeek đã gây ra sự hoảng loạn trên thị trường — nhưng một số người cho rằng việc bán tháo là quá mức
“Chúng tôi không có hào nước”: Sự đổi mới đột phá của AI nguồn mở
Tập huấn thực hành ‘Khai thác tài nguyên giáo dục mở’ cho giáo viên phổ thông, bao gồm cả giáo viên tiểu học và mầm non tới hết năm 2024
Ứng dụng và phát triển Tài nguyên Giáo dục Mở (OER) tại Việt Nam
Nhà khoa học AI hàng đầu của Meta cho biết thành công của DeepSeek cho thấy 'các mô hình nguồn mở đang vượt trội hơn các mô hình độc quyền'
Dữ liệu để phân loại AI
50 công cụ AI tốt nhất cho năm 2025 (Đã thử và kiểm nghiệm)
Mark Zuckerberg: DeepSeek cho thấy vì sao nước Mỹ phải là ‘tiêu chuẩn nguồn mở toàn cầu’ của AI; không có lý do gì để suy nghĩ lại về việc chi tiêu
Tài sản chung kỹ thuật số và Hàng hóa Công cộng Kỹ thuật số - Tìm thấy nền tảng chung cho các nhà hoạch định chính sách