Dữ liệu Liên kết cho các thư viện: Các thủ thư mới của chúng ta

Thứ năm - 06/04/2017 05:30

Linked Data for Libraries: Our New Librarians

By Teodora Petkova

March 10, 2017

Theo: http://ontotext.com/linked-data-libraries/

Bài được đưa lên Internet ngày: 10/03/2017

Xem thêm: Dữ liệu Mở liên kết - Linked Open Data.

Bùng nổ nội dung, biến đổi chưa từng có nền công nghiệp xuất bản và số lượng người ngày càng gia tăng bắt đầu yêu cầu thông tin trên Web là những yếu tố dẫn dắt các thư viện tái tạo lại cách thức họ phục vụ các nhu cầu thông tin của những người sử dụng của họ. Thách thức lớn nhất các thư viện đối mặt ngày nay là làm thế nào để làm cho sự phong phú các hồ sơ thư viện của họ giàu có và được quản lý tốt dễ dàng hơn để truy cập và thấy được nhiều hơn.

Cuộc chiến với các thế lực quên lãng và các thủ thư mới của chúng tôi

Sách là loài dễ vỡ, nó chịu sự bào mòn của thời gian, nó sợ các loài gặm nhấm, các yếu tố và bàn tay vụng về. Vì thế các thủ thư bảo vệ các cuốn sách không chỉ chống lại loài người, mà còn chống lại tự nhiên và dành trọn cuộc đời mình cho cuộc chiến này với các thế lực quên lãng đó.

Trích Umberto Eco

Trong thế giới số của kết nối liên tục, các lực lượng lãng quên chính biến thành thiếu tính minh bạch và các kỹ thuật truy xuất thông tin nghèo nàn. Để nói, “cuộc chiến với các thế lực quên lãng” sẽ lấy không chỉ các thủ thư được huấn luyện và chuyên tâm, mà còn vài thuật toán, có khả năng để lôi về các kết quả thích hợp một cách nhanh chóng và hiệu quả.

Trong ngữ cảnh các bộ sưu tập khổng lồ các đối tượng số không đồng nhất, tính minh bạch và truy xuất thông tin hiệu quả phụ thuộc vào máy (được chống trụ bằng các công nghệ web ngữ nghĩa) mà tiến hành nặng nhọc để tăng việc lấy về không chỉ các cuốn sách và các tài nguyên điện tử, mà còn cả các khái niệm và các mối quan hệ. Và đây là những nơi mà, để bảo vệ các tài nguyên giàu có của thư viện và làm cho chúng sẵn sàng cho những người cần chúng, nơi mà họ cần chúng, hạt giống mới của các thủ thư - các chương trình máy tính - sẽ phải có khả năng tự động tìm, chọn và lọc các tài nguyên cùng với việc phân tích các kết nối giữa chúng và tìm kiếm các nguồn không đồng nhất.

Để điều đó xảy ra, dữ liệu thư viện cần phải có cấu trúc, được kết nối tốt và dễ dàng truy cập, sử dụng và sử dụng lại. Để bảo vệ các hồ sơ thư viện khỏi các thế lực lãng quên số, các công nghệ Dữ liệu Liên kết đã tới giúp.

Dữ liệu Liên kết là ngôn ngữ mà các máy có thể đọc và hiểu để lấy các kết quả trơn tru. Và không chỉ các kết quả ở dạng danh sách, mà bất kỳ điều gì có lẽ là quan trọng và thích hợp với yêu cầu thông tin (tài nguyên, khái niệm, chủ đề, ý tưởng).

Các công nghệ Dữ liệu Liên kết là độc nhất vô nhị vì chúng cho phép các đại lý phần mềm tìm kiếm, chia sẻ và tích hợp thông tin xuyên khắp các nguồn đa dạng khác nhau một cách dễ dàng và hiệu quả.

BIBRAME The Linked Data Alternative for Library Records

BIBFRAME: Lựa chọn Dữ liệu Liên kết cho các hồ sơ Thư viện

Nếu một hạng mục không xuất hiện trong hồ sơ của chúng tôi, thì nó không tồn tại.

Trích dẫn của các thủ thư ở Reel

Vào những năm 1960, để tạo ra các hồ sơ có thể được các máy tính đọc được và chia sẻ được giữa các thủ thư, một tập hợp các định dạng số để mô tả các hạng mục trong catalog thư viện đã được tạo ra. Nó từng được gọi là các Hồ sơ Catalog Máy Đọc được - MARC (Machine Readable Cataloging Records). Ngày nay đây là định dạng thường được coi là việc khóa trói tri thức số của các thư viện vào các đường ống khép kín và cản trở sự dễ dàng chia sẻ và kết nối các tài nguyên - nói cách khác, để làm cho chúng không nhìn thấy được.

Trong các môi trường được kết nối mạng của chúng ta, sự tồn tại bắt đầu với khả năng nhìn thấy được. Về khía cạnh dữ liệu, khả năng nhìn thấy được trực tiếp có liên quan tới tính kết nối lẫn nhau. Khi không có kết nối tới Web và bị kẹt trong các ống khép kín dữ liệu, các hồ sơ của thư viện khó để tìm và tích hợp. Điều đó dường như là “chúng không tồn tại”. Để mở khóa cho các hồ sơ thư viện khỏi định dạng đã lỗi thời của chúng (MARC) và giúp các thư viện kết nối những người sử dụng của họ với nội dung họ cần theo một cách thức có sự tham gia, BIBFRAME đã được tạo ra.

Về tổng thể, BIBFRAME là sự thay thế cho MARC của Dữ liệu Liên kết, đặt ra “nền tảng cho tương lai của mô tả thư mục, cả trên web, và trong thế giới được kết nối mạng rộng lớn hơn” (Trích dẫn Thư viện Quốc hội). Đó là những gì có thể xúc tác cho tính kết nối lẫn nhau các dữ liệu thư viện và rốt cuộc cho các kinh nghiệm tri thức giàu có.

Để viết sâu về các cột mốc trên con đường từ MARC tới Dữ liệu Liên kết, hãy kiểm tra Godby, C. J. và Smith-Yoshimura, K. (2017), Từ các Hồ sơ tới mọi Điều: Quản lý Biến đổi từ Siêu dữ liệu Thư viện Vốn có sang Dữ liệu Liên kết.

Visibility WITH Benefits

Khả năng nhìn thấy được với những lợi ích

Việc liên kết các dữ liệu thư viện cùng nhau là những gì có thể giúp các thư viện quản lý nội dung của họ theo một cách thức có hiệu quả về chi phí và làm cho nó nhìn thấy được đối với các độc giả của họ. Sử dụng các công nghệ Dữ liệu Liên kết, các thư viện có thể trình bày những gì họ có để chào theo cách thức có sự tham gia, làm giàu và, trên hết tất cả, dễ tìm.

Cả trên Web và xuyên khắp các mạng nội bộ đa dạng khác nhau, khả năng nhìn thấy được không chỉ là vấn đề của khả năng tìm thấy, mà còn là câu hỏi về tính kết nối lẫn nhau. Đối với các thư viện sẽ là thích hợp và để đáp ứng được các thách thức của môi trường số, các tài nguyên của họ không chỉ nổi lên bề mặt khi được yêu cầu, mà còn là sẵn sàng trong các kịch bản khác nhau: như là nội dung được khuyến cáo, như là thông tin bổ sung, như là nội dung được cá nhân hóa.

Hơn thế nữa, Dữ liệu Liên kết xúc tác cho các trải nghiệm tốt hơn, quản lý các hồ sơ thư viện đúng cho tương lai, bảo tồn và phục vụ khi nằm trong tâm của các công nghệ như:

tìm kiếm thông minh (không chỉ trên web, mà bên trong các bộ sưu tập nội bộ);
khuyến cáo nội dung thông minh;
các tài nguyên được kết nối;
trung tâm của các chủ đề;
tích hợp nội dung.

Đã chín muồi trong công nghệ đáng tin cậy và hiệu quả, Dữ liệu Liên kết có thể phục vụ cho việc xây dựng các công cụ giúp cho các thư viện đáp ứng được toàn bộ tập hợp các thách thức mới, như:

Các mức truy cập;
Tìm kiếm thông minh;
Cá nhân hóa;
Lọc;
Gốc gác lai lịch (độ tin cậy);
Khả năng cầu may (tình cờ phát hiện những bất ngờ và may mắn).

Và tất cả điều này với sức mạnh của liên kết. Điều rất đơn giản.

From Cataloguing to Catalinking

Từ việc tạo ra catalog cho tới việc tạo ra kết nối catalog

Trong làn sóng cách mạng số, các thư viện đã bắt đầu nghĩ lại các catalog của họ và định hình lại họ theo những con đường đã được các máy tìm kiếm phổ biến và các nhà bán lẻ trên trực tuyến thiết lập.

Trích từ các catalog thế hệ tiếp sau : những người sử dụng nghĩ gì ?

Trên web ngày càng gia tăng về dữ liệu và các mối quan hệ (xem Cooking Up the Semantic Web), các công nghệ ngữ nghĩa là chìa khóa mang các khán thính phòng trờ về các thư viện và làm cho các kho lưu trữ và các bộ sưu tập của thư viện nhìn thấy được và truy cập được. Đối với kỷ nguyên thông tin ngày nay, các thư viện không chỉ lưu giữ và tổ chức nội dung, mà còn cung cấp các kinh nghiệm phát hiện tri thức. Họ phải đi suốt con đường “từ việc làm catalog tới việc liên kết các catalog” (from cataloguing to catalinking) [sử dụng cụm từ, được mượn từ một bài trình chiếu đầy đủ thông tin về Dữ liệu Liên kết cho các Thư viện của Richard Wallis, slide số 19]

Triển khai các công nghệ web ngữ nghĩa có thể xúc tác cho các độc giả để tìm kiếm các khái niệm, các tài liệu, con người, các mối quan hệ. Nó đi qua việc kết nối các dữ liệu của họ bên trong và xuyên qua các tài nguyên, các kho và các cơ sở dữ liệu khác mà các thư viện có thể không chỉ lưu giữ và tổ chức thông tin theo một cách thức có hiệu quả, mà còn đưa ra những kinh nghiệm phát hiện tri thức giàu có.

Quan trọng nhất, khi cung cấp khung chia sẻ các dữ liệu được làm giàu về ngữ nghĩa, các công nghệ Dữ liệu Liên kết có thể giúp các thư viện vẫn giữ nguyên là các trung tâm tri thức mà họ từng luôn là như vậy bằng việc cho phép họ vẫn giữ là thích hợp và làm cho các tài nguyên thư viện dễ dàng truy cập được, rốt cuộc nhìn thấy được nhiều hơn.

Hãy duy trì hội thoại về các cuốn sách, các độc giả và siêu dữ liệu!

Hãy gặp chúng tôi ở Hội chợ Sách Luân Đôn để thảo luận về những lợi ích của Công nghệ Ngữ nghĩa hoặc tới nghe Borislav Popov nói về Ontotext và Sameer Shariff của Impelsys, những người sẽ chia sẻ vài trường hợp điển hình tuyệt vời trình bày về tầm quan trọng của làm giàu siêu dữ liệu vì lợi ích của việc làm cho nội dung thông minh hơn và dễ dàng tìm thấy được hơn.

Content explosion, an ever transforming publishing industry and an increasing number of people starting their information quest on the Web are the factors that drive libraries to reinvent the way they serve the information needs of their users. The biggest challenge libraries face today is how to make the wealth of their well-managed and rich library records easier to access and more visible.

The War With the Forces of Oblivion and Our New Librarians

A book is a fragile creature, it suffers the wear of time, it fears rodents, the elements and clumsy hands. So the librarian protects the books not only against mankind but also against nature and devotes his life to this war with the forces of oblivion.

Cit. Umberto Eco

In the digital world of constant connectivity, the main forces of oblivion translate into lack of visibility and poor information retrieval techniques. That said, the “war with the forces of oblivion” will take not only trained and devoted librarians but also some algorithms, capable of fetching relevant results quickly and efficiently.

In the context of huge collections of heterogenous digital objects, visibility and efficient information retrieval depend on machines (braced with semantic web technologies) that do the heavy-lifting of seamlessly fetching not only electronic books and resources but also concepts and relationships. And this is where, to protect library’s rich resources and to make them available to the people who need them, where they need them, a new breed of librarians – computer programs – will have to be able to automatically find, select and filter resources together with analyzing the connections between them and searching across heterogeneous sources, etc.

For that to happen, library data need to be structured, well-connected and easy to access, use and reuse. To save library records from the digital forces of oblivion, Linked Data technologies come into play.

Linked Data is the language machines can read and understand in order to seamlessly fetch results. And not only results in the form of a list, but anything that might be important and relevant to the information quest (resources, concepts, topics, ideas).

Linked Data technologies are unique for they allow software agents to find, share and integrate information across diverse resources easily and effectively.

BIBRAME: The Linked Data Alternative for Library Records

If an item does not appear in our records, it does not exist.

Cit. Reel Librarians

In the 1960s, to create records that could be read by computers and shared among libraries, a set of digital formats to describe items in a library catalog have been created. It was called MARC: Machine Readable Cataloging Records. Today this is the format usually blamed for locking libraries’ digital knowledge into silos and impeding the ease of sharing and connecting resources – in a word, for making them invisible.

In our networked environments, existing begins with visibility. In terms of data, visibility is directly related to interconnectedness. With no connection to the Web and stuck in a data silo, libraries’ records are hard to find and integrate. It is as if “they don’t exist”. To unlock library records from their obsolete format (MARC) and help libraries connect their users to the content they need in an engaging way, BIBFRAME was created.

In broad strokes, BIBFRAME is a Linked Data replacement for MARC, laying “a foundation for the future of bibliographic description, both on the web, and in the broader networked world”.(Cit. Library of Congress). It is what can enable library data interconectedness and ultimately rich knowledge experiences.

For an in-depth write-up about the milestones on the path from MARC to Linked Data, check Godby, C. J. and Smith-Yoshimura, K. (2017), From Records to Things: Managing the Transition from Legacy Library Metadata to Linked Data.

Visibility with Benefits

Linking library data together is what can help libraries manage their content in a cost-effective way and make it visible to their audiences. Using Linked Data technologies, libraries can present what they have to offer in an engaging, enriching and above all easy-to-find way.

Both on the Web and across diverse internal networks, visibility is not only a matter of findability but also a question of interconnectedness. For libraries to be relevant and to meet the challenges of the digital environment, their resources are not only to surface when queried but to also be available in various scenarios: as recommended content, as additional information, as personalized content.

Among all other things, Linked Data enables better experiences, future-proof library records management, preservation and serving by being in the heart of technologies such as:

intelligent search (not only on the web but within internal collections);
smart content recommendation;
connected resources;
topic hubs;
content integration.

Having matured into a reliable and efficient technology, Linked Data can serve for building tools that help libraries meet a whole set of novel challenges such as:

Levels of access;
Intelligent search;
Personalization;
Filtering;
Provenance (credibility);
Serendipity.

And all this with the power of a link. As simple as that.

From Cataloguing to Catalinking

In the wake of the digital revolution, libraries have started rethinking their catalogues and reshaping them along the lines that have been set by popular search engines and online retailers.

Cit. Next-generation catalogues: what do users think?

In a web increasingly about data and relationships (see Cooking Up the Semantic Web), semantic technologies are key to bringing audiences back to libraries and making library archives and collections visible and accessible. For in today’s information age, libraries are not only to store and organize content but to also provide knowledge discovery experiences. They do have to walk all the way “from cataloguing to catalinking” [to use the expression, borrowed from an informative presentation on Linked Data for Libraries by Richard Wallis, slide 19]

The deployment of semantic web technologies can enable readers to search for concepts, documents, people, relationships. It is through linking their data within and across other resources, repositories and databases that libraries can not only store and organize information in an efficient way but to also provide rich knowledge discovery experiences.

Most importantly, providing a framework for sharing semantically enriched data, Linked Data technologies can help libraries remain the knowledge hubs they have always meant to be by allowing them to remain relevant and make library resources easily accessible, ultimately more visible.

Let’s keep the conversation about books, readers and metadata going!

Meet us at the London Book Fair to discuss the benefits of Semantic Technology or come listen to Borislav Popov of Ontotext and Sameer Shariff of Impelsys who will share some great use cases demonstrating the importance of metadata enrichment for the sake of making content smarter and easily discoverable.

Dịch: Lê Trung Nghĩa

letrungnghia.foss@gmail.com