Thư viện số hoá 20 triệu trang từ các cuốn sách thế kỷ 19
Library digitises 20 million pages f-rom 19th Century books
By Jeremy Kirk, IDG News Service
Theo: http://www.computerworlduk.com/technology/internet/web2/news/index.cfm?newsid...
Bài được đưa lên Internet ngày: 30/05/2008
Các dự án đang tiến hành của Thư viện Anh sẽ làm cho hàng ngàn cuốn sách và các nguồn tài liệu khác sẵn sàng số hoá sẽ không bị chậm lại một cách đáng kể, dù việc cuối tuần trước đã kết thúc quan hệ đối tác với Microsoft, một quan chức cao cấp của thư viện nói hôm thứ sáu.
Microsoft đã thiết lập một quan hệ đối tác với thư viện này vào tháng 11/2005 để đầu tư việc quét khoảng 100,000 bản sao các cuốn sách thế kỷ thứ 19, hoặc khoảng 20 triệu trang. Công việc quét này sẽ tiếp tục lâu thêm chút nữa cho tới khi 40,000 cuốn sách được kết thúc, Neil Fitzgerald, người quản lý dự án số hoá này, nói.
Thư viện này có 15 dự án số hoá hiện đang được thực hiện, tập trug vào việc lưu giữ những thứ khác như các hồ sơ âm thanh và các trang báo. Việc đầu tư tới từ các nguồn cả tư nhân lẫn nhà nước. Các dự án này sẽ tiếp tục, Fitzgerald nói.
“Có thể sẽ có một xu hướng xem xét các khía cạnh có thể tiêu cực, nhưng tôi nghĩ đáng giá để nhấn mạnh điều này sẽ cho kết quả tích cực đối với thư viện”, Fitzgerald nói.
The British Library's ongoing projects to make thousands of books and other resources available digitally won't slow down significantly, despite the ending last week of a partnership with Microsoft, a senior library official said Friday.
Microsoft formed a partnership with the library in November 2005 to fund the scanning of up to 100,000 out-of-copyright 19th century books, or around 20 million pages. The scanning work will continue for a while longer until the last 40,000 books are finished, said Neil Fitzgerald, digitisation project manager.
The library has 15 ongoing digitisation projects, focusing on other holdings such as sound recordings and newspaper pages. Funding come f-rom a mix of private and public sources. Those projects will continue, Fitzgerald said.
"There can be a tendency to look at possibly negative aspects, but I think it's worth emphasizing this has been a positive outcome for the library," Fitzgerald said.
Thư viện này có thể mở để thiết lập quan hệ đối tác với các công ty khác, bao gồm Google, mà hãng này bày tỏ mối quan tâm trong các dự án số hoá. Sự khởi đầu của Microsoft sẽ không hoàn toàn được mong đợi.
“Đây không là tình trạng mới cho thư viện”, Fitzgerald nói. “Chúng tôi có nhiều kinh nghiệm trong lĩnh vực này, và chúng tôi là thực dụng và thực tế. Các bên thương mại thứ ba sẽ chỉ duy trì một tài nguyên nếu nó thi hành mệnh lệnh thương mại của họ”.
Microsoft nói tuần trước hãng có thể tập trung vào sự phát triển máy tìm kiếm của hãng trên các dự án với “mục đích thương mại cao, như du lịch”. Hãng này đã đóng một cổng điện tử, gọi là Live Book Search (Tìm kiếm sách trực tuyến), mà nó đã cho phép người sử dụng tìm kiếm các cuốn sách từ Thư viện Anh và các nguồn khác. Các cuốn sách này bây giờ có thể tìm kiếm được thông qua máy tìm kiếm chính của Microsoft là Live Search.
Thư viện Anh giữ khoảng 150 triệu đồ vật, trong đó 13 triệu là sách, Fitzgerald nói. Việc quét 100,000 cuốn sách có thể chiếm khoảng 0.5% của những gì thư viện này có, ông nói. Thư viện chỉ cần quét các cuốn sách mà chúng có bản quyền bị sai sót, mà chúng vẫn còn ở tình trạng tốt, khoảng 2,5 triệu đơn vị tất cả.
Những cuốn sách này được quét bằng các máy tự động mà chúng lật được các trang. Máy APT BookScan 2400, được làm bởi Kirtas, sử dụng một cánh tay người máy để lật các trang, trong đó 2,400 trang có thể quét được trong 1 giờ đồng hồ. Fitzgerald nói các nhà thầu vận hành các máy này từ 6 giờ sáng cho tới 11 giờ đêm trong 2 ca, quét được khoảng 75,000 trang mỗi ngày.
The library would be open to partnerships with other companies, including Google, that express an interest in digitisation projects, he said. Microsoft's departure wasn't entirely unexpected.
"This isn't a new situation for the library," Fitzgerald said. "We have lots of experience in this area, and we are pragmatic and realistic. Commercial third parties will only maintain a resource if it fulfils their commercial imperative."
Microsoft said last week it would focus its search engine development on projects with "high commercial intent, such as travel." The company shut down a portal, called Live Book Search, that allowed users to search books f-rom the British Library and other sources. Those books are now searchable through Microsoft's main search engine, Live Search.
The British Library holds about 150 million items, of which 13 million are books, Fitzgerald said. Scanning 100,000 books would represent about 0.5 percent of the library's holdings, he said. The library can only scan books for which the copyright has lapsed, yet which are still in a fit state, around 2.5 million items in all.
The books are scanned by automated machines that turn the pages. The APT BookScan 2400, made by Kirtas, uses a robotic arm to turn pages, of which 2,400 can be scanned per hour. Fitzgerald said contractors operate the machines f-rom 6am to 11pm in two shifts, scanning some 75,000 pages per day.
Dịch tài liệu: Lê Trung Nghĩa
Ý kiến bạn đọc
Những tin mới hơn
Những tin cũ hơn
Blog này được chuyển đổi từ http://blog.yahoo.com/letrungnghia trên Yahoo Blog sang sử dụng NukeViet sau khi Yahoo Blog đóng cửa tại Việt Nam ngày 17/01/2013.Kể từ ngày 07/02/2013, thông tin trên Blog được cập nhật tiếp tục trở lại với sự hỗ trợ kỹ thuật và đặt chỗ hosting của nhóm phát triển...
Các bài trình chiếu trong năm 2024
Tập huấn thực hành ‘Khai thác tài nguyên giáo dục mở’ cho giáo viên phổ thông, bao gồm cả giáo viên tiểu học và mầm non tới hết năm 2024
Các lớp tập huấn thực hành ‘Khai thác tài nguyên giáo dục mở’ tới hết năm 2024
Các tài liệu dịch sang tiếng Việt tới hết năm 2024
‘Digcomp 2.2: Khung năng lực số cho công dân - với các ví dụ mới về kiến thức, kỹ năng và thái độ’, EC xuất bản năm 2022
Tổng hợp các bài của Nhóm các Nhà cấp vốn Nghiên cứu Mở (ORFG) đã được dịch sang tiếng Việt
Tổng hợp các bài của Liên minh S (cOAlition S) đã được dịch sang tiếng Việt
Năm Khoa học Mở & Chuyển đổi sang Khoa học Mở - Tổng hợp các bài liên quan
Hội nghị Đối tác Dữ liệu Mở châu Á năm 2021 do Việt Nam lần đầu tiên chủ trì
Các khung năng lực trong hành động
Phong trào Bình dân học vụ số: Mục tiêu, đối tượng, nội dung, nguồn lực, phương thức tổ chức thực hiện
Lễ công bố công khai Trung tâm Năng lực Kim cương châu Âu và dự án ALMASI
Khung năng lực AI cho giáo viên
Ngày Phần mềm Tự do, Ngày Phần cứng tự do, Ngày Tài liệu Tự do
‘Khung năng lực AI cho giáo viên’ - bản dịch sang tiếng Việt
Bạn cần biết những gì về các khung năng lực AI mới của UNESCO cho học sinh và giáo viên
Bàn về 'Lợi thế của doanh nghiệp Việt là dữ liệu Việt, bài toán Việt' - bài phát biểu của Bộ trưởng Nguyễn Mạnh Hùng ngày 21/08/2025
Các tài liệu dịch sang tiếng Việt tới hết năm 2024
Các bài trình chiếu trong năm 2024
‘Tài liệu quan điểm của KR21 về Giữ lại Quyền Tác giả: Giữ lại các quyền trong kết quả đầu ra nghiên cứu để cho phép phổ biến mở kiến thức’ - bản dịch sang tiếng Việt
DeepSeek đã gây ra sự hoảng loạn trên thị trường — nhưng một số người cho rằng việc bán tháo là quá mức
“Chúng tôi không có hào nước”: Sự đổi mới đột phá của AI nguồn mở
‘KHUYẾN NGHỊ VÀ HƯỚNG DẪN TRUY CẬP MỞ KIM CƯƠNG cho các cơ sở, nhà cấp vốn, nhà bảo trợ, nhà tài trợ, và nhà hoạch định chính sách’ - bản dịch sang tiếng Việt
Nhà khoa học AI hàng đầu của Meta cho biết thành công của DeepSeek cho thấy 'các mô hình nguồn mở đang vượt trội hơn các mô hình độc quyền'
Ứng dụng và phát triển Tài nguyên Giáo dục Mở (OER) tại Việt Nam
Tập huấn thực hành ‘Khai thác tài nguyên giáo dục mở’ cho giáo viên phổ thông, bao gồm cả giáo viên tiểu học và mầm non tới hết năm 2024
Mark Zuckerberg: DeepSeek cho thấy vì sao nước Mỹ phải là ‘tiêu chuẩn nguồn mở toàn cầu’ của AI; không có lý do gì để suy nghĩ lại về việc chi tiêu
Dữ liệu để phân loại AI
50 công cụ AI tốt nhất cho năm 2025 (Đã thử và kiểm nghiệm)
Tài sản chung kỹ thuật số và Hàng hóa Công cộng Kỹ thuật số - Tìm thấy nền tảng chung cho các nhà hoạch định chính sách