Thư viện số hoá 20 triệu trang từ các cuốn sách thế kỷ 19
Library digitises 20 million pages f-rom 19th Century books
By Jeremy Kirk, IDG News Service
Theo: http://www.computerworlduk.com/technology/internet/web2/news/index.cfm?newsid...
Bài được đưa lên Internet ngày: 30/05/2008
Các dự án đang tiến hành của Thư viện Anh sẽ làm cho hàng ngàn cuốn sách và các nguồn tài liệu khác sẵn sàng số hoá sẽ không bị chậm lại một cách đáng kể, dù việc cuối tuần trước đã kết thúc quan hệ đối tác với Microsoft, một quan chức cao cấp của thư viện nói hôm thứ sáu.
Microsoft đã thiết lập một quan hệ đối tác với thư viện này vào tháng 11/2005 để đầu tư việc quét khoảng 100,000 bản sao các cuốn sách thế kỷ thứ 19, hoặc khoảng 20 triệu trang. Công việc quét này sẽ tiếp tục lâu thêm chút nữa cho tới khi 40,000 cuốn sách được kết thúc, Neil Fitzgerald, người quản lý dự án số hoá này, nói.
Thư viện này có 15 dự án số hoá hiện đang được thực hiện, tập trug vào việc lưu giữ những thứ khác như các hồ sơ âm thanh và các trang báo. Việc đầu tư tới từ các nguồn cả tư nhân lẫn nhà nước. Các dự án này sẽ tiếp tục, Fitzgerald nói.
“Có thể sẽ có một xu hướng xem xét các khía cạnh có thể tiêu cực, nhưng tôi nghĩ đáng giá để nhấn mạnh điều này sẽ cho kết quả tích cực đối với thư viện”, Fitzgerald nói.
The British Library's ongoing projects to make thousands of books and other resources available digitally won't slow down significantly, despite the ending last week of a partnership with Microsoft, a senior library official said Friday.
Microsoft formed a partnership with the library in November 2005 to fund the scanning of up to 100,000 out-of-copyright 19th century books, or around 20 million pages. The scanning work will continue for a while longer until the last 40,000 books are finished, said Neil Fitzgerald, digitisation project manager.
The library has 15 ongoing digitisation projects, focusing on other holdings such as sound recordings and newspaper pages. Funding come f-rom a mix of private and public sources. Those projects will continue, Fitzgerald said.
"There can be a tendency to look at possibly negative aspects, but I think it's worth emphasizing this has been a positive outcome for the library," Fitzgerald said.
Thư viện này có thể mở để thiết lập quan hệ đối tác với các công ty khác, bao gồm Google, mà hãng này bày tỏ mối quan tâm trong các dự án số hoá. Sự khởi đầu của Microsoft sẽ không hoàn toàn được mong đợi.
“Đây không là tình trạng mới cho thư viện”, Fitzgerald nói. “Chúng tôi có nhiều kinh nghiệm trong lĩnh vực này, và chúng tôi là thực dụng và thực tế. Các bên thương mại thứ ba sẽ chỉ duy trì một tài nguyên nếu nó thi hành mệnh lệnh thương mại của họ”.
Microsoft nói tuần trước hãng có thể tập trung vào sự phát triển máy tìm kiếm của hãng trên các dự án với “mục đích thương mại cao, như du lịch”. Hãng này đã đóng một cổng điện tử, gọi là Live Book Search (Tìm kiếm sách trực tuyến), mà nó đã cho phép người sử dụng tìm kiếm các cuốn sách từ Thư viện Anh và các nguồn khác. Các cuốn sách này bây giờ có thể tìm kiếm được thông qua máy tìm kiếm chính của Microsoft là Live Search.
Thư viện Anh giữ khoảng 150 triệu đồ vật, trong đó 13 triệu là sách, Fitzgerald nói. Việc quét 100,000 cuốn sách có thể chiếm khoảng 0.5% của những gì thư viện này có, ông nói. Thư viện chỉ cần quét các cuốn sách mà chúng có bản quyền bị sai sót, mà chúng vẫn còn ở tình trạng tốt, khoảng 2,5 triệu đơn vị tất cả.
Những cuốn sách này được quét bằng các máy tự động mà chúng lật được các trang. Máy APT BookScan 2400, được làm bởi Kirtas, sử dụng một cánh tay người máy để lật các trang, trong đó 2,400 trang có thể quét được trong 1 giờ đồng hồ. Fitzgerald nói các nhà thầu vận hành các máy này từ 6 giờ sáng cho tới 11 giờ đêm trong 2 ca, quét được khoảng 75,000 trang mỗi ngày.
The library would be open to partnerships with other companies, including Google, that express an interest in digitisation projects, he said. Microsoft's departure wasn't entirely unexpected.
"This isn't a new situation for the library," Fitzgerald said. "We have lots of experience in this area, and we are pragmatic and realistic. Commercial third parties will only maintain a resource if it fulfils their commercial imperative."
Microsoft said last week it would focus its search engine development on projects with "high commercial intent, such as travel." The company shut down a portal, called Live Book Search, that allowed users to search books f-rom the British Library and other sources. Those books are now searchable through Microsoft's main search engine, Live Search.
The British Library holds about 150 million items, of which 13 million are books, Fitzgerald said. Scanning 100,000 books would represent about 0.5 percent of the library's holdings, he said. The library can only scan books for which the copyright has lapsed, yet which are still in a fit state, around 2.5 million items in all.
The books are scanned by automated machines that turn the pages. The APT BookScan 2400, made by Kirtas, uses a robotic arm to turn pages, of which 2,400 can be scanned per hour. Fitzgerald said contractors operate the machines f-rom 6am to 11pm in two shifts, scanning some 75,000 pages per day.
Dịch tài liệu: Lê Trung Nghĩa
Ý kiến bạn đọc
Những tin mới hơn
Những tin cũ hơn
Blog này được chuyển đổi từ http://blog.yahoo.com/letrungnghia trên Yahoo Blog sang sử dụng NukeViet sau khi Yahoo Blog đóng cửa tại Việt Nam ngày 17/01/2013.Kể từ ngày 07/02/2013, thông tin trên Blog được cập nhật tiếp tục trở lại với sự hỗ trợ kỹ thuật và đặt chỗ hosting của nhóm phát triển...