Theo: http://www.rlhc.net/blog/2008/02/06/linuxcom-linux-to-help-the-library-of-con...
Bài được đưa lên Internet ngày: 06/02/2008
Posted in OSS, OSS in Gov and Edu at 10:14 pm
Trích đoạn:
“Thư viện quốc hội, nơi hàng ngàn tài liệu nhà nước hiếm có, liên quan tới lịch sử của nước Mỹ được lưu giữ và đang chậm dãi mục nát, sắp bắt đầu một dự án đầy tham vọng nhằm số hoá các tài liệu mong manh này bằng việc sử dụng các hệ thống dựa trên Linux và xuất bản các kết quả trực tuyến ở nhiều định dạng”.
Nhờ có 2 triệu USD dành được từ tổ chức Sloan Foundation, “Việc số hoá những dấu ấn của nước Mỹ tại Thư viện Quốc hội” sẽ bắt đầu nhiệm vụ số hoá các tài nguyên quý hiếm này – bao gồm cả cuộc Nội Chiến và các tài liệu phả hệ, các tác phẩm nghệ thuật và kỹ thuật có liên quan tới điện ảnh, nhiều sách, và 850 bài được viết, in, soạn thảo hoặc xuất bản bởi Benjamin Franklin. Theo Brewster Kahle của nhà lưu trữ Internet (Internet Archive), mà nó đã phát triển công nghệ số hoá này, các phần mềm nguồn mở sẽ đóng một vai trò “tuyệt đối sống còn” trong việc hoàn thành công việc này.
Thành phần chính là Scribe, một sự kết hợp giữa phần cứng và phần mềm tự do. “Scribe là một hệ thống quét sách mà nó nhận các hình ảnh chất lượng cao của sách và sau đó thực hiện một loạt các thao tác, chuyển chúng sang nhận dạng ký tự quang học và nén lại, nên bạn có thể có các phiên bản in được một cách đẹp đẽ của các cuốn sách đó và còn có thể tìm kiếm được”, Kahle nói.”
Trong khi các phiên bản trước được viết cho cả Linux và Windows, Internet Archive đã chuyển Scribe toàn bộ sang Linux, và bỏ hỗ trợ cho Windows. Kahle nói dự án bây giờ sử dụng Ubuntu.
Excerpt:
“The Library of Congress, whe-re thousands of rare public domain documents relating to America’s history are stored and slowly decaying, is about to begin an ambitious project to digitize these fragile documents using Linux-based systems and publish the results online in multiple formats.
Thanks to a $2 million grant f-rom the Sloan Foundation, “Digitizing American Imprints at the Library of Congress” will begin the task of digitizing these rare materials — including Civil War and genealogical documents, technical and artistic works concerning photography, scores of books, and the 850 titles written, printed, edited, or published by Benjamin Franklin. According to Brewster Kahle of the Internet Archive, which developed the digitizing technology, open source software will play an “absolutely critical” role in getting the job done.
The main component is Scribe, a combination of hardware and free software. “Scribe is a book-scanning system that takes high-quality images of books and then does a set of manipulations, gets them in optical c-haracter recognition and compressed, so you can get beautiful, printable versions of the book that are also searchable,” says Kahle.
While previous versions were written for both Linux and Windows, the Internet Archive has migrated Scribe entirely to Linux, and Windows support has been d-ropped. Kahle says the project uses Ubuntu now.”
Dịch tài liệu: Lê Trung Nghĩa
Ý kiến bạn đọc
Những tin mới hơn
Những tin cũ hơn
Blog này được chuyển đổi từ http://blog.yahoo.com/letrungnghia trên Yahoo Blog sang sử dụng NukeViet sau khi Yahoo Blog đóng cửa tại Việt Nam ngày 17/01/2013.Kể từ ngày 07/02/2013, thông tin trên Blog được cập nhật tiếp tục trở lại với sự hỗ trợ kỹ thuật và đặt chỗ hosting của nhóm phát triển...