Theo: http://www.rlhc.net/blog/2008/02/06/linuxcom-linux-to-help-the-library-of-con...
Bài được đưa lên Internet ngày: 06/02/2008
Posted in OSS, OSS in Gov and Edu at 10:14 pm
Trích đoạn:
“Thư viện quốc hội, nơi hàng ngàn tài liệu nhà nước hiếm có, liên quan tới lịch sử của nước Mỹ được lưu giữ và đang chậm dãi mục nát, sắp bắt đầu một dự án đầy tham vọng nhằm số hoá các tài liệu mong manh này bằng việc sử dụng các hệ thống dựa trên Linux và xuất bản các kết quả trực tuyến ở nhiều định dạng”.
Nhờ có 2 triệu USD dành được từ tổ chức Sloan Foundation, “Việc số hoá những dấu ấn của nước Mỹ tại Thư viện Quốc hội” sẽ bắt đầu nhiệm vụ số hoá các tài nguyên quý hiếm này – bao gồm cả cuộc Nội Chiến và các tài liệu phả hệ, các tác phẩm nghệ thuật và kỹ thuật có liên quan tới điện ảnh, nhiều sách, và 850 bài được viết, in, soạn thảo hoặc xuất bản bởi Benjamin Franklin. Theo Brewster Kahle của nhà lưu trữ Internet (Internet Archive), mà nó đã phát triển công nghệ số hoá này, các phần mềm nguồn mở sẽ đóng một vai trò “tuyệt đối sống còn” trong việc hoàn thành công việc này.
Thành phần chính là Scribe, một sự kết hợp giữa phần cứng và phần mềm tự do. “Scribe là một hệ thống quét sách mà nó nhận các hình ảnh chất lượng cao của sách và sau đó thực hiện một loạt các thao tác, chuyển chúng sang nhận dạng ký tự quang học và nén lại, nên bạn có thể có các phiên bản in được một cách đẹp đẽ của các cuốn sách đó và còn có thể tìm kiếm được”, Kahle nói.”
Trong khi các phiên bản trước được viết cho cả Linux và Windows, Internet Archive đã chuyển Scribe toàn bộ sang Linux, và bỏ hỗ trợ cho Windows. Kahle nói dự án bây giờ sử dụng Ubuntu.
Excerpt:
“The Library of Congress, whe-re thousands of rare public domain documents relating to America’s history are stored and slowly decaying, is about to begin an ambitious project to digitize these fragile documents using Linux-based systems and publish the results online in multiple formats.
Thanks to a $2 million grant f-rom the Sloan Foundation, “Digitizing American Imprints at the Library of Congress” will begin the task of digitizing these rare materials — including Civil War and genealogical documents, technical and artistic works concerning photography, scores of books, and the 850 titles written, printed, edited, or published by Benjamin Franklin. According to Brewster Kahle of the Internet Archive, which developed the digitizing technology, open source software will play an “absolutely critical” role in getting the job done.
The main component is Scribe, a combination of hardware and free software. “Scribe is a book-scanning system that takes high-quality images of books and then does a set of manipulations, gets them in optical c-haracter recognition and compressed, so you can get beautiful, printable versions of the book that are also searchable,” says Kahle.
While previous versions were written for both Linux and Windows, the Internet Archive has migrated Scribe entirely to Linux, and Windows support has been d-ropped. Kahle says the project uses Ubuntu now.”
Dịch tài liệu: Lê Trung Nghĩa
Ý kiến bạn đọc
Những tin mới hơn
Những tin cũ hơn
Blog này được chuyển đổi từ http://blog.yahoo.com/letrungnghia trên Yahoo Blog sang sử dụng NukeViet sau khi Yahoo Blog đóng cửa tại Việt Nam ngày 17/01/2013.Kể từ ngày 07/02/2013, thông tin trên Blog được cập nhật tiếp tục trở lại với sự hỗ trợ kỹ thuật và đặt chỗ hosting của nhóm phát triển...
DigComp 3.0: Khung năng lực số châu Âu
Các bài toàn văn trong năm 2025
Các bài trình chiếu trong năm 2025
Các lớp tập huấn thực hành ‘Khai thác tài nguyên giáo dục mở’ tới hết năm 2025
Tập huấn thực hành ‘Khai thác tài nguyên giáo dục mở’ cho giáo viên phổ thông, bao gồm cả giáo viên tiểu học và mầm non tới hết năm 2025
Các tài liệu dịch sang tiếng Việt tới hết năm 2025
Loạt bài về AI và AI Nguồn Mở: Công cụ AI; Dự án AI Nguồn Mở; LLM Nguồn Mở; Kỹ thuật lời nhắc;
Tổng hợp các bài của Nhóm các Nhà cấp vốn Nghiên cứu Mở (ORFG) đã được dịch sang tiếng Việt
Tổng hợp các bài của Liên minh S (cOAlition S) đã được dịch sang tiếng Việt
Năm Khoa học Mở & Chuyển đổi sang Khoa học Mở - Tổng hợp các bài liên quan
Bàn về 'Lợi thế của doanh nghiệp Việt là dữ liệu Việt, bài toán Việt' - bài phát biểu của Bộ trưởng Nguyễn Mạnh Hùng ngày 21/08/2025
Bạn cần biết những gì về các khung năng lực AI mới của UNESCO cho học sinh và giáo viên
Khung năng lực AI cho giáo viên
‘KHUYẾN NGHỊ VÀ HƯỚNG DẪN TRUY CẬP MỞ KIM CƯƠNG cho các cơ sở, nhà cấp vốn, nhà bảo trợ, nhà tài trợ, và nhà hoạch định chính sách’ - bản dịch sang tiếng Việt
50 công cụ AI tốt nhất cho năm 2025 (Đã thử và kiểm nghiệm)
‘Đặc tả Khung Tính mở Mô hình (MOF)’ của LF AI & Data - Tài sản chung của AI Tạo sinh - bản dịch sang tiếng Việt
‘LỘ TRÌNH CỦA TỔNG THƯ KÝ LIÊN HIỆP QUỐC VỀ HỢP TÁC KỸ THUẬT SỐ THÚC ĐẨY HÀNG HÓA CÔNG CỘNG KỸ THUẬT SỐ’ - bản dịch sang tiếng Việt
AI trong TVET - Một vài gợi ý triển khai trong thực tế
Khung năng lực AI cho học sinh
Tài sản chung kỹ thuật số và Hàng hóa Công cộng Kỹ thuật số - Tìm thấy nền tảng chung cho các nhà hoạch định chính sách
Tọa đàm ‘Vai trò của Tài nguyên Giáo dục Mở trong chuyển đổi số giáo dục đại học’ tại Viện Chuyển đổi số và Học liệu - Đại học Huế, ngày 12/09/2025
12 dự án AI Nguồn Mở hàng đầu để bổ sung vào kho công nghệ của bạn. 11. Hugging Face Transformers
‘Hiệp ước Kỹ thuật số Toàn cầu’ của Liên hiệp quốc - bản dịch sang tiếng Việt
Dự án DIAMAS đưa ra Khuyến nghị và Hướng dẫn Truy cập Mở Kim cương
50 công cụ AI tốt nhất cho năm 2025 (Đã thử và kiểm nghiệm) - Trợ lý AI tốt nhất (chatbots)
Hướng dẫn kỹ thuật lời nhắc. Kỹ thuật viết lời nhắc. Lời nhắc Tái Hành động (ReAct)
‘Quản trị dữ liệu trong AI Nguồn Mở. Xúc tác cho quyền truy cập có trách nhiệm và có hệ thống’ - bản dịch sang tiếng Việt
Vì sao Singapore đang xây dựng hàng hóa công cộng kỹ thuật số
50 công cụ AI tốt nhất cho năm 2025 (Đã thử và kiểm nghiệm) - Trình tạo nhạc AI tốt nhất
Chiến lược 2023-2028 của DPGA