Theo: http://www.rlhc.net/blog/2008/02/06/linuxcom-linux-to-help-the-library-of-con...
Bài được đưa lên Internet ngày: 06/02/2008
Posted in OSS, OSS in Gov and Edu at 10:14 pm
Trích đoạn:
“Thư viện quốc hội, nơi hàng ngàn tài liệu nhà nước hiếm có, liên quan tới lịch sử của nước Mỹ được lưu giữ và đang chậm dãi mục nát, sắp bắt đầu một dự án đầy tham vọng nhằm số hoá các tài liệu mong manh này bằng việc sử dụng các hệ thống dựa trên Linux và xuất bản các kết quả trực tuyến ở nhiều định dạng”.
Nhờ có 2 triệu USD dành được từ tổ chức Sloan Foundation, “Việc số hoá những dấu ấn của nước Mỹ tại Thư viện Quốc hội” sẽ bắt đầu nhiệm vụ số hoá các tài nguyên quý hiếm này – bao gồm cả cuộc Nội Chiến và các tài liệu phả hệ, các tác phẩm nghệ thuật và kỹ thuật có liên quan tới điện ảnh, nhiều sách, và 850 bài được viết, in, soạn thảo hoặc xuất bản bởi Benjamin Franklin. Theo Brewster Kahle của nhà lưu trữ Internet (Internet Archive), mà nó đã phát triển công nghệ số hoá này, các phần mềm nguồn mở sẽ đóng một vai trò “tuyệt đối sống còn” trong việc hoàn thành công việc này.
Thành phần chính là Scribe, một sự kết hợp giữa phần cứng và phần mềm tự do. “Scribe là một hệ thống quét sách mà nó nhận các hình ảnh chất lượng cao của sách và sau đó thực hiện một loạt các thao tác, chuyển chúng sang nhận dạng ký tự quang học và nén lại, nên bạn có thể có các phiên bản in được một cách đẹp đẽ của các cuốn sách đó và còn có thể tìm kiếm được”, Kahle nói.”
Trong khi các phiên bản trước được viết cho cả Linux và Windows, Internet Archive đã chuyển Scribe toàn bộ sang Linux, và bỏ hỗ trợ cho Windows. Kahle nói dự án bây giờ sử dụng Ubuntu.
Excerpt:
“The Library of Congress, whe-re thousands of rare public domain documents relating to America’s history are stored and slowly decaying, is about to begin an ambitious project to digitize these fragile documents using Linux-based systems and publish the results online in multiple formats.
Thanks to a $2 million grant f-rom the Sloan Foundation, “Digitizing American Imprints at the Library of Congress” will begin the task of digitizing these rare materials — including Civil War and genealogical documents, technical and artistic works concerning photography, scores of books, and the 850 titles written, printed, edited, or published by Benjamin Franklin. According to Brewster Kahle of the Internet Archive, which developed the digitizing technology, open source software will play an “absolutely critical” role in getting the job done.
The main component is Scribe, a combination of hardware and free software. “Scribe is a book-scanning system that takes high-quality images of books and then does a set of manipulations, gets them in optical c-haracter recognition and compressed, so you can get beautiful, printable versions of the book that are also searchable,” says Kahle.
While previous versions were written for both Linux and Windows, the Internet Archive has migrated Scribe entirely to Linux, and Windows support has been d-ropped. Kahle says the project uses Ubuntu now.”
Dịch tài liệu: Lê Trung Nghĩa
Ý kiến bạn đọc
Những tin mới hơn
Những tin cũ hơn
Blog này được chuyển đổi từ http://blog.yahoo.com/letrungnghia trên Yahoo Blog sang sử dụng NukeViet sau khi Yahoo Blog đóng cửa tại Việt Nam ngày 17/01/2013.Kể từ ngày 07/02/2013, thông tin trên Blog được cập nhật tiếp tục trở lại với sự hỗ trợ kỹ thuật và đặt chỗ hosting của nhóm phát triển...
Các bài trình chiếu trong năm 2024
Tập huấn thực hành ‘Khai thác tài nguyên giáo dục mở’ cho giáo viên phổ thông, bao gồm cả giáo viên tiểu học và mầm non tới hết năm 2024
Các lớp tập huấn thực hành ‘Khai thác tài nguyên giáo dục mở’ tới hết năm 2024
Các tài liệu dịch sang tiếng Việt tới hết năm 2024
‘Digcomp 2.2: Khung năng lực số cho công dân - với các ví dụ mới về kiến thức, kỹ năng và thái độ’, EC xuất bản năm 2022
Tổng hợp các bài của Nhóm các Nhà cấp vốn Nghiên cứu Mở (ORFG) đã được dịch sang tiếng Việt
Tổng hợp các bài của Liên minh S (cOAlition S) đã được dịch sang tiếng Việt
Năm Khoa học Mở & Chuyển đổi sang Khoa học Mở - Tổng hợp các bài liên quan
Hội nghị Đối tác Dữ liệu Mở châu Á năm 2021 do Việt Nam lần đầu tiên chủ trì
Các khung năng lực trong hành động
Phong trào Bình dân học vụ số: Mục tiêu, đối tượng, nội dung, nguồn lực, phương thức tổ chức thực hiện
Lễ công bố công khai Trung tâm Năng lực Kim cương châu Âu và dự án ALMASI
Khung năng lực AI cho giáo viên
Sư phạm Mở là gì (Trang của Đại học British Columbia, Canada)
Ngày Phần mềm Tự do, Ngày Phần cứng tự do, Ngày Tài liệu Tự do
‘Khung năng lực AI cho giáo viên’ - bản dịch sang tiếng Việt
Bạn cần biết những gì về các khung năng lực AI mới của UNESCO cho học sinh và giáo viên
Bàn về 'Lợi thế của doanh nghiệp Việt là dữ liệu Việt, bài toán Việt' - bài phát biểu của Bộ trưởng Nguyễn Mạnh Hùng ngày 21/08/2025
Các bài trình chiếu trong năm 2024
Triển khai Khuyến nghị Khoa học Mở của UNESCO, cập nhật 15/10/2024
Các tài liệu dịch sang tiếng Việt tới hết năm 2024
‘Tài liệu quan điểm của KR21 về Giữ lại Quyền Tác giả: Giữ lại các quyền trong kết quả đầu ra nghiên cứu để cho phép phổ biến mở kiến thức’ - bản dịch sang tiếng Việt
‘LƯU Ý KHÁI NIỆM: Hội nghị Tài nguyên Giáo dục Mở Thế giới lần 3 năm 2024 của UNESCO “Tài sản Công cộng Kỹ thuật số: Giải pháp Mở và AI vì Quyền truy cập Toàn diện tới Tri thức”’ - bản dịch sang tiếng Việt
Tập huấn thực hành ‘Khai thác tài nguyên giáo dục mở’ cho giáo viên phổ thông, bao gồm cả giáo viên tiểu học và mầm non tới hết năm 2024
‘KHUYẾN NGHỊ VÀ HƯỚNG DẪN TRUY CẬP MỞ KIM CƯƠNG cho các cơ sở, nhà cấp vốn, nhà bảo trợ, nhà tài trợ, và nhà hoạch định chính sách’ - bản dịch sang tiếng Việt
DeepSeek đã gây ra sự hoảng loạn trên thị trường — nhưng một số người cho rằng việc bán tháo là quá mức
Dữ liệu để phân loại AI
“Chúng tôi không có hào nước”: Sự đổi mới đột phá của AI nguồn mở
Ứng dụng và phát triển Tài nguyên Giáo dục Mở (OER) tại Việt Nam
Nhà khoa học AI hàng đầu của Meta cho biết thành công của DeepSeek cho thấy 'các mô hình nguồn mở đang vượt trội hơn các mô hình độc quyền'