Theo: http://www.rlhc.net/blog/2008/02/06/linuxcom-linux-to-help-the-library-of-con...
Bài được đưa lên Internet ngày: 06/02/2008
Posted in OSS, OSS in Gov and Edu at 10:14 pm
Trích đoạn:
“Thư viện quốc hội, nơi hàng ngàn tài liệu nhà nước hiếm có, liên quan tới lịch sử của nước Mỹ được lưu giữ và đang chậm dãi mục nát, sắp bắt đầu một dự án đầy tham vọng nhằm số hoá các tài liệu mong manh này bằng việc sử dụng các hệ thống dựa trên Linux và xuất bản các kết quả trực tuyến ở nhiều định dạng”.
Nhờ có 2 triệu USD dành được từ tổ chức Sloan Foundation, “Việc số hoá những dấu ấn của nước Mỹ tại Thư viện Quốc hội” sẽ bắt đầu nhiệm vụ số hoá các tài nguyên quý hiếm này – bao gồm cả cuộc Nội Chiến và các tài liệu phả hệ, các tác phẩm nghệ thuật và kỹ thuật có liên quan tới điện ảnh, nhiều sách, và 850 bài được viết, in, soạn thảo hoặc xuất bản bởi Benjamin Franklin. Theo Brewster Kahle của nhà lưu trữ Internet (Internet Archive), mà nó đã phát triển công nghệ số hoá này, các phần mềm nguồn mở sẽ đóng một vai trò “tuyệt đối sống còn” trong việc hoàn thành công việc này.
Thành phần chính là Scribe, một sự kết hợp giữa phần cứng và phần mềm tự do. “Scribe là một hệ thống quét sách mà nó nhận các hình ảnh chất lượng cao của sách và sau đó thực hiện một loạt các thao tác, chuyển chúng sang nhận dạng ký tự quang học và nén lại, nên bạn có thể có các phiên bản in được một cách đẹp đẽ của các cuốn sách đó và còn có thể tìm kiếm được”, Kahle nói.”
Trong khi các phiên bản trước được viết cho cả Linux và Windows, Internet Archive đã chuyển Scribe toàn bộ sang Linux, và bỏ hỗ trợ cho Windows. Kahle nói dự án bây giờ sử dụng Ubuntu.
Excerpt:
“The Library of Congress, whe-re thousands of rare public domain documents relating to America’s history are stored and slowly decaying, is about to begin an ambitious project to digitize these fragile documents using Linux-based systems and publish the results online in multiple formats.
Thanks to a $2 million grant f-rom the Sloan Foundation, “Digitizing American Imprints at the Library of Congress” will begin the task of digitizing these rare materials — including Civil War and genealogical documents, technical and artistic works concerning photography, scores of books, and the 850 titles written, printed, edited, or published by Benjamin Franklin. According to Brewster Kahle of the Internet Archive, which developed the digitizing technology, open source software will play an “absolutely critical” role in getting the job done.
The main component is Scribe, a combination of hardware and free software. “Scribe is a book-scanning system that takes high-quality images of books and then does a set of manipulations, gets them in optical c-haracter recognition and compressed, so you can get beautiful, printable versions of the book that are also searchable,” says Kahle.
While previous versions were written for both Linux and Windows, the Internet Archive has migrated Scribe entirely to Linux, and Windows support has been d-ropped. Kahle says the project uses Ubuntu now.”
Dịch tài liệu: Lê Trung Nghĩa
Ý kiến bạn đọc
Những tin mới hơn
Những tin cũ hơn
Blog này được chuyển đổi từ http://blog.yahoo.com/letrungnghia trên Yahoo Blog sang sử dụng NukeViet sau khi Yahoo Blog đóng cửa tại Việt Nam ngày 17/01/2013.Kể từ ngày 07/02/2013, thông tin trên Blog được cập nhật tiếp tục trở lại với sự hỗ trợ kỹ thuật và đặt chỗ hosting của nhóm phát triển...
DigComp 3.0: Khung năng lực số châu Âu
Các bài toàn văn trong năm 2025
Các bài trình chiếu trong năm 2025
Các lớp tập huấn thực hành ‘Khai thác tài nguyên giáo dục mở’ tới hết năm 2025
Tập huấn thực hành ‘Khai thác tài nguyên giáo dục mở’ cho giáo viên phổ thông, bao gồm cả giáo viên tiểu học và mầm non tới hết năm 2025
Các tài liệu dịch sang tiếng Việt tới hết năm 2025
Loạt bài về AI và AI Nguồn Mở: Công cụ AI; Dự án AI Nguồn Mở; LLM Nguồn Mở; Kỹ thuật lời nhắc;
Tổng hợp các bài của Nhóm các Nhà cấp vốn Nghiên cứu Mở (ORFG) đã được dịch sang tiếng Việt
Tổng hợp các bài của Liên minh S (cOAlition S) đã được dịch sang tiếng Việt
Năm Khoa học Mở & Chuyển đổi sang Khoa học Mở - Tổng hợp các bài liên quan
Bạn cần biết những gì về các khung năng lực AI mới của UNESCO cho học sinh và giáo viên
Bàn về 'Lợi thế của doanh nghiệp Việt là dữ liệu Việt, bài toán Việt' - bài phát biểu của Bộ trưởng Nguyễn Mạnh Hùng ngày 21/08/2025
Khung năng lực AI cho giáo viên
Ngày Phần mềm Tự do, Ngày Phần cứng tự do, Ngày Tài liệu Tự do
‘Khung năng lực AI cho giáo viên’ - bản dịch sang tiếng Việt
Mark Zuckerberg: DeepSeek cho thấy vì sao nước Mỹ phải là ‘tiêu chuẩn nguồn mở toàn cầu’ của AI; không có lý do gì để suy nghĩ lại về việc chi tiêu
‘KHUYẾN NGHỊ VÀ HƯỚNG DẪN TRUY CẬP MỞ KIM CƯƠNG cho các cơ sở, nhà cấp vốn, nhà bảo trợ, nhà tài trợ, và nhà hoạch định chính sách’ - bản dịch sang tiếng Việt
DeepSeek đã gây ra sự hoảng loạn trên thị trường — nhưng một số người cho rằng việc bán tháo là quá mức
50 công cụ AI tốt nhất cho năm 2025 (Đã thử và kiểm nghiệm)
Nhà khoa học AI hàng đầu của Meta cho biết thành công của DeepSeek cho thấy 'các mô hình nguồn mở đang vượt trội hơn các mô hình độc quyền'
UNESCO dành Ngày Giáo dục Quốc tế 2025 cho Trí tuệ nhân tạo
“Chúng tôi không có hào nước”: Sự đổi mới đột phá của AI nguồn mở
‘Đặc tả Khung Tính mở Mô hình (MOF)’ của LF AI & Data - Tài sản chung của AI Tạo sinh - bản dịch sang tiếng Việt
‘LỘ TRÌNH CỦA TỔNG THƯ KÝ LIÊN HIỆP QUỐC VỀ HỢP TÁC KỸ THUẬT SỐ THÚC ĐẨY HÀNG HÓA CÔNG CỘNG KỸ THUẬT SỐ’ - bản dịch sang tiếng Việt
AI trong TVET - Một vài gợi ý triển khai trong thực tế
Dữ liệu để phân loại AI
Tài sản chung kỹ thuật số và Hàng hóa Công cộng Kỹ thuật số - Tìm thấy nền tảng chung cho các nhà hoạch định chính sách
Khung năng lực AI cho học sinh
Nếu DeepSeek muốn trở thành một người phá vỡ thực sự, nó phải tiến xa hơn nữa về tính minh bạch của dữ liệu
Mark Zuckerberg nói Meta có kế hoạch chi hơn 60 tỷ USD khi Thung lũng silicon hoảng loạn về sự cạnh tranh của AI Trung Quốc