Half of the world’s languages are dying. Should we save them?
What are the implications of a language falling out of use every two weeks?
Mỗi 2 tuần 1 ngôn ngữ không còn được sử dụng nữa nói lên điều gì?
13 Jul 2017, by Subhashish Panigrahi
Theo: https://opensource.com/article/17/7/half-world-languages-dying-save-them
Bài được đưa lên Internet ngày: 13/07/2017
Xem thêm: Giáo dục mở và tài nguyên, giấy phép tư liệu mở
Hiện có khoảng 7.000 ngôn ngữ đang được sử dụng hôm nay, với 1 ngôn ngữ đang chế mỗi 2 tuần. UNESCO nói rằng một nửa các ngôn ngữ trên thế giới có thể biến mất trong thời gian 1 thế kỷ. Và, ở đất nước Ấn Độ của tôi, 220 ngôn ngữ đã chết trong vòng 50 năm qua và 197 ngôn ngữ đang gặp nguy hiểm.
Khoa học Mở - Open science đang thúc đẩy nghiên cứu khoa học bằng việc xúc tác cho các cá nhân và các tổ chức cộng tác và trao đổi tri thức để cải thiện công việc của nhau. Một lĩnh vực có thể sử dụng dạng trợ giúp này là các bản ngữ khắp thế giới.
Ưu thế ngôn ngữ
Như một đứa trẻ, tôi đã lớn lên trong một thành phố nhỏ ở bang Odisha của Ấn Độ, nơi ít nhất 30% dân số nói tiếng Santali, một ngôn ngữ mà đa số mọi người, phần 70% còn lại (bao gồm cả gia đình tôi), đã không bao giờ có ý định học. Đa số dân nói tiếng Odia. Chúng tôi đã không phải học Santali vì Odia từng được nói trong trường học và trên thương trường chuyên nghiệp hơn.
Ưu thế ngôn ngữ xảy ra, và không phải điều này là không OK, vấn đề là chúng ta cần chắc chắn chúng ta cũng đang bảo tồn các ngôn ngữ cổ sao cho chúng ta không đánh mất các câu chuyện và các mẩu văn hóa là di sản trong ngôn ngữ đó. Chúng ta có thể làm thế nào đây? Đối với ngôn ngữ Santali, chúng ta đã chưa được chuẩn bị nên đã cần phải mất gần 15 năm để tuân thủ phông chữ Unicode lần đầu tiên (tiêu chuẩn mã hóa vạn năng và toàn cầu) để được Google phát hành cho nó. Sau đó, tôi đã dẫn dắt dự án để xây dựng phông được cấp Giấy phép Phông Mở - OFL (Open Font License) cho Santali. (Được thợ in Pooja Saxena của Ấn Độ thiết kế, và các công cụ nhập đã được Jnanaranjan Sahoo and Nasim Ali phát triển).
Các ngôn ngữ chết vì nhiều lý do. Một số lý do là:
Trong xã hội đa văn hóa và đa ngôn ngữ, các ngôn ngữ chính thống và/hoặc đa số có ưu thế đang được chính phủ cấp tiền. Chúng được sử dụng để giáo dục trong các trường học và cho nghiên cứu khoa học, ví dụ thế.
Các ngôn ngữ thiểu số thường được dân bản xứ hoặc những người sống trong bần hàn nói.
Thiếu các công cụ số để giúp các xã hội và các nền văn hóa tiếp tục và chia sẻ các bản ngữ, ngôn ngữ thiểu số của họ. Khi việc kể chuyện được thực hiện ngày càng nhiều hơn trên trực tuyến, thì nhu cầu về các công cụ số và các tiêu chuẩn khác trở nên quan trọng hơn.
Cách của nguồn mở có thể cứu các ngôn ngữ đó như thế nào:
Chúng ta cần bản đồ các ngôn ngữ khắp thế giới với các thách thức có liên quan tới việc bảo tồn từng ngôn ngữ.
Chúng ta cần các công cụ và các công nghệ cộng tác để làm việc chặt chẽ với các cộng đồng các ngôn ngữ đang gặp nguy hiểm.
Chúng ta cần tài nguyên giáo dục mở với các sách chỉ dẫn và các tư liệu khác để huấn luyện mọi người cách làm tài liệu về ngôn ngữ.
Chúng ta cần tài liệu nội dung đa phương tiện mở về hiện tại (như, các tin tức về các sự cố và những sự việc khác về kinh tế - xã hội) và quá khứ (văn học dân gian và hiện tượng văn hóa) với chú giải để mở rộng phạm vi các ngôn ngữ.
Chúng ta cần các công cụ số để xây dựng các ứng dụng về ngôn ngữ (như Máy học và các công cụ Xử lý Ngôn ngữ Tự nhiên như văn bản - sang - tiếng nói mà có thể được sử dụng để khuếch đại nội dung đa phương tiện và giúp xây dựng các công cụ có khả năng truy cập số như bộ đọc màn hình).
Có công việc đang được làm, và nhiều công việc hơn phải làm. Việc khai trương các sáng kiến bảo tồn ngôn ngữ đang diễn ra hiện nay để bảo tồn các bản ngữ ở các dạng số. Vài sáng kiến đáng chú ý như:
Viện Ngôn ngữ Sống cho các Ngôn ngữ gặp nguy hiểm (Living Tongues Institute for Endangered Languages)
Cộng đồng các Kho lưu trữ Ngôn ngữ Mở - OLAC (Open Language Archives Community)
TVMalintzi, truyền hình dựa vào YouTube cho Nahuatl
Nghiên cứu và làm báo về chủ đề, như Tương lai các ngôn ngữ gặp nguy hiểm của châu Mỹ (The future of America's endangered languages) của Matt Hansen
Dự án Toàn cầu về Tính mở (Global Oneness Project)
Wikitongues giúp các cộng đồng làm tài liệu cho các câu chuyện kể trên video bằng các bản ngữ
Openwords, một ứng dụng nguồn mở học ngôn ngữ
Dự án về Tính đa dạng Ngôn ngữ Số - DLDP (Digital Language Diversity Project), xây dựng các OER để bảo tồn ngôn ngữ
Kho tàng Chuyện kể về Ngôn ngữ và nhóm các dự án bảo tồn ngôn ngữ khác của nhà ngôn ngữ học Dr. Steven Bird
StoryCorps để ghi lại các câu chuyện kể
Xét thấy tỷ lệ tuyệt diệt ngôn ngữ là quá cao, có nhu cầu can thiệp liên tục. Cá nhân tôi đã bắt đầu dự án gọi là OpenSpeaks để xây dựng các OER và giúp các nhà hoạt động - công dân tạo ra tài liệu ngôn ngữ đa phương tiện. Tôi hy vọng tuyển chọn được nội dung cho khán thính phòng rộng lớn hơn và sử dụng nội dung đó để xây dựng các công cụ về khả năng truy cập số và khác mà sẽ giúp cho những người nói tiếng bản địa truy cập tri thức và đóng góp cho cái chung.
Về tác giả
Subhashish Panigrahi - Subhashish Panigrahi (@subhapa) là Người xúc tác Cộng đồng châu Á ở đội Tham gia của Mozilla, và đang chuyển từ vai trò của anh như là Nhân viên Chương trình của chương trình của Trung tâm Truy cập Tri thức Internet và Xã hội, trước đó với Chương trình của Ấn Độ của Tổ chức Wikimedia, anh là nhà giáo dục ở Ấn Độ,
There are currently around 7,000 languages being used today, with one language dying every two weeks. UNESCO says that half of the world's languages may vanish in a century's time. And, in my home country of India, 220 languages have died in the last 50 years and 197 languages are endangered.
Open science is advancing scientific research by enabling individuals and organizations to collaborate and exchange knowledge that improves each other’s work. One area that could use this kind of help is native languages around the world.
Language dominance
As a kid, I grew up in the small town in the Indian state of Odisha where at least 30% of the population spoke Santali, a language that the majority of the people, the remaining 70% (including my family), never attempted to learn. The majority of the population spoke Odia. We didn't have to learn Santali because Odia was spoken in school and in the greater professional marketplace.
Language dominance happens, and it's not that this isn't okay, it's that we need to make sure we are preserving the old languages as well so that we don't lose the stories and bits of culture that are inherent in that language. How can we do that? For the Santali language, we were not prepared so it took almost 15 years for the first Unicode-compliant (a global and universal encoding standard) font to be released for it by Google. Then, I led a project to build the second Unicode-compliant and Open Font License (OFL)-licensed font for Santali. (Designed by Indian typographer Pooja Saxena, and the input tools were developed by Jnanaranjan Sahoo and Nasim Ali.)
Languages die out for multiple reasons. Some are:
In a multicultural and multilingual society, official and/or major languages have the advantage of being funded by the government. They are used to educate in schools and for scientific research, for instance.
Minority languages are typically spoken by the indigenous natives or by those living in poverty.
There is a lack of digital tools to help societies and cultures continue and share their native, minority languages. As storytelling is done more and more online, the need for digital tools and other standards becomes more important.
How the open source way can save these languages:
We need a map of languages around the world with the associated challenges of preserving each language.
We need collaboration tools and technologies for working closely with endangered language communities.
We need Open Educational Resources for manuals and other materials to train people how to do language documentation.
We need documentation of open multimedia content about the present (e.g. news coverage of current incidents and other socio-economic happenings) and the past (folk literature and cultural phenomenon) with annotation to widen the scope of the languages.
We need digital tools to build linguistic applications (e.g. Machine Learning and Natural Language Processing tools like text-to-speech that can be used to amplify the multimedia content and help build digital accessibility tools like screenreader).
There is work being done, and more to do. Groundbreaking language preservation initiatives are happening now to preserve native languages in digital forms. Some of the notable ones are:
TVMalintzi, a YouTube-based television for Nahuatl
Research and journalism on the subject, like The future of America's endangered languages by Matt Hansen
Wikitongues that helps communities document video-narratives in native languages
Openwords, an open source language learning app
Digital Language Diversity Project (DLDP), for building OERs for language preservation
Treasure Language Storytelling and a group of other language preservation projects by linguist Dr. Steven Bird
StoryCorps for recording storytelling
Considering the rate of language extinction is so high, there is a need for constant intervention. I have personally started a project called OpenSpeaks to build OERs and help citizen archivists create multimedia language documentation. I hope to curate content for a broader audience and use that content to build digital accessibility and other tools that will help native language speakers access knowledge and contribute to the commons.
About the author
Subhashish Panigrahi - Subhashish Panigrahi (@subhapa) is the Asia Community Catalyzer at Mozilla's Participation team, and is transitioning from his role as Programme Officer of the Centre for Internet and Society's Access To Knowledge program Earlier with Wikimedia Foundation's India Program, he is an India based educator,
Dịch: Lê Trung Nghĩa
Ý kiến bạn đọc
Những tin mới hơn
Những tin cũ hơn
Blog này được chuyển đổi từ http://blog.yahoo.com/letrungnghia trên Yahoo Blog sang sử dụng NukeViet sau khi Yahoo Blog đóng cửa tại Việt Nam ngày 17/01/2013.Kể từ ngày 07/02/2013, thông tin trên Blog được cập nhật tiếp tục trở lại với sự hỗ trợ kỹ thuật và đặt chỗ hosting của nhóm phát triển...
Các bài trình chiếu trong năm 2024
Tập huấn thực hành ‘Khai thác tài nguyên giáo dục mở’ cho giáo viên phổ thông, bao gồm cả giáo viên tiểu học và mầm non tới hết năm 2024
Các lớp tập huấn thực hành ‘Khai thác tài nguyên giáo dục mở’ tới hết năm 2024
Các tài liệu dịch sang tiếng Việt tới hết năm 2024
‘Digcomp 2.2: Khung năng lực số cho công dân - với các ví dụ mới về kiến thức, kỹ năng và thái độ’, EC xuất bản năm 2022
Tổng hợp các bài của Nhóm các Nhà cấp vốn Nghiên cứu Mở (ORFG) đã được dịch sang tiếng Việt
Tổng hợp các bài của Liên minh S (cOAlition S) đã được dịch sang tiếng Việt
Năm Khoa học Mở & Chuyển đổi sang Khoa học Mở - Tổng hợp các bài liên quan
Hội nghị Đối tác Dữ liệu Mở châu Á năm 2021 do Việt Nam lần đầu tiên chủ trì
Các khung năng lực trong hành động
Phong trào Bình dân học vụ số: Mục tiêu, đối tượng, nội dung, nguồn lực, phương thức tổ chức thực hiện
Lễ công bố công khai Trung tâm Năng lực Kim cương châu Âu và dự án ALMASI
Khung năng lực AI cho giáo viên
Sư phạm Mở là gì (Trang của Đại học British Columbia, Canada)
Ngày Phần mềm Tự do, Ngày Phần cứng tự do, Ngày Tài liệu Tự do
‘Khung năng lực AI cho giáo viên’ - bản dịch sang tiếng Việt
Bạn cần biết những gì về các khung năng lực AI mới của UNESCO cho học sinh và giáo viên
Bàn về 'Lợi thế của doanh nghiệp Việt là dữ liệu Việt, bài toán Việt' - bài phát biểu của Bộ trưởng Nguyễn Mạnh Hùng ngày 21/08/2025
Các bài trình chiếu trong năm 2024
Triển khai Khuyến nghị Khoa học Mở của UNESCO, cập nhật 15/10/2024
Các tài liệu dịch sang tiếng Việt tới hết năm 2024
‘Tài liệu quan điểm của KR21 về Giữ lại Quyền Tác giả: Giữ lại các quyền trong kết quả đầu ra nghiên cứu để cho phép phổ biến mở kiến thức’ - bản dịch sang tiếng Việt
‘KHUYẾN NGHỊ VÀ HƯỚNG DẪN TRUY CẬP MỞ KIM CƯƠNG cho các cơ sở, nhà cấp vốn, nhà bảo trợ, nhà tài trợ, và nhà hoạch định chính sách’ - bản dịch sang tiếng Việt
Tập huấn thực hành ‘Khai thác tài nguyên giáo dục mở’ cho giáo viên phổ thông, bao gồm cả giáo viên tiểu học và mầm non tới hết năm 2024
DeepSeek đã gây ra sự hoảng loạn trên thị trường — nhưng một số người cho rằng việc bán tháo là quá mức
Dữ liệu để phân loại AI
“Chúng tôi không có hào nước”: Sự đổi mới đột phá của AI nguồn mở
Ứng dụng và phát triển Tài nguyên Giáo dục Mở (OER) tại Việt Nam
Nhà khoa học AI hàng đầu của Meta cho biết thành công của DeepSeek cho thấy 'các mô hình nguồn mở đang vượt trội hơn các mô hình độc quyền'
‘Tầm quan trọng của các kỹ năng tư duy phản biện và linh hoạt về năng lực AI của sinh viên TVET’ - bản dịch sang tiếng Việt