Top 10 open source LLMs for 2025. 8. BLOOM
Theo: https://www.instaclustr.com/education/open-source-ai/top-10-open-source-llms-for-2025/
Mô hình Ngôn ngữ Lớn - LLM (Large Language Model) là mô hình máy học có thể hiểu được và tạo ra ngôn ngữ con người dựa vào các tập dữ liệu phạm vi rộng.
8. BLOOM

BLOOM, được phát triển thông qua sự hợp tác rộng rãi của các nhà nghiên cứu AI, hướng đến mục tiêu dân chủ hóa việc tiếp cận các chương trình Thạc sĩ Luật (LLM), giúp giới học thuật, tổ chức phi lợi nhuận và các phòng thí nghiệm nghiên cứu nhỏ hơn có thể tạo, nghiên cứu và sử dụng các mô hình này. Đây là mô hình đầu tiên có quy mô tương tự cho nhiều ngôn ngữ, bao gồm tiếng Tây Ban Nha, tiếng Pháp và tiếng Ả Rập.
Thông tin dự án:
Giấy phép: Giấy phép BigScience RAIL
Sao trên GitHub: 129.000
Người đóng góp: Margaret Mitchell và cộng sự
Nhà tài trợ chính: HuggingFace, BigScience
Liên kết kho lưu trữ chính thức: Nhấp vào đây
Tính năng:
Khả năng đa ngôn ngữ: Hỗ trợ 46 ngôn ngữ tự nhiên và 13 ngôn ngữ lập trình.
Kích thước tham số: Bao gồm 176 tỷ tham số.
Khả năng truy cập: Được cung cấp theo Giấy phép AI có trách nhiệm, cho phép các cá nhân và tổ chức sử dụng và xây dựng dựa trên mô hình. Nó có thể dễ dàng được tích hợp vào các ứng dụng thông qua hệ sinh thái Hugging Face bằng cách sử dụng bộ chuyển đổi và bộ tăng tốc.
API suy luận: Một API suy luận đang được hoàn thiện để cho phép sử dụng trên quy mô lớn mà không cần phần cứng chuyên dụng.
Về mục lục ………. Phần trước ………. Phần tiếp theo
BLOOM, developed through a large collaboration of AI researchers, aims to democratize access to LLMs, making it possible for academia, nonprofits, and smaller research labs to create, study, and use these models. It is the first model of its size for many languages, including Spanish, French, and Arabic.
Project information:
License: BigScience RAIL license
GitHub stars: 129K
Contributors: Margaret Mitchell et. al.
Main corporate sponsor: HuggingFace, BigScience
Official repo link: Click here
Features:
Multilingual capabilities: Supports 46 natural languages and 13 programming languages.
Parameter size: Includes 176 billion parameters.
Accessibility: Available under the Responsible AI License, allowing individuals and institutions to use and build upon the model. It can be easily integrated into applications via the Hugging Face ecosystem using transformers and accelerators.
Inference API: An inference API is being finalized to enable large-scale use without dedicated hardware.
Dịch: Lê Trung Nghĩa
letrungnghia.foss@gmail.com
Tác giả: Nghĩa Lê Trung
Ý kiến bạn đọc
Những tin mới hơn
Những tin cũ hơn
Blog này được chuyển đổi từ http://blog.yahoo.com/letrungnghia trên Yahoo Blog sang sử dụng NukeViet sau khi Yahoo Blog đóng cửa tại Việt Nam ngày 17/01/2013.Kể từ ngày 07/02/2013, thông tin trên Blog được cập nhật tiếp tục trở lại với sự hỗ trợ kỹ thuật và đặt chỗ hosting của nhóm phát triển...
Các bài trình chiếu trong năm 2024
Tập huấn thực hành ‘Khai thác tài nguyên giáo dục mở’ cho giáo viên phổ thông, bao gồm cả giáo viên tiểu học và mầm non tới hết năm 2024
Các lớp tập huấn thực hành ‘Khai thác tài nguyên giáo dục mở’ tới hết năm 2024
Các tài liệu dịch sang tiếng Việt tới hết năm 2024
‘Digcomp 2.2: Khung năng lực số cho công dân - với các ví dụ mới về kiến thức, kỹ năng và thái độ’, EC xuất bản năm 2022
Tổng hợp các bài của Nhóm các Nhà cấp vốn Nghiên cứu Mở (ORFG) đã được dịch sang tiếng Việt
Tổng hợp các bài của Liên minh S (cOAlition S) đã được dịch sang tiếng Việt
Năm Khoa học Mở & Chuyển đổi sang Khoa học Mở - Tổng hợp các bài liên quan
Hội nghị Đối tác Dữ liệu Mở châu Á năm 2021 do Việt Nam lần đầu tiên chủ trì
Các khung năng lực trong hành động
Phong trào Bình dân học vụ số: Mục tiêu, đối tượng, nội dung, nguồn lực, phương thức tổ chức thực hiện
Lễ công bố công khai Trung tâm Năng lực Kim cương châu Âu và dự án ALMASI
Khung năng lực AI cho giáo viên
Ngày Phần mềm Tự do, Ngày Phần cứng tự do, Ngày Tài liệu Tự do
‘Khung năng lực AI cho giáo viên’ - bản dịch sang tiếng Việt
Bạn cần biết những gì về các khung năng lực AI mới của UNESCO cho học sinh và giáo viên
Bàn về 'Lợi thế của doanh nghiệp Việt là dữ liệu Việt, bài toán Việt' - bài phát biểu của Bộ trưởng Nguyễn Mạnh Hùng ngày 21/08/2025
Các tài liệu dịch sang tiếng Việt tới hết năm 2024
Các bài trình chiếu trong năm 2024
‘Tài liệu quan điểm của KR21 về Giữ lại Quyền Tác giả: Giữ lại các quyền trong kết quả đầu ra nghiên cứu để cho phép phổ biến mở kiến thức’ - bản dịch sang tiếng Việt
‘KHUYẾN NGHỊ VÀ HƯỚNG DẪN TRUY CẬP MỞ KIM CƯƠNG cho các cơ sở, nhà cấp vốn, nhà bảo trợ, nhà tài trợ, và nhà hoạch định chính sách’ - bản dịch sang tiếng Việt
DeepSeek đã gây ra sự hoảng loạn trên thị trường — nhưng một số người cho rằng việc bán tháo là quá mức
“Chúng tôi không có hào nước”: Sự đổi mới đột phá của AI nguồn mở
Tập huấn thực hành ‘Khai thác tài nguyên giáo dục mở’ cho giáo viên phổ thông, bao gồm cả giáo viên tiểu học và mầm non tới hết năm 2024
Ứng dụng và phát triển Tài nguyên Giáo dục Mở (OER) tại Việt Nam
Dữ liệu để phân loại AI
Nhà khoa học AI hàng đầu của Meta cho biết thành công của DeepSeek cho thấy 'các mô hình nguồn mở đang vượt trội hơn các mô hình độc quyền'
50 công cụ AI tốt nhất cho năm 2025 (Đã thử và kiểm nghiệm)
Mark Zuckerberg: DeepSeek cho thấy vì sao nước Mỹ phải là ‘tiêu chuẩn nguồn mở toàn cầu’ của AI; không có lý do gì để suy nghĩ lại về việc chi tiêu
‘Tầm quan trọng của các kỹ năng tư duy phản biện và linh hoạt về năng lực AI của sinh viên TVET’ - bản dịch sang tiếng Việt