AI tạo sinh ảnh hưởng đến Tài nguyên Giáo dục Mở như thế nào

Thứ sáu - 20/06/2025 06:07
AI tạo sinh ảnh hưởng đến Tài nguyên Giáo dục Mở như thế nào

How Generative AI Affects Open Educational Resources

September 4, 2024 by opencontent

Theo: https://opencontent.org/blog/archives/7568

Bài được đưa lên Internet ngày: 04/09/2024

Đây là phần giữa của bài thuyết trình ngày 19 tháng 9 năm 2024 của tôi, Tại sao Giáo dục Mở sẽ Trở thành Giáo dục AI Tạo sinh. Tôi đang đăng trước một số nội dung bài thuyết trình do cuộc trò chuyện rất sôi nổi mà thông báo về bài thuyết trình đã tạo ra. Tuần tới, tôi hy vọng sẽ đăng phần đầu tiên của bài thuyết trình, trong đó nêu ra lý do tại sao những người quan tâm sâu sắc đến khả năng chi trả, khả năng tiếp cận và cải thiện kết quả nên cân nhắc chuyển trọng tâm của họ khỏi OER (như chúng ta đã hiểu trong hơn 25 năm qua) và hướng tới AI tạo sinh. Hoặc, sử dụng ngôn ngữ mà tôi giới thiệu bên dưới, từ "OER truyền thống" sang "OER tạo sinh".

Giống như Internet trước đây, AI tạo sinh đang biến đổi mạnh mẽ nhiều khía cạnh của xã hội. AI tạo sinh đã có tác động sâu sắc đến cách thức OER được biên soạn, sửa đổi và phối lại. Và có thể có những tác động mạnh mẽ hơn đáng kể nếu chúng ta tiếp cận chúng.

OER truyền thống

Chúng ta đều quen thuộc với những gì tôi gọi là "OER truyền thống". OER truyền thống bao gồm sách giáo khoa, chương, giáo trình, đánh giá, hình ảnh, video, mô phỏng, tương tác, v.v. được cấp phép mở. Trong suốt bài thuyết trình này, khi tôi nói "OER", tôi đang sử dụng thuật ngữ theo định nghĩa của Creative Commons, The William and Flora Hewlett Foundation và nhiều tổ chức khác. Định nghĩa đó là:

Tài nguyên giáo dục mở (OER) là tài liệu giảng dạy, học tập và nghiên cứu nằm trong phạm vi công cộng hoặc đã được phát hành theo giấy phép mở cho phép người khác sử dụng và tái sử dụng miễn phí”.

AI tạo sinh ảnh hưởng sâu sắc đến cách thức OER truyền thống được (1) biên soạn và (2) sửa đổi và phối lại.

Biên soạn OER truyền thống

Trước khi ChatGPT được phát hành, OER truyền thống hoàn toàn được “làm thủ công”, nghĩa là không sử dụng AI tạo sinh nào trong quá trình tạo ra chúng. Kể từ khi ChatGPT được phát hành, nhiều OER truyền thống đã được “AI soạn thảo”, nghĩa là mọi người đã sử dụng AI tạo sinh để tạo ra bản thảo đầu tiên của OER. (Và sau đó, hy vọng là sẽ đưa các bản thảo này vào quá trình xem xét và chỉnh sửa nghiêm ngặt khi cần thiết.)

Trong phương pháp thủ công để biên soạn OER, việc tạo bản thảo đầu tiên có thể mất nhiều ngày, nhiều tuần, nhiều tháng hoặc thậm chí nhiều năm tùy thuộc vào phạm vi và tham vọng của dự án. Trong phương pháp biên soạn OER do AI soạn thảo, việc tạo bản thảo đầu tiên có thể mất vài phút, vài giờ, nhiều ngày hoặc nhiều tuần tùy thuộc vào phạm vi và tham vọng của dự án. AI tạo ra giúp giảm thời gian và công sức cần thiết để tạo ra bản thảo đầu tiên ít nhất là một cấp độ (chia thời gian biên soạn trước đó cho 10) và đôi khi thậm chí là hai cấp độ (chia thời gian biên soạn trước đó cho 100) đối với các nhiệm vụ lặp đi lặp lại, chẳng hạn như biên soạn một ngân hàng lớn các mục đánh giá. Các quy trình đảm bảo chất lượng như đánh giá ngang hàng và biên tập kỹ thuật vẫn cực kỳ quan trọng, nhưng quá trình hoàn thành bản thảo đầu tiên thường chiếm phần lớn thời gian dành cho việc biên soạn OER.

Vì thời gian luôn là một trong những rào cản lớn nhất đối với việc tạo ra OER, nên không khó để tưởng tượng ra một tương lai mà phần lớn các OER mới đều được AI soạn thảo thay vì hoàn toàn được biên soạn thủ công. Và có vẻ như hoạt động từ thiện, vốn tìm cách tối đa hóa số lượng điều tốt đẹp mà nó có thể làm được trên thế giới trên mỗi đô la chi tiêu, sẽ khuyến khích mạnh mẽ (nếu không muốn nói là yêu cầu) những người nhận tài trợ áp dụng phương pháp do AI soạn thảo để tạo ra OER mới trong tương lai.

Sửa đổi và phối lại OER truyền thống

Nhưng tác động của phương pháp do AI soạn thảo đối với việc sửa đổi và phối lại OER có lẽ còn có tác động lớn hơn tác động đối với việc biên soạn. Mặc dù giấy phép mở khiến việc sửa đổi và phối lại OER trở nên hợp pháp, nhưng quyền đó không kỳ diệu cấp cho giáo viên, người học hoặc những người dùng khác thời gian và chuyên môn cần thiết để thực sự sửa đổi và phối lại.

Ví dụ, việc tạo ra một phiên bản đơn giản hóa của một văn bản hiện có cho người học tiếng Anh như ngôn ngữ thứ hai là một ví dụ phổ biến về việc sửa đổi OER. Khi thực hiện thủ công, việc hoàn thành bản thảo đầu tiên có thể mất hàng giờ. Khi thực hiện bằng AI tạo sinh, việc hoàn thành bản thảo đầu tiên chỉ mất vài phút. Và nghiên cứu đã chứng minh rằng mức độ tham gia của giảng viên vào các hành vi sửa đổi và phối lại có mối tương quan trực tiếp với lượng thời gian và công sức cần thiết để hoàn thành các nhiệm vụ sửa đổi hoặc phối lại (xem Hilton và cộng sự, 2012). Nếu lượng thời gian và công sức cần thiết để sửa đổi và phối lại có mối tương quan nghịch với mức độ tham gia vào các hoạt động sửa đổi và phối lại, và các phương pháp do AI soạn thảo làm giảm đáng kể lượng thời gian và công sức cần thiết để sửa đổi và phối lại OER, thì chúng ta sẽ thấy sự gia tăng đáng kể trong việc sửa đổi và phối lại OER trong tương lai.

Và việc thiếu thời gian không phải là trở ngại duy nhất đối với việc sửa đổi và phối lại OER. Hầu hết giáo viên, người học và những người dùng khác không có chuyên môn hoặc chuyên môn rất hạn chế về các kỹ năng cần thiết để thực hiện các hình thức hiệu đính và phối lại theo yêu cầu, như dịch OER từ ngôn ngữ này sang ngôn ngữ khác. Nghiên cứu cho thấy mức tăng năng suất của AI tạo sinh cao nhất ở những người lao động có kỹ năng thấp (Brynjolfsson, 2023; Dell’Acqua, 2023). Áp dụng phát hiện này vào ví dụ của chúng tôi về việc dịch một văn bản sang ngôn ngữ khác, AI tạo sinh sẽ hữu ích hơn nhiều đối với một người không nói một trong hai ngôn ngữ liên quan so với một người nói cả hai ngôn ngữ. Do đó, các phương pháp do AI soạn thảo sẽ mở khóa các hoạt động hiệu đính và phối lại vốn trước đây là không thể hoặc không thực tế. Điều này sẽ vừa làm tăng các loại hiệu đính và phối lại diễn ra trong tương lai, vừa cải thiện chất lượng của nó.

Nhờ AI tạo sinh, cuối cùng chúng ta có thể bước vào thời kỳ hoàng kim được mong đợi từ lâu của việc sửa đổi và phối lại.

OER tạo sinh

AI tạo sinh giúp tạo ra một loại OER mới mà tôi sẽ gọi là "OER tạo sinh". Đây là OER có mục đích không phải để người học nghiên cứu trực tiếp hoặc giáo viên sử dụng trực tiếp (như OER truyền thống). OER tạo sinh là OER có mục đích giúp người học, giáo viên và những người dùng khác tạo ra OER khác. OER tạo sinh bao gồm các lời nhắc được cấp phép mở và trọng số mô hình được cấp phép mở.

Lời nhắc mở

Nhiều lời nhắc do người dùng AI tạo sinh lần đầu viết tương đối đơn giản. Chúng có thể bao gồm một cụm từ ngắn hoặc một vài câu. Những lời nhắc cơ bản này không đủ điều kiện để được bảo vệ bản quyền.

Tuy nhiên, các lời nhắc gợi ra hành vi phức tạp hơn từ mô hình AI tạo ra có thể dài hàng trăm hoặc hàng nghìn từ. Những lời nhắc sáng tạo hơn này có khả năng phải tuân theo cùng một bản quyền tự động như các tác phẩm sáng tạo khác. Điều này có nghĩa là để giáo viên, người học và những người dùng khác có thể tham gia vào các hoạt động 5R với những lời nhắc mạnh mẽ hơn nhiều về mặt sư phạm này, thì những lời nhắc đó sẽ phải được cấp phép mở.

Người dùng cần có khả năng sửa đổi và phối lại các lời nhắc vì hai lý do. Thứ nhất, phong trào giáo dục mở đã nhận ra trong nhiều thập kỷ rằng việc người dùng có thể bản địa hóa OER để phù hợp với ngôn ngữ, văn hóa và hoàn cảnh địa phương của họ là quan trọng như thế nào. Về mặt này, lời nhắc cũng không khác gì. Người dùng phải có khả năng sửa đổi và phối lại các lời nhắc để kết quả của họ hữu ích và phù hợp với ngôn ngữ, văn hóa và hoàn cảnh cụ thể của người dùng.

Thứ hai, người dùng cần có khả năng bản địa hóa các lời nhắc để chúng có thể "hoạt động" trong bối cảnh của các mô hình AI tạo ra khác nhau. Các mô hình khác nhau phản hồi khác nhau với cùng một lời nhắc, và một lời nhắc tinh vi được tối ưu hóa cho Claude 3.5 Sonnet có thể cần phải được điều chỉnh để thực hiện tương tự với Llama 3.1 405B. Và trong khi hành vi của các mô hình khác nhau có thể chỉ khác một chút, thì hành vi của chúng lại khác đáng kể so với các mô hình lượng tử đã được điều chỉnh để chạy trên phần cứng cục bộ như máy tính xách tay không có kết nối internet. Các mô hình có thể chạy cục bộ này sẽ là một trong những chìa khóa để phân phối lợi ích của AI tạo sinh cho mọi người trên toàn cầu và người dùng phải có khả năng điều chỉnh các lời nhắc phức tạp được thiết kế cho các mô hình khác nhau để hoạt động với các mô hình ngoại tuyến này.

Việc sửa đổi và phối lại các lời nhắc hiện có để tối ưu hóa hiệu suất của chúng trong bối cảnh người dùng mới và bối cảnh mô hình mới là một hình thức kỹ thuật nhắc. Vì nhiều lời nhắc sẽ được giữ bản quyền theo mặc định, nên sự cho phép hợp pháp để sửa đổi và phối lại chúng (để tham gia vào kỹ thuật nhắc cần thiết) sẽ rất quan trọng để đảm bảo tác động và lợi ích rộng rãi của AI tạo sinh cho mọi người.

Trọng số mở (Open Weights)

Có nhiều nỗ lực đang được tiến hành để xác định những gì cấu thành nên một mô hình AI tạo sinh "mở" (White, et al., 2024; OSI, 2024). Thay vì cố gắng đóng góp vào cuộc trò chuyện đó, ở đây tôi áp dụng định nghĩa mẫu số chung thấp nhất chỉ tập trung vào trọng số mô hình. "Trọng số mở" là trọng số mô hình AI tạo ra được cấp phép theo cách cấp cho người dùng quyền tham gia vào các hoạt động 5R.

Trong khi các mô hình nền tảng như GPT-4o, Claude, Gemini và Llama có khả năng kiến thức chung thực sự ấn tượng, thì các giai đoạn tinh chỉnh của chúng thường được thiết kế để giúp chúng tuân theo các hướng dẫn một cách chính xác (ví dụ: tính khả dụng của các phiên bản "cơ sở" và "hướng dẫn" của các mô hình trên HuggingFace). Các mô hình nền tảng không được thiết kế để có kiến thức sư phạm hoặc hoạt động theo phương pháp sư phạm. Chúng cũng có thể thiếu kiến thức chuyên môn cần thiết cho người học, giáo viên và những người dùng khác trong một số lĩnh vực. Ngay từ đầu, các mô hình này không được tối ưu hóa để hỗ trợ việc dạy và học. Do đó, nếu AI tạo sinh muốn đạt được tiềm năng hỗ trợ việc dạy và học, người dùng phải có khả năng sửa đổi và phối lại trực tiếp các trọng số của mô hình.

Các thực hành cụ thể được thể hiện bởi một số trong 5R thay đổi trong bối cảnh của các trọng số mô hình. Trong bối cảnh của các trọng số mở, "sửa đổi" có thể đề cập đến các kỹ thuật như tinh chỉnh, trong đó các trọng số của mô hình được cập nhật thông qua đào tạo bổ sung trên các tập dữ liệu được quản lý. Tinh chỉnh cho phép thực hiện các điều chỉnh có mục tiêu đối với hành vi của mô hình, cho phép mô hình thực hiện các tác vụ chuyên biệt. Ví dụ, mô hình trọng số mở có thể được tinh chỉnh trên một tập dữ liệu lớn về các tương tác giữa người học và gia sư chuyên gia, để mô hình hoạt động giống như một gia sư chuyên gia hơn.

Trong bối cảnh của trọng số mở, "phối lại" có thể liên quan đến các kỹ thuật như hợp nhất mô hình hoặc chưng cất mô hình. Trong chưng cất mô hình, một mô hình "học sinh" nhỏ hơn được đào tạo bằng cách sử dụng đầu ra của một mô hình "giáo viên" lớn hơn. Quá trình này về cơ bản nén kiến thức và khả năng của mô hình lớn hơn vào mô hình nhỏ hơn. Một trong những ví dụ nổi tiếng nhất ở đây là DistilBERT, được tạo ra bởi HuggingFace. Nhóm HuggingFace đã chưng cất mô hình BERT của Google (mô hình "giáo viên") thành DistilBERT (mô hình "học sinh"), giảm kích thước của nó xuống 40% trong khi vẫn giữ nguyên 97% khả năng hiểu ngôn ngữ và làm cho nó nhanh hơn 60%. Mô hình DistilBERT nhỏ hơn có thể chạy trên thiết bị cục bộ mà không cần truy cập internet. (Một lần nữa, khả năng chạy các mô hình AI tạo ra cục bộ là rất quan trọng vì một số lý do, bao gồm thúc đẩy khả năng truy cập ở những khu vực có kết nối thấp, bảo vệ quyền riêng tư của người dùng và phân cấp và giảm mức tiêu thụ năng lượng.)

Lời cảm ơn

Tôi muốn thừa nhận rằng chắc chắn phải có một bước nhảy vọt về mặt kỹ thuật để một người có thể chuyển từ việc chỉnh sửa một đoạn văn trong trang Pressbooks sang việc tinh chỉnh một mô hình trọng số mở. Điều đó khiến tôi nhớ lại thời điểm Javascript lần đầu tiên được giới thiệu vào hệ sinh thái web (vâng, tôi già như vậy đấy)…

Ngày xửa ngày xưa, chỉ có HTML. Ngôn ngữ đánh dấu của nó khá dễ học và rất nhiều người đã viết HTML. Sau đó là Javascript. Nó không phải là ngôn ngữ đánh dấu – mà là ngôn ngữ lập trình. Và việc viết mã bằng Javascript đòi hỏi nhiều chuyên môn kỹ thuật hơn đáng kể so với việc viết HTML. Nhưng rắc rối là xứng đáng – HTML và Javascript kết hợp theo cách hiệp lực để làm cho web tương tác hơn, hữu ích hơn và mạnh mẽ hơn.

Phải thừa nhận rằng, sẽ cần nhiều chuyên môn kỹ thuật hơn để sửa đổi và phối lại OER tạo ra như các mô hình trọng số mở so với việc sửa đổi và phối lại OER truyền thống trong quá khứ. Nhưng điều đó sẽ đáng công sức - OER truyền thống và OER tạo sinh sẽ kết hợp để tạo ra những trải nghiệm học tập tương tác hơn, hữu ích hơn và mạnh mẽ hơn.

Suy nghĩ kết luận

Để tận dụng đầy đủ hơn tiềm năng của AI tạo sinh nhằm giúp cơ hội giáo dục dễ tiếp cận hơn và hiệu quả hơn cho người học ở mọi nơi, chúng ta cần áp dụng những bài học kinh nghiệm trong hơn 25 năm làm việc với OER. Và bài học đầu tiên là: cấp phép mở - cấp cho mọi người quyền sử dụng khả năng tự quyết, sự nhiệt tình và khả năng sáng tạo của họ để tham gia vào các hoạt động 5R - sẽ giải phóng tiềm năng của con người. Và vì vậy, chúng ta phải vượt ra ngoài suy nghĩ hạn hẹp về cách AI tạo sinh tác động đến công việc của chúng ta với OER truyền thống và bắt đầu suy nghĩ rộng hơn về sức mạnh của "OER tạo sinh", trong đó chúng ta coi bản thân AI tạo sinh là một OER. Khi chúng ta sử dụng các gợi ý và trọng số mở để phục vụ cho việc học, chúng ta sẽ mở ra những viễn cảnh hoàn toàn mới về khả năng giảng dạy và học tập - cả chính quy và không chính quy.

Chủng loại artificial intelligence, open content, open education, open source, student success

This is the middle section of my September 19, 2024 presentation, Why Open Education Will Become Generative AI Education. I’m pre-posting some of the presentation content due to the very active conversation the announcement of the presentation has created. Next week I hope to post the first section of the presentation, which outlines the reasons why people who care deeply about affordability, access, and improving outcomes should consider shifting their focus away from OER (as we have understood it for the last 25+ years) and toward generative AI. Or, using the language I introduce below, from “traditional OER” to “generative OER.”

Like the internet before it, generative AI is radically transforming many aspects of society. Generative AI is already having a profound effect on the ways OER are authored, revised, and remixed. And significantly more dramatic impacts are possible if we will reach for them.

Traditional OER

We’re all familiar with what I’ll call “traditional OER”. Traditional OER include openly licensed textbooks, chapters, syllabi, assessments, images, videos, simulations, interactives, etc. Throughout this presentation, when I say “OER” I’m using the term as defined by Creative Commons, The William and Flora Hewlett Foundation, and many others. That definition is:

“Open Educational Resources (OER) are teaching, learning, and research materials that reside in the public domain or have been released under an open license that permits their free use and re-purposing by others.”

Generative AI profoundly affects the ways that traditional OER are (1) authored and (2) revised and remixed.

Authoring Traditional OER

Prior to the release of ChatGPT, traditional OER were entirely “hand-crafted,” meaning no generative AI was used in their creation. Since the release of ChatGPT, many traditional OER have been “AI-drafted,” meaning people have used generative AI to create the first drafts of their OER. (And then, hopefully, subjected these drafts to rigorous review and correction as necessary.)

In the hand-crafted approach to OER authoring, creating a first draft can take days, weeks, months, or even years depending on the scope and ambition of the project. In the AI-drafted approach to OER authoring, creating a first draft can take minutes, hours, days, or weeks depending on the scope and ambition of the project. Generative AI reduces the time and effort required to get to a first draft by at least an order of magnitude (divide the previous amount of authoring time by 10) and sometimes even two orders of magnitude (divide the previous amount of authoring time by 100) for repetitive tasks, like drafting a large bank of assessment items. Quality assurance processes like peer review and technical editing are still critically important, but the process of getting to a complete first draft often accounts for the majority of the time spent authoring OER.

Because time has always been one of the biggest barriers to the creation of OER, it isn’t hard to imagine a future in which the overwhelming majority of new OER are AI-drafted instead of entirely hand-crafted. And it seems likely that philanthropy, which seeks to maximize the amount of good it can do in the world per dollar spent, will strongly encourage (if not require) grantees to take an AI-drafted approach to creating new OER in the future.

Revising and Remixing Traditional OER

But the effects of the AI-drafted approach on revising and remixing OER are perhaps even more impactful than the effects on authoring. While open licenses make it legal to revise and remix OER, that permission doesn’t magically grant teachers, learners, or other users the time and expertise necessary to actually do the revising and remixing.

For example, creating a simplified version of an existing text for English as a second language learners is a common example of revising OER. When done manually, getting to the first draft can be an hours-long task. When done using generative AI, getting to the first draft is a minutes-long task. And research has demonstrated that instructors’ levels of engagement in revise and remix behaviors are directly correlated with the amount of time and effort necessary to complete revise or remix tasks (see Hilton et al., 2012). If the amount of time and effort necessary to revise and remix are inversely correlated with engagement in revise and remix activities, and AI-drafted approaches dramatically reduce the amount of time and effort necessary to revise and remix OER, then we should see a significant increase in the revising and remixing of OER in the future.

And a lack of time isn’t the only obstacle to revising and remixing OER. Most teachers, learners, and other users have either no expertise or very limited expertise in the skills necessary to perform in-demand forms of revise and remix, like translating an OER from one language into another. Research shows that the productivity gains of generative AI are highest among lower-skilled workers (Brynjolfsson, 2023; Dell’Acqua, 2023). Applying this finding to our example of translating a text into another language, generative AI will be a lot more helpful to a person who doesn’t speak one of the languages involved than it will be to a person who speaks both languages. Consequently, AI-drafted approaches unlock revise and remix activities that were previously impossible or impractical. This should both increase the kinds of revising and remixing happening in the future, as well as improve its quality.

Thanks to generative AI, we may finally be entering the long-awaired golden age of revise and remix.

Generative OER

Generative AI makes possible a new kind of OER that I’ll call “generative OER”. These are OER whose purpose is not to be studied directly by learners or used directly by teachers (like traditional OER are). Generative OER are OER whose purpose is to help learners, teachers, and other users create other OER. Generative OER include openly licensed prompts and openly licensed model weights.

Open Prompts

Many of the prompts written by first-time users of generative AI are relatively simple. They might be comprised of a short phrase or a few sentences. These basic prompts are unlikely to be eligible for copyright protection.

However, prompts eliciting more sophisticated behavior from a generative AI model can be hundreds or thousands of words long. These more creative prompts are likely subject to the same automatic copyrighting as other creative works. This means that for teachers, learners, and other users to be able to engage in the 5R activities with these far more pedagogically powerful prompts, the prompts will have to be openly licensed.

Users need to be able to revise and remix prompts for two reasons. First, the open education movement has recognized for decades how important it is for users to be able to localize OER to fit their local language, culture, and circumstances. Prompts are no different in this regard. Users must be able to revise and remix prompts so their results are helpful and appropriate in a specific user’s language, culture, and circumstances.

Second, users need to be able to localize prompts so they will “work” in the context of different generative AI models. Different models respond differently to the same prompts, and a sophisticated prompt optimized for Claude 3.5 Sonnet will likely need to be adapted to perform similarly with Llama 3.1 405B. And while the behaviors of frontier models may differ only slightly, their behaviors vary significantly from quantized models that have been adapted to run on local hardware like a laptop without an internet connection. These locally runnable models will be one of the keys to distributing the benefits of generative AI to people around the globe, and users must be able to adapt complex prompts designed for frontier models  to work with these offline models.

Revising and remixing existing prompts in order to optimize their performance in new user contexts and new model contexts is a form of prompt engineering. Inasmuch as many prompts will be copyrighted by default, legal permission to revise and remix them (to engage in the necessary prompt engineering) will be critical to ensuring the widespread impact and benefit of generative AI for everyone.

Open Weights

There are multiple efforts underway to define what constitutes an “open” generative AI model (White, et al., 2024; OSI, 2024). Rather than trying to contribute to that conversation, here I adopt a lowest common denominator definition focused only on model weights. “Open weights” are generative AI model weights that are licensed in a manner granting users permission to engage in the 5R activities.

While foundation models like GPT-4o, Claude, Gemini, and Llama have truly impressive general knowledge capabilities, their fine-tuning stages are generally designed to help them follow instructions accurately (c.f., the availability of “base” and “instruct” versions of models on HuggingFace). Foundation models are not designed to have pedagogical knowledge or to behave pedagogically. They may also lack the specialized knowledge needed by learners, teachers, and other users in some domains. Out of the box, these models are not optimized to support teaching and learning. Consequently, if generative AI is to meet its potential for supporting teaching and learning, users must be able to revise and remix the model weights directly.

The specific practices represented by some of the 5Rs change in the context of model weights. In the context of open weights, “revise” might refer to techniques like fine-tuning, where a model’s weights are updated through additional training on curated datasets. Fine-tuning allows targeted adjustments to be made to a model’s behavior, enabling it to perform specialized tasks. For example, an open weights model might be fine-tuned on a large dataset of interactions between learners and expert tutors, in order to make the model behave more like an expert tutor.

In the context of open weights, “remix” might involve techniques like model merging or model distillation. In model distillation a smaller “student” model is trained using the output of a larger “teacher” model. This process essentially compresses the larger model’s knowledge and capabilities into the smaller model. One of the best known examples here is DistilBERT, created by HuggingFace. The HuggingFace team distilled Google’s BERT model (the “teacher” model) into DistilBERT (the “student” model), reducing its size by 40% while retaining 97% of its language understanding capabilities and making it 60% faster. The smaller DistilBERT model can be run on a local device without access to the internet. (Again, the ability to run generative AI models locally is critical for a number of reasons, including promoting access in low-connectivity areas, protecting user privacy, and decentralizing and reducing energy consumption.)

An Acknowledgement

I want to acknowledge that there is definitely a technical leap that must be made for a person to go from editing a paragraph in a Pressbooks page to that same person fine-tuning an open weights model. It reminds me of when Javascript was first introduced into the web ecosystem (yes, I’m that old)…

Once upon a time, there was only HTML. Its markup language was pretty straightforward to learn and lots of people wrote HTML. Then came Javascript. It wasn’t a markup language – it was a programming language. And coding in Javascript required significantly more technical expertise than writing HTML did. But the trouble was worth it – HTML and Javascript combined in a synergistic way to make the web more interactive, more useful, and more powerful.

Admittedly, it will take more technical expertise to revise and remix generative OER like open weights models than it has taken to revise and remix traditional OER in the past. But it will be worth the trouble – traditional OER and generative OER will combine to create more interactive, more useful, and more powerful learning experiences.

Concluding Thoughts

In order to more fully leverage the potential of generative AI to make educational opportunity more accessible and more effective for learners everywhere, we need to apply the lessons learned over our 25+ years of work with OER. And the first lesson is this: open licensing – giving people permission to use their agency, enthusiasm, and creativity to engage in the 5R activities – unlocks human potential. And so we have to move beyond narrow thinking about how generative AI impacts our work with traditional OER and begin thinking more broadly about the power “generative OER,” in which we treat generative AI itself as an OER. As we engage with open prompts and open weights in the service of learning, we will open entirely new vistas of possibilities for teaching and learning – both formal and informal.

Categories artificial intelligence, open content, open education, open source, student success

Dịch: Lê Trung Nghĩa

letrungnghia.foss@gmail.com

Tác giả: Nghĩa Lê Trung

Tổng số điểm của bài viết là: 0 trong 0 đánh giá

Click để đánh giá bài viết

  Ý kiến bạn đọc

Về Blog này

Blog này được chuyển đổi từ http://blog.yahoo.com/letrungnghia trên Yahoo Blog sang sử dụng NukeViet sau khi Yahoo Blog đóng cửa tại Việt Nam ngày 17/01/2013.Kể từ ngày 07/02/2013, thông tin trên Blog được cập nhật tiếp tục trở lại với sự hỗ trợ kỹ thuật và đặt chỗ hosting của nhóm phát triển...

Bài đọc nhiều nhất trong năm
Thăm dò ý kiến

Bạn quan tâm gì nhất ở mã nguồn mở?

Thống kê truy cập
  • Đang truy cập97
  • Máy chủ tìm kiếm10
  • Khách viếng thăm87
  • Hôm nay8,981
  • Tháng hiện tại349,056
  • Tổng lượt truy cập42,344,953
Bạn đã không sử dụng Site, Bấm vào đây để duy trì trạng thái đăng nhập. Thời gian chờ: 60 giây