Do We Need a National Open Education Strategy?
February 5, 2024 by opencontent
Theo: https://opencontent.org/blog/archives/7389
Bài được đưa lên Internet ngày: 05/02/2024
tl;dr – Để có thể phù hợp trong hiện tại và tương lai, một chiến lược giáo dục mở quốc gia phải (1) biết chính xác mục tiêu mà chiến lược này hướng tới và (2) tích hợp sâu AI tạo sinh.
WICHE đang triệu tập một loạt các cuộc trò chuyện trong tuần này và tuần tới có tiêu đề "Chúng ta có cần một Chiến lược giáo dục mở quốc gia không?" Bài luận này là đóng góp (rất) cá nhân của tôi cho cuộc trò chuyện đó.
Chúng ta đã đến đây như thế nào
Vào năm 1998, khi tôi khởi động dự án OpenContent (Nội dung Mở) và giấy phép mở đầu tiên cho các tài liệu giáo dục và các tác phẩm sáng tạo khác (không phải là phần mềm), tôi đã khuyến khích mọi người cấp phép mở cho bất kỳ thứ gì họ muốn cấp phép mở. Tôi đã lấy cảm hứng từ tiềm năng chuyển đổi của Internet - chỉ khả dụng cho công chúng rộng rãi trong vài năm tại thời điểm đó - và phong trào phần mềm nguồn mở. Việc kết hợp các giấy phép mở với khả năng chia sẻ tức thời của Internet trên toàn thế giới dường như có tiềm năng cách mạng hóa giáo dục. Tôi đã không có chiến lược nào về việc làm cho nội dung mở dễ hiểu, áp dụng hoặc sử dụng đối với các nhà giáo dục và người học - tôi chỉ cố gắng thuyết phục mọi người rằng thế giới sẽ không kết thúc nếu họ chia sẻ công việc của mình theo các giấy phép mở (vì hầu hết đều tin rằng điều đó sẽ xảy ra). Các tài liệu được chia sẻ trong những năm đầu tiên đó hoàn toàn ngẫu nhiên - các bài luận, ảnh, tài liệu kỹ thuật, v.v. Tương tự như vậy, khi Connexions ra mắt tại Đại học Rice vào năm 1999, họ cũng thúc đẩy việc chia sẻ các phần nội dung riêng lẻ.
Vào đầu những năm 2000, MIT OpenCourseWare đã đưa ra một chiến lược mạch lạc hơn về việc cấp phép mở cho toàn bộ bộ sưu tập tài liệu mà giảng viên đã phát triển cho một khóa học cụ thể. (Đây cũng là thời điểm giấy phép Creative Commons được đưa ra.) Hầu hết giảng viên vẫn có vẻ tin rằng thế giới sẽ kết thúc nếu họ chia sẻ tài liệu khóa học của mình, nhưng cách trình bày mạch lạc hơn về nội dung mở là "bộ sưu tập tài liệu được sử dụng để hỗ trợ một khóa học", cùng với sức mạnh của thương hiệu MIT, đã giúp mọi người bắt đầu nắm bắt được tầm nhìn về những gì có thể có với nội dung mở. Sau khi ra mắt MIT OCW và Creative Commons, một cuộc họp của UNESCO đã quyết định rằng tất cả chúng ta nên bắt đầu gọi nội dung mở được sử dụng trong giáo dục là "tài nguyên giáo dục mở".
Vào cuối những năm 2000 và đầu những năm 2010, một cái gì đó giống như một chiến lược toàn diện bắt đầu hợp nhất xung quanh ý tưởng đóng gói nội dung mở dưới dạng sách giáo khoa để giúp giáo viên dễ hiểu và dễ áp dụng hơn. (Dự án Sách giáo khoa khoa học miễn phí cho học sinh trung học là một trong những dự án tiên phong của mô hình này vào đầu những năm 2000.) Flat World Knowledge bắt đầu xuất bản “sách giáo khoa mở” vào năm 2007, và Connexions tại Rice đổi tên thành OpenStax và bắt đầu xuất bản sách giáo khoa mở vào năm 2012.
Và về cơ bản, đó là nơi sự đổi mới dừng lại. Để nghe một số người ủng hộ OER mô tả về nó ngày nay vào năm 2024, cùng một định dạng đã được sử dụng vào cuối những năm 2000 - sách giáo khoa truyền thống được xuất bản theo giấy phép mở - là công nghệ tiên tiến nhất khi nói đến tài nguyên giáo dục mở. Theo quan điểm này, có lẽ sự đổi mới quan trọng nhất trong hai mươi năm qua là ý tưởng định dạng sách giáo khoa mở dưới dạng hộp khóa học để chúng dễ tải lên hệ thống quản lý học tập hơn. 🙁
Tất nhiên, sự đổi mới với OER thực sự không dừng lại ở sách giáo khoa truyền thống được cấp phép mở. OER cũng đã được sử dụng như một phần của hệ thống học liệu tương tác, được cá nhân hóa. Ví dụ, cả Sáng kiến học tập mở tại Đại học Carnegie Mellon và Lumen Learning đều sử dụng OER theo cách này. Nhưng học liệu và các nỗ lực liên quan đã bị nhiều người trong cộng đồng OER xa lánh vì trong những năm 2010, phần lớn cộng đồng đã thay đổi trọng tâm từ 'cải thiện khả năng tiếp cận cơ hội giáo dục' sang 'đảm bảo rằng tài liệu khóa học miễn phí cho sinh viên'. Và mặc dù đây là một mục tiêu liên quan, nhưng nó là một mục tiêu khác theo những cách cực kỳ quan trọng.
Miễn phí, bất kể chi phí
Không có gì sai khi thay đổi trọng tâm của bạn – Tôi cũng đã thay đổi trọng tâm của mình trong nhiều thập kỷ. Khi tôi ban đầu có ý tưởng cấp phép mở cho các tài liệu giáo dục vào cuối những năm 1990, tôi thấy rất thú vị vì sức mạnh của nó trong việc tăng khả năng tiếp cận cơ hội giáo dục. Và tôi đã trở thành người ủng hộ mạnh mẽ việc sử dụng nội dung mở (và sau đó là OER) để gia tăng quyền truy cập cơ hội giáo dục. Nhưng sau nhiều thập kỷ làm việc, tôi đã tận mắt chứng kiến rằng việc tăng khả năng tiếp cận cơ hội thôi là chưa đủ. Do đó, tôi đã thay đổi trọng tâm của mình và trở thành người ủng hộ việc sử dụng OER để cải thiện thành công của sinh viên. Tôi không chỉ muốn mọi thứ trở nên khả thi; tôi muốn chúng thực sự tốt hơn. Tôi không muốn dừng lại ở các cơ hội, tôi muốn đạt được tất cả các kết quả.
Theo quan điểm của tôi, việc nhiều người trong phong trào OER chuyển sang khăng khăng rằng các tài liệu giáo dục phải miễn phí đã khiến họ mắc kẹt trong thế giới năm 2010 của những cuốn sách giáo khoa được cấp phép mở, trông giống truyền thống. Điều này là do khi bạn yêu cầu không có bất kỳ chi phí nào liên quan đến tài liệu học tập, thì con đường bền vững nhất để tiến lên phía trước là tạo ra một tệp PDF được định dạng đẹp mắt để sinh viên tải xuống. Và khi bạn đưa sự nhiệt tình đó vào chính sách - bằng cách bắt buộc sử dụng tài liệu "không mất phí" (hoặc rất được ưu tiên) trong một số khóa học nhất định hoặc trên toàn trường - bạn không chỉ chà đạp lên quyền tự do học thuật của giảng viên trong việc lựa chọn tài liệu khóa học tốt nhất cho sinh viên của họ mà còn đặt ra những giới hạn tiên nghiệm đối với các loại đổi mới có thể thực hiện được. Và nếu bạn xem xét dữ liệu quốc gia về kết quả của sinh viên trong giáo dục đại học - đặc biệt là đối với sinh viên BIPOC và sinh viên thu nhập thấp của chúng ta - bạn không thể nói rằng, "Điều này đang hoạt động tốt! Chúng ta chỉ cần làm cho nó rẻ hơn!"
Nghiên cứu cho thấy rõ ràng rằng khi sinh viên tham gia vào hoạt động thực hành tương tác với phản hồi ngay lập tức, họ học được nhiều hơn đáng kể so với khi họ đọc hoặc xem video (ví dụ, xem Koedinger, et al., 2016; Koedinger, et al., 2018; Van Campenhout, et al., 2022; Van Campenhout, et al., 2023). Thành thật mà nói, sự phản đối tích cực của nhiều người trong cộng đồng OER đối với học liệu tương tác có thể đã giúp sinh viên tiết kiệm tiền bằng cách gây hại cho việc học của sinh viên. Tôi nghĩ rằng lựa chọn ưu tiên chi phí thấp hơn thay vì học tốt hơn này là một tâm lý "miễn phí, bất kể chi phí". (Hãy lưu ý rằng nhiều học liệu OER tương tác nằm trong phạm vi "chi phí thấp" được đồng thuận trên toàn quốc là 40 đô la trở xuống.)
Vai trò của AI tạo sinh trong Giáo dục Mở
Sự phản đối của nhiều người trong cộng đồng OER đối với học liệu, vì nó có chi phí, không báo hiệu tốt cho mối quan hệ tương lai của cộng đồng với trí tuệ nhân tạo tạo sinh. "Suy luận", cách chúng ta gọi khi một hệ thống AI tạo sinh như ChatGPT tạo ra phản hồi cho lời nhắc của người dùng, tốn tiền. Do đó, ngay cả các tổ chức phi lợi nhuận được tài trợ rất tốt như Khan Academy cũng tính phí để sử dụng công cụ AI tạo sinh của họ (Khanmigo). Nếu một bộ phận có ý nghĩa của cộng đồng OER tiếp tục khăng khăng rằng tài liệu giáo dục phải miễn phí và tiếp tục ủng hộ các chính sách miễn phí trên toàn tổ chức, toàn hệ thống hoặc toàn tiểu bang, thì sự ủng hộ miễn phí đó sẽ loại trừ sinh viên khỏi việc tiếp cận công nghệ giáo dục mạnh mẽ nhất kể từ khi Internet ra đời.
Có nhiều cách để suy nghĩ về vai trò mà AI tạo sinh có thể đóng trong chính sách giáo dục mở trên toàn quốc tại Hoa Kỳ. Tôi thảo luận về ba vai trò rõ ràng nhất trong số những vai trò này bên dưới. Nhưng tôi hoàn toàn thừa nhận rằng chúng ta vẫn chưa biết vai trò mạnh mẽ nhất của AI tạo sinh sẽ là gì.
Phần 1: GenAI và OER truyền thống
Vai trò đầu tiên và rõ ràng nhất là AI tạo sinh có thể được sử dụng để tạo ra thứ mà tôi gọi là "OER truyền thống" - sách giáo khoa, chương, bài luận, hình ảnh, v.v. được cấp phép mở trông giốn cách truyền thống, vốn là trọng tâm của phong trào OER chính thống trong mười lăm năm qua. Văn phòng Bản quyền Hoa Kỳ đã nhất quán khẳng định rằng các sản phẩm do công cụ AI tạo ra không đủ điều kiện để được bảo vệ bản quyền. Và nếu bạn xem Điều khoản Bản quyền của Hiến pháp, cụ thể là nếu bạn xem xét cơ sở lý luận mà nó nêu ra để trao cho Quốc hội quyền cấp bản quyền và bằng sáng chế, thì không có cách nào mà các tác phẩm do AI tạo ra đủ điều kiện để được bảo vệ. Mục đích của bản quyền, như được mô tả trong Hiến pháp, là cung cấp động lực cho những người sáng tạo để sáng tạo. AI không cần động lực. Do đó, Văn phòng Bản quyền Hoa Kỳ đã nhất quán tuyên bố rằng các tác phẩm do AI tạo ra không đủ điều kiện để được bảo vệ.
Điều này có nghĩa là mọi thứ do ChatGPT, Claude, Bard, DALL-E hoặc bất kỳ công cụ AI tạo ra nào khác tạo ra đều là OER. Vì những sáng tạo này thuộc phạm vi công cộng (tức là không có bản quyền), bạn có thể hợp pháp tham gia vào bất kỳ hoạt động 5R nào với chúng (giữ lại, sửa đổi, phối lại, tái sử dụng, phân phối lại). Điều đó khiến chúng trở thành OER.
Bằng cách giảm thời gian tạo bản thảo đầu tiên hoàn chỉnh từ nhiều tháng xuống còn vài ngày, AI tạo sinh có thể giảm đáng kể thời gian và chi phí sản xuất OER truyền thống. Sử dụng AI tạo sinh cũng có thể giảm đáng kể thời gian và chi phí cập nhật và duy trì OER truyền thống, giúp giải quyết (nhưng không giải quyết hoàn toàn) vấn đề được gọi là "vấn đề bền vững" với OER.
Phần 2: Lời nhắc Mở
AI tạo sinh tạo ra các đầu ra của nó để phản hồi các lời nhắc do người dùng cung cấp. Các lời nhắc này bao gồm các hướng dẫn được viết dưới dạng văn bản. Một số lời nhắc quá đơn giản không đủ điều kiện để được bảo vệ bản quyền, nhưng khi các lời nhắc trở nên tinh vi và mạnh mẽ hơn, khả năng chúng đủ điều kiện được bảo vệ bản quyền sẽ tăng lên. Những lời nhắc tinh vi hơn này có thể chỉ đạo một mô hình ngôn ngữ lớn hoạt động như một gia sư có trình độ cao trong tương tác giảng dạy mở rộng với học sinh, ví dụ thế. Các lời nhắc có thể được cấp bản quyền có thể được chia sẻ theo giấy phép mở, biến "lời nhắc mở" thành một loại OER.
Lời nhắc là công thức để tự động tạo OER được cá nhân hóa theo thời gian thực. Hàng triệu người có thể sử dụng một lời nhắc được viết tốt để tạo ra hàng tỷ dòng văn bản giải thích, ví dụ, câu hỏi thực hành, phản hồi và các tài liệu giáo dục khác được cá nhân hóa. Vì lý do này, chúng mạnh hơn đáng kể về khả năng tăng khả năng tiếp cận cơ hội giáo dục và cải thiện kết quả của học sinh so với OER truyền thống.
Hãy xem xét lượng thời gian và tiền bạc đầu tư vào việc tạo ra một sách giáo khoa mở thông thường. Hãy nghĩ đến tất cả những nỗ lực bỏ ra để tạo ra một nguồn tài nguyên chung, tĩnh không thể đáp ứng động với nhu cầu và sở thích của từng người học. Bây giờ hãy tưởng tượng điều gì có thể xảy ra nếu cùng một lượng thời gian và công sức đó thay vào đó được đầu tư vào việc tạo ra và tinh chỉnh các lời nhắc được cấp phép mở được tạo ra để khiến các hệ thống AI tạo ra tham gia vào các hoạt động giảng dạy dựa trên bằng chứng khi chúng tương tác với người học.
Tiềm năng kết hợp các lời nhắc mở với các hệ thống đã sử dụng OER rồi theo cách tương tác, như các học liệu được cá nhân hóa, cho thấy một kịch bản tốt nhất của cả hai thế giới này.
(Tôi đã bỏ qua việc tạo ra các lời nhắc động và đa phương thức ở đây vì mục đích đơn giản hóa. Nhưng việc đưa chúng vào sẽ không thay đổi kết luận rằng thời gian và công sức đầu tư vào việc tạo ra các lời nhắc mở sẽ mang lại tác động giáo dục lớn hơn đáng kể so với cùng một lượng thời gian và công sức đầu tư vào việc tạo ra một sách giáo khoa mở. Việc bao gồm đa phương thức, v.v., sẽ chỉ làm cho lời giải thích trở nên phức tạp hơn.)
Phần 3: Mô hình Mở
Tính mở trong AI tạo sinh có thể vượt ra ngoài các lời nhắc. Khung 5R cũng có thể được áp dụng cho trọng số mô hình, giống như mã nguồn của các mô hình AI tạo sinh. Nếu bạn được phép tải xuống trọng số mô hình (giữ lại), tinh chỉnh chúng bằng RLHF hoặc DPO hoặc một số kỹ thuật khác (sửa đổi và phối lại), sử dụng trọng số mô hình đã được cập nhật cho bất kỳ mục đích nào (tái sử dụng) và chia sẻ trọng số đã được cập nhật của bạn với những người khác (phân phối lại), thì chúng ta có thể nói về một mô hình AI tạo sinh là "mở" theo cùng nghĩa mà OER là mở. Và trên thực tế, chúng ta đã thấy rất nhiều hoạt động như thế này trên HuggingFace, một cộng đồng nơi mọi người chia sẻ các mô hình mở, tinh chỉnh chúng, chia sẻ những mô hình đã tinh chỉnh đó và so sánh chúng với nhau để xem chúng hoạt động tốt như thế nào trên các tác vụ khác nhau.
Các mô hình có thể được tinh chỉnh cho nhiều mục đích khác nhau, bao gồm cả việc cung cấp cho chúng kiến thức chuyên sâu hơn về lĩnh vực. Ví dụ: một mô hình được tinh chỉnh về nội dung sinh học sẽ có nhiều khả năng cung cấp câu trả lời chính xác cho các câu hỏi về sinh học hơn. Các mô hình cũng có thể được tinh chỉnh bằng cách sử dụng các bài báo nghiên cứu về các phương pháp giảng dạy dựa trên bằng chứng và các ví dụ về các phương pháp đó đang được ban hành. Điều này sẽ cho phép các phương pháp giảng dạy hiệu quả cao được mở rộng trên diện rộng. Khi các thế hệ mô hình nền tảng mới được tạo ra và các hình thức tinh chỉnh mới được phát minh (DPO là ví dụ gần đây nhất), mức độ mà chúng ta có thể điều khiển thành công hành vi mô hình sẽ tiếp tục được cải thiện.
Tuy nhiên, có hai điểm chúng ta cần nhấn mạnh về các mô hình mở. Đầu tiên, các mô hình được cấp phép mở vẫn phải chạy ở đâu đó. Nghĩa là, các mô hình AI tạo sinh với trọng số mở vẫn cần một lượng lớn sức mạnh tính toán để có thể sử dụng ở bất kỳ quy mô nào, và do đó vẫn sẽ có chi phí liên quan đến việc sử dụng các mô hình mở. Nếu AI tạo sinh là một phần có ý nghĩa trong tương lai của OER, những người ủng hộ OER sẽ phải thoải mái với ý tưởng rằng sẽ có một số chi phí liên quan đến tài liệu học tập.
Thứ hai, đúng là có một số mô hình AI tạo sinh nhỏ hơn có thể chạy trên máy tính xách tay hoặc máy tính để bàn cao cấp hơn. Nhưng độ chính xác và sức mạnh của các mô hình này, được đo bằng ELO và các số liệu khác như trên bảng xếp hạng HuggingFace, có thể sẽ luôn thấp hơn hiệu suất của các mô hình độc quyền rộng hơn như GPT-4. Nếu chiến lược AI tạo sinh không tốn kém của những người ủng hộ OER là lập luận cho việc sử dụng các mô hình có thể chạy cục bộ trên máy tính xách tay của sinh viên (tức là không có thêm chi phí tính toán), thì những người ủng hộ đó (một lần nữa) sẽ tạo ra thay vì giải quyết các vấn đề về công bằng. Tương tự như cách mà việc ủng hộ và chính sách không tốn kém đã ngăn cản nhiều sinh viên sử dụng học liệu tương tác được chứng minh là hiệu quả hơn nhiều so với sách giáo khoa truyền thống, chiến lược này sẽ ngăn cản sinh viên sử dụng các mô hình AI tạo sinh hiệu quả hơn. Trớ trêu thay, chiến lược không tốn kém nhằm cải thiện công bằng thay vào đó chủ yếu hoạt động để nới rộng khoảng cách thành công trong học tập giữa những sinh viên có nguy cơ cao nhất của chúng ta (được giao sử dụng các mô hình chi phí bằng không (0), ít mạnh mẽ hơn) và các bạn cùng lứa (sử dụng các mô hình hiện đại). “Nhưng David,” bạn phản đối, “có lẽ một ngày nào đó các mô hình mở sẽ mạnh mẽ như các mô hình độc quyền.” Đừng bao giờ nói không bao giờ. Nhưng ngày đó không phải là hôm nay. Và có lẽ không nằm trong khung thời gian của một kế hoạch năm năm cho một chiến lược giáo dục mở quốc gia.
Kết luận
Hãy tưởng tượng một nhóm những người ủng hộ giáo dục làm việc vào năm 1998. Hãy tưởng tượng họ vận động chống lại việc giảng viên giao cho sinh viên đọc các trang web cho lớp học vì có chi phí liên quan đến việc kết nối Internet từ nhà. Bây giờ hãy hướng tâm trí của bạn đến năm 2024 và tưởng tượng những người đó vẫn đang vận động chống lại việc sử dụng Internet trong giáo dục - vận động chống lại các khóa học trực tuyến và chương trình cấp bằng trực tuyến, gửi email thông báo cho sinh viên, cung cấp quyền truy cập vào các bài giảng đã ghi âm hoặc phân phối giáo trình qua LMS. Vận động chống lại việc đăng ký lớp học trực tuyến, các công cụ lập kế hoạch cấp bằng trực tuyến, điền FAFSA trực tuyến, v.v. Tất cả chỉ vì kết nối Internet tốn kém. Và đưa ra lập luận này nhân danh công bằng. Một chiến lược giáo dục đại học "không có Internet" sẽ có liên quan như thế nào trong thế giới ngày nay? Quan trọng hơn, nó sẽ công bằng như thế nào?
AI tạo sinh sẽ cách mạng hóa thế giới ít nhất ở cùng mức độ như Internet, có thể còn hơn thế nữa. Tương tự như cách nhiều người trong chúng ta đã nhìn vào Internet vào những năm 1990 và cố gắng tưởng tượng ra những khả năng đáng kinh ngạc mà nó mang lại cho giáo dục (bao gồm nội dung mở và OER), chúng ta cần cùng một loại hình tưởng tượng như vậy ngay bây giờ trong bối cảnh AI tạo sinh. Một chiến lược quốc gia cho bất kỳ điều gì - và đặc biệt là một chiến lược quốc gia cho giáo dục - không lường trước được những khả năng của AI tạo sinh sẽ tự đẩy mình vào tình trạng không liên quan. Có những cơ hội đáng kinh ngạc để chúng ta mở rộng khả năng tiếp cận cơ hội giáo dục và thực sự cải thiện thành công của học sinh nếu chúng ta chủ động tận dụng những khả năng này.
Chắc chắn, chắc chắn, cuộc thảo luận về chính sách giáo dục mở quốc gia không chỉ là nỗ lực mở rộng các chính sách tài liệu khóa học miễn phí hiện có trên khắp Hoa Kỳ. Chắc chắn nó sẽ là một cái gì đó hướng tới tương lai hơn - và quan tâm hơn đến việc cải thiện thành công của sinh viên - hơn thế nữa.
Tôi tin rằng những câu hỏi quan trọng nhất có thể được trả lời trong cuộc thảo luận về chiến lược giáo dục mở quốc gia cho Hoa Kỳ là:
Mục tiêu bạn đang cố gắng đạt được bằng cách sử dụng "giáo dục mở" là gì? Nó chỉ tiết kiệm tiền cho sinh viên hay còn điều gì khác? Nếu không có mục tiêu được nêu rõ ràng và thống nhất, thì chiến lược sẽ không đi đến đâu.
Sau hơn 25 năm, liệu có cách nào hiệu quả hơn để đạt được bất kỳ mục tiêu nào đó ngoài việc sử dụng giáo dục mở như ban đầu được hình dung ở Hoa Kỳ cách đây nhiều thập kỷ (tức là thông qua OER truyền thống) không?
Giáo dục mở có thể trông như thế nào nếu được hình dung lại từ đầu, thừa nhận sự ra đời của AI tạo sinh và cố gắng tận dụng khả năng cung cấp độc đáo của nó?
Chủng loại artificial intelligence, improving learning, open content
Suy nghĩ về Công bằng AI từ Góc nhìn Công bằng Băng thông rộng
Suy ngẫm về Cuộc trò chuyện về Chiến lược Giáo dục Mở Quốc gia Hoa Kỳ
tl;dr – In order to be relevant today and in the future, a national open education strategy must (1) know exactly what it is trying to accomplish and (2) deeply integrate generative AI.
WICHE is convening a series of conversations this week and next titled, “Do We Need a National Open Education Strategy?” This essay is my (very) personal contribution to that conversation.
How We Got Here
In 1998, when I launched the OpenContent project and the first open license for educational materials and other creative works (that weren’t software), I encouraged anyone and everyone to openly license anything they were willing to openly license. I was inspired by the transformational potential of the internet – only available to the broader public for a few years at that point – and the open source software movement. Combining open licenses with the internet’s capacity to share instantaneously around the world seemed to have the potential to revolutionize education. I had no strategy in terms of making open content easy for educators and learners to understand, adopt, or use – I was just trying to convince people the world wouldn’t end if they shared their work under open licenses (because most were convinced it would). The materials shared during those first years were totally random – essays, photos, technical documentation, etc. Similarly, when Connexions launched at Rice University in 1999, it promoted sharing individual bits of content as well.
In the early 2000s, MIT OpenCourseWare put forth a more coherent strategy of openly licensing the entire collection of materials faculty had developed for a specific course. (This is also when the Creative Commons licenses were launched.) Most faculty still seemed convinced the world would end if they shared their course materials, but the more coherent presentation of open content as “the collection of materials used to support a course,” together with the power of MIT’s brand, helped people begin to catch the vision of what was possible with open content. After the launches of MIT OCW and Creative Commons were announced, a UNESCO convening decided that we should all start calling open content used in education “open educational resources.”
In the late 2000s and early teens, something like a movement-wide strategy began to coalesce around the idea of packaging open content as a textbook in order to make it easier for teachers to understand and adopt. (The Free High School Science Textbooks project had been one of the pioneers of this model in the early 2000s.) Flat World Knowledge began publishing “open textbooks” in 2007, and Connexions at Rice changed their name to OpenStax and started publishing open textbooks in 2012.
And that’s essentially where innovation stopped. To hear some OER advocates describe it today in 2024, the same format that was being used in the late 2000s – traditional-looking textbooks published under open licenses – is the state of the art when it comes to open educational resources. From this perspective, perhaps the most important innovation of the last twenty years was the idea of formatting open textbooks as course cartridges so they’re easier to upload into a learning management system. 🙁
Of course innovation with OER didn’t actually stop with openly licensed traditional textbooks. OER have also been used as part of personalized, interactive courseware systems, too. For example, both the Open Learning Initiative at Carnegie Mellon University and Lumen Learning use OER this way. But courseware and related efforts have been shunned by many in the OER community because during the 2010s much of the community changed their focus from ‘improving access to educational opportunity’ to ‘ensuring that course materials are free for students.’ And while this is a related goal, it is a different goal in critically important ways.
Free, No Matter the Cost
There’s nothing wrong with changing your focus – I’ve changed my focus over the decades, too. When I initially had the idea to openly license educational materials in the late 1990s, it was exciting to me because of its power to increase access to educational opportunity. And I became a vocal advocate for using open content (and later OER) to increase access to educational opportunity. But over decades of doing the work, I’ve seen first-hand that increasing access to opportunity isn’t enough by itself. Consequently, I changed my focus and became an advocate for using OER to improve student success. I don’t just want things to be possible; I want them to actually be better. I don’t want to stop at opportunities, I want to get all the way to results.
From my perspective, the pivot of many in the OER movement to an insistence that educational materials be free has trapped them in that 2010 world of traditional-looking, openly licensed textbooks. This is because when you demand that there can be no costs whatsoever associated with learning materials, the most sustainable path forward is creating a nicely formatted PDF for students to download. And when you enshrine that zeal for “free” in policy – by making ‘zero-cost’ materials mandatory (or very strongly preferred) in certain courses or across campus – not only do you trample on faculty’s academic freedom to choose the best course materials for their students, but you place a priori limits on the kinds of innovation that are possible. And if you look at the national data on student outcomes in higher education – especially for our BIPOC and low income students – you can’t say, “This is working great! We just need to make it cheaper!”
Research is crystal clear that when students engage in interactive practice with immediate feedback they learn dramatically more than when they read or when they watch video (see, for example, Koedinger, et al., 2016; Koedinger, et al., 2018; Van Campenhout, et al., 2022; Van Campenhout, et al., 2023). To be frank, the active opposition of many in the OER community to interactive courseware has likely saved students money by harming students’ learning. I think of this choice to prioritize lower costs over better learning as a “free, no matter the cost” mentality. (Bear in mind that many interactive OER courseware offerings are well within the national consensus “low cost” range of $40 and below.)
The Role of Generative AI in Open Education
The resistance of many in the OER community to courseware, because it has a cost, does not bode well for the community’s future relationship with generative artificial intelligence. “Inference,” what we call it when a generative AI system like ChatGPT generates a response to a user prompt, costs money. Consequently, even very well-funded nonprofits like Khan Academy charge a fee to use their generative AI tool (Khanmigo). If a meaningful portion of the OER community continues its insistence that educational materials be zero-cost, and continues advocating for institution-wide, system-wide, or state-wide zero-cost policies, that zero-cost advocacy will exclude students from having access to the most powerful educational technology since the creation of the internet.
There are many ways to think about the role generative AI could play in a nationwide open education policy in the US. I discuss the three most obvious of these roles below. But I fully acknowledging that we still don’t know what the most powerful roles for generative AI will be.
Part 1: GenAI and Traditional OER
The first, most obvious role, is that generative AI can be used to create what I will call “traditional OER” – the traditional-looking openly licensed textbooks, chapters, essays, images, etc., that have been the focus of the mainstream OER movement for the last fifteen years. The US Copyright Office has been consistent in asserting that products generated by AI tools aren’t eligible for copyright protection. And if you look to the Constitution’s Copyright Clause, specifically if you look at the rationale it lays out for giving Congress the power to grant copyrights and patents, there’s no way that works created by AI should be eligible for protection. The purpose of copyright, as described in the Constitution, is to provide an incentive for creators to create. AI doesn’t need an incentive. Consequently, the US Copyright Office has consistently said that works generated by AI are not eligible for protection.
This means that everything created by ChatGPT, or Claude, or Bard, or DALL-E, or any other generative AI tool is OER. Because these creations are in the public domain (i.e., not copyrighted), you can legally engage in any of the 5R activities with them (retain, revise, remix, reuse, redistribute). That makes them OER.
By decreasing the amount of time it takes to create a complete first draft from months to days, generative AI can dramatically reduce the time and cost of producing traditional OER. Using generative AI can also dramatically reduce the time and cost of updating and maintaining traditional OER, helping with (but not fully solving) what has been known as “the sustainability problem” with OER.
Part 2: Open Prompts
Generative AI creates its outputs in response to prompts provided by a user. These prompts are comprised of instructions written as text. Some prompts are too simplistic to be eligible for copyright protection, but as prompts become more sophisticated and powerful, the likelihood that they would be eligible for copyright protection increases. These more sophisticated prompts might be able to direct a large language model to act as a highly skilled tutor in an extended teaching interaction with a student, for example. Prompts which are copyrightable can be shared under open licenses, making “open prompts” a kind of OER.
Prompts are recipes for automatically creating personalized OER in real-time. A single, well-written prompt could be used by millions of people to generate billions of written lines of personalized explanations, examples, practice questions, feedback, and other educational materials. For this reason, they are significantly more powerful in terms of their ability to increase access to educational opportunity and improve student outcomes than traditional OER.
Consider the amount of time and money invested in the creation of a typical open textbook. Think of all the effort that goes into creating a static, generic resource which cannot respond dynamically to the needs and interests of individual learners. Now imagine what might result if that same amount of time and effort was instead invested in creating and refining openly licensed prompts crafted to cause generative AI systems to engage in evidence-based teaching practices as they interact with learners.
The potential to combine open prompts with systems that already use OER interactively, like personalized courseware, suggests a best-of-both-worlds scenario.
(I’ve ignored multi-modality and the dynamic generation of prompts here for the sake of simplicity. But their inclusion would not change the conclusion that time and effort invested in creating open prompts will provide dramatically more educational impact than the same amount of time and effort invested in creating an open textbook. Including multi-modality, etc., would just make the explanation more complicated.)
Part 3: Open Models
Openness in generative AI can go beyond just the prompts. The 5Rs framework can also be applied to model weights, which are like the source code of generative AI models. If you’re allowed to download model weights (retain), fine-tune them using RLHF or DPO or some other technique (revise and remix), use the updated model weights for any purpose (reuse), and share your updated weights with others (redistribute), then we can talk about a generative AI model being “open” in the same sense that OER are open. And in fact we already see a lot of this kind of activity on HuggingFace, which is a community where people share open models, fine-tune them, share those refined models, and compare them to each other to see how well they perform on various tasks.
Models can be fine-tuned for a wide range of purposes, including giving them greater domain knowledge. For example, a model fine-tuned on biology content will be more likely to provide accurate answers to biology questions. Models can also be fine-tuned using research articles about evidence-based teaching practices and examples of those practices being enacted. This will allow highly effective teaching practices to scale broadly. As new generations of foundation models are created, and new forms of fine-tuning are invented (DPO being the most recent example), the degree to which we are able to successfully steer model behavior will continue to improve.
There are two points we should stress about open models, however. First, openly licensed models still have to run somewhere. That is, generative AI models with open weights still need large amounts of computing power to be used at any kind of scale, and so there will still be costs associated with using open models. If generative AI is to be a meaningful part of the future of OER, OER advocates are going to have to get comfortable with the idea that there will be some cost associated with learning materials.
Second, it is true that there are some smaller generative AI models that can be run on higher-end laptops or desktops. But the accuracy and power of these models, as measured by their ELO and other metrics like those on the HuggingFace leaderboard, will likely always be lower than the performance of larger proprietary models like GPT-4. If OER advocates’ zero-cost generative AI strategy is to argue for the use of models that can be run locally on a student’s laptop (i.e., with no additional compute costs), those advocates will (again) create rather than solve equity problems. In the same way that zero-cost advocacy and policies prevented many students from being able to use interactive courseware that is demonstrably more effective than traditional textbooks, this strategy will prevent students from using more effective generative AI models. Ironically, the zero-cost strategy intended to improve equity will instead primarily function to widen the academic success gap between our most at-risk students (assigned to use zero-cost, less powerful models) and their peers (using state of the art models). “But David,” you protest, “perhaps one day open models will be as powerful as proprietary models.” Never say never. But that day isn’t today. And it’s likely not within the time horizon of a five-year plan for a national open education strategy.
Conclusion
Imagine a group of education advocates working back in 1998. Imagine them campaigning against faculty assigning students to read webpages for class because there’s a cost associated with connecting to the internet from home. Now cast your mind forward to 2024 and imagine those same people still lobbying against using the internet in education – campaigning against online courses and online degree programs, emailing announcements to students, providing access to recorded lectures, or distributing a syllabus via the LMS. Lobbying against online class registration, online degree planning tools, filling out the FAFSA online, etc. All because connecting to the internet costs money. And making this argument in the name of equity. How relevant would a “no internet” higher education strategy be in today’s world? More importantly, how equitable would it be?
Generative AI will revolutionize the world to at least the same degree as the internet, probably much more so. In the same way that many of us looked at the internet in the 1990s and tried to imagine the incredible possibilities it presented for education (including open content and OER), we need the same kind of imagining now in the context of generative AI. A national strategy for anything – and particularly a national strategy for education – that fails to anticipate the possibilities of generative AI dooms itself to irrelevance. There are incredible opportunities for us to expand access to educational opportunity and actually improve student success if we leverage these possibilities proactively.
Surely, surely, the national open education policy conversation is not just an attempt to extend existing zero-cost course materials policies across more of the US. Surely it will be something more forward looking – and more concerned about improving student success – than that.
I believe the most important questions that could be answered during a conversation about a national open education strategy for the US are these:
What is the goal you’re trying to accomplish by using “open education?” Is it just saving students money, or is it something more? If there’s not a clearly articulated, agreed upon goal, the strategy won’t matter.
Over 25 years later now, is it possible there’s a more effective way to accomplish whatever that goal is than using open education as it was originally imagined in the US decades ago (i.e., via traditional OER)?
What could open education look like if it were reimagined from the ground up, acknowledging the advent of generative AI and trying to leverage its unique affordances?
Categories artificial intelligence, improving learning, open content
Thinking about AI Equity from the Perspective of Broadband Equity
Reflections on a Conversation about a US National Open Education Strategy
Dịch: Lê Trung Nghĩa
letrungnghia.foss@gmail.com
Tác giả: Nghĩa Lê Trung
Ý kiến bạn đọc
Những tin cũ hơn
Blog này được chuyển đổi từ http://blog.yahoo.com/letrungnghia trên Yahoo Blog sang sử dụng NukeViet sau khi Yahoo Blog đóng cửa tại Việt Nam ngày 17/01/2013.Kể từ ngày 07/02/2013, thông tin trên Blog được cập nhật tiếp tục trở lại với sự hỗ trợ kỹ thuật và đặt chỗ hosting của nhóm phát triển...