Self-Consistency
Theo: https://www.promptingguide.ai/techniques/consistency
Có lẽ một trong những kỹ thuật tiên tiến hơn hiện có cho kỹ thuật nhắc là tự nhất quán. Được đề xuất bởi Wang và cộng sự (2022), tự nhất quán nhằm mục đích "thay thế cách giải mã tham lam ngây thơ được sử dụng trong lời nhắc theo chuỗi suy nghĩ". Ý tưởng là lấy mẫu nhiều đường suy luận đa dạng thông qua CoT với vài ví dụ/minh họa, và sử dụng các thế hệ để chọn ra câu trả lời nhất quán nhất. Điều này giúp tăng hiệu suất của lời nhắc CoT trong các nhiệm vụ liên quan đến số học và suy luận thông thường.
Hãy thử ví dụ sau về suy luận số học:
Prompt:
Khi tôi 6 tuổi, chị gái tôi chỉ bằng một nửa tuổi tôi. Bây giờ tôi 70 tuổi, chị gái tôi bao nhiêu tuổi?
Output:
35
Đầu ra sai! Làm thế nào chúng ta có thể cải thiện điều này bằng tính nhất quán? Hãy thử xem. Chúng ta sẽ sử dụng các ví dụ với vài ví dụ/minh họa từ Wang và cộng sự, 2022 (Bảng 17):
Prompt:
Hỏi: Có 15 cây trong khu rừng. Hôm nay, các công nhân khu rừng sẽ trồng cây trong khu rừng. Sau khi hoàn thành, sẽ có 21 cây. Vậy hôm nay các công nhân khu rừng đã trồng bao nhiêu cây?
Đáp: Ban đầu chúng ta có 15 cây. Sau đó chúng ta có 21 cây. Khác biệt phải là số cây họ đã trồng. Vậy, họ phải trồng 21 - 15 = 6 cây. Đáp án là 6.
Hỏi: Nếu có 3 ô tô trong bãi đậu xe và có thêm 2 ô tô nữa đến, vậy có bao nhiêu ô tô trong bãi đậu xe?
Đáp: Đã có 3 ô tô trong bãi đậu xe. Thêm 2 ô tô nữa đến. Bây giờ có 3 + 2 = 5 ô tô. Đáp án là 5.
Hỏi: Leah có 32 viên sô cô la và em gái cô ấy có 42 viên. Nếu họ ăn 35 viên, tổng cộng họ còn lại bao nhiêu viên?
Đáp: Leah có 32 viên kẹo sô cô la và em gái Leah có 42 viên. Điều đó có nghĩa là ban đầu có 32 + 42 = 74 viên kẹo sô cô la. Đã ăn hết 35 viên. Vậy tổng cộng họ vẫn còn 74 - 35 = 39 viên kẹo sô cô la. Câu trả lời là 39.
Hỏi: Jason có 20 viên kẹo. Cậu ấy đã cho Denny một ít kẹo. Bây giờ Jason có 12 viên kẹo. Jason đã cho Denny bao nhiêu viên kẹo?
Đáp: Jason có 20 viên kẹo. Vì bây giờ cậu ấy chỉ còn 12 viên, nên cậu ấy hẳn đã cho Denny số kẹo còn lại. Số kẹo cậu ấy đã cho Denny phải là 20 - 12 = 8 viên kẹo. Câu trả lời là 8.
Hỏi: Shawn có 5 món đồ chơi. Vào dịp Giáng sinh, cậu ấy nhận được 2 món đồ chơi từ bố và mẹ. Vậy bây giờ cậu ấy có bao nhiêu món đồ chơi?
Đáp: Cậu ấy có 5 món đồ chơi. Cậu bé được mẹ cho 2 món đồ chơi, vậy là cậu bé có 5 + 2 = 7 đồ chơi. Sau đó, cậu được bố cho thêm 2 món nữa, vậy tổng cộng cậu bé có 7 + 2 = 9 món đồ chơi. Đáp án là 9.
Hỏi: Có 9 máy tính trong phòng máy chủ. Mỗi ngày, từ thứ Hai đến thứ Năm, lại lắp thêm 5 máy tính nữa. Vậy hiện tại có bao nhiêu máy tính trong phòng máy chủ?
Đáp: Có 4 ngày, từ thứ Hai đến thứ Năm. Mỗi ngày lại có thêm 5 máy tính. Điều đó có nghĩa là tổng cộng có 4 * 5 = 20 máy tính được lắp thêm. Ban đầu có 9 máy tính, vậy bây giờ có 9 + 20 = 29 máy tính.
Đáp án là 29.
Hỏi: Michael có 58 quả bóng gôn. Vào thứ Ba, cậu bé làm mất 23 quả bóng gôn. Vào thứ Tư, cậu bé làm mất thêm 2 quả bóng gôn. Vậy cuối ngày thứ Tư, cậu bé có bao nhiêu quả bóng gôn?
Đáp: Ban đầu, Michael có 58 quả bóng gôn. Hôm thứ Ba, anh ấy làm mất 23 quả bóng, vậy sau đó anh ấy còn 58 - 23 = 35 quả bóng. Hôm thứ Tư, anh ấy làm mất thêm 2 quả nữa, vậy bây giờ anh ấy còn 35 - 2 = 33 quả bóng. Câu trả lời là 33. 
Hỏi: Olivia có 23 đô la. Cô ấy mua 5 bánh mì tròn với giá 3 đô la mỗi chiếc. Hỏi cô ấy còn lại bao nhiêu tiền?
Đáp: Cô ấy mua 5 chiếc bánh mì tròn với giá 3 đô la mỗi chiếc. Điều này có nghĩa là cô ấy đã tiêu hết 15 đô la. Vậy cô ấy còn lại 8 đô la.
Hỏi: Khi tôi 6 tuổi, chị gái tôi bằng một nửa tuổi tôi. Bây giờ tôi 70 tuổi, vậy chị gái tôi bao nhiêu tuổi?
A:
Output 1:
Khi tôi 6 tuổi, em gái tôi bằng một nửa tuổi tôi, tức là em ấy 3 tuổi. Bây giờ tôi 70 tuổi, tức là em ấy 70 - 3 = 67. Đáp án là 67.
Output 2:
Khi người kể chuyện 6 tuổi, em gái anh ấy bằng một nửa tuổi anh ấy, tức là 3 tuổi. Bây giờ người kể chuyện 70 tuổi, tức là em gái anh ấy 70 - 3 = 67 tuổi. Đáp án là 67.
Output 3:
Khi tôi 6 tuổi, em gái tôi bằng một nửa tuổi tôi, tức là em ấy 3 tuổi. Bây giờ tôi 70 tuổi, tức là em ấy 70/2 = 35. Đáp án là 35.
Việc tính toán để đưa ra câu trả lời cuối cùng bao gồm một vài bước (xem tài liệu để biết chi tiết) nhưng để đơn giản, chúng ta có thể thấy rằng đã có một câu trả lời đa số xuất hiện nên về cơ bản đó sẽ trở thành câu trả lời cuối cùng.
Về ‘Kỹ thuật viết lời nhắc’ ………. Phần trước ………. Phần tiếp theo
Perhaps one of the more advanced techniques out there for prompt engineering is self-consistency. Proposed by Wang et al. (2022), self-consistency aims "to replace the naive greedy decoding used in chain-of-thought prompting". The idea is to sample multiple, diverse reasoning paths through few-shot CoT, and use the generations to select the most consistent answer. This helps to boost the performance of CoT prompting on tasks involving arithmetic and commonsense reasoning.
Let's try the following example for arithmetic reasoning:
Prompt:
When I was 6 my sister was half my age. NowI’m 70 how old is my sister?
Output:
35
The output is wrong! How may we improve this with self-consistency? Let's try it out. We will use the few-shot exemplars from Wang et al. 2022 (Table 17):
Prompt:
Q: There are 15 trees in the grove. Grove workers will plant trees in the grove today. After they are done,there will be 21 trees. How many trees did the grove workers plant today?A: We start with 15 trees. Later we have 21 trees. The difference must be the number of trees they planted.So, they must have planted 21 - 15 = 6 trees. The answer is 6.Q: If there are 3 cars in the parking lot and 2 more cars arrive, how many cars are in the parking lot?A: There are 3 cars in the parking lot already. 2 more arrive. Now there are 3 + 2 = 5 cars. The answer is 5.Q: Leah had 32 chocolates and her sister had 42. If they ate 35, how many pieces do they have left in total?A: Leah had 32 chocolates and Leah’s sister had 42. That means there were originally 32 + 42 = 74chocolates. 35 have been eaten. So in total they still have 74 - 35 = 39 chocolates. The answer is 39.Q: Jason had 20 lollipops. He gave Denny some lollipops. Now Jason has 12 lollipops. How many lollipopsdid Jason give to Denny?A: Jason had 20 lollipops. Since he only has 12 now, he must have given the rest to Denny. The number oflollipops he has given to Denny must have been 20 - 12 = 8 lollipops. The answer is 8.Q: Shawn has five toys. For Christmas, he got two toys each from his mom and dad. How many toys doeshe have now?A: He has 5 toys. He got 2 from mom, so after that he has 5 + 2 = 7 toys. Then he got 2 more from dad, soin total he has 7 + 2 = 9 toys. The answer is 9.Q: There were nine computers in the server room. Five more computers were installed each day, frommonday to thursday. How many computers are now in the server room?A: There are 4 days from monday to thursday. 5 computers were added each day. That means in total 4 * 5 =20 computers were added. There were 9 computers in the beginning, so now there are 9 + 20 = 29 computers.The answer is 29.Q: Michael had 58 golf balls. On tuesday, he lost 23 golf balls. On wednesday, he lost 2 more. How manygolf balls did he have at the end of wednesday?A: Michael initially had 58 balls. He lost 23 on Tuesday, so after that he has 58 - 23 = 35 balls. OnWednesday he lost 2 more so now he has 35 - 2 = 33 balls. The answer is 33.Q: Olivia has $23. She bought five bagels for $3 each. How much money does she have left?A: She bought 5 bagels for $3 each. This means she spent $15. She has $8 left.Q: When I was 6 my sister was half my age. Now I’m 70 how old is my sister?A:
Output 1:
When I was 6 my sister was half my age, so she was 3. Now I am 70, so she is 70 - 3 = 67. The answer is 67.
Output 2:
When the narrator was 6, his sister was half his age, which is 3. Now that the narrator is 70, his sister would be 70 - 3 = 67 years old. The answer is 67.
Output 3:
When I was 6 my sister was half my age, so she was 3. Now I am 70, so she is 70/2 = 35. The answer is 35.
Computing for the final answer involves a few steps (check out the paper for the details) but for the sake of simplicity, we can see that there is already a majority answer emerging so that would essentially become the final answer.
Dịch: Lê Trung Nghĩa
letrungnghia.foss@gmail.com
Tác giả: Nghĩa Lê Trung
Ý kiến bạn đọc
Những tin cũ hơn
Blog này được chuyển đổi từ http://blog.yahoo.com/letrungnghia trên Yahoo Blog sang sử dụng NukeViet sau khi Yahoo Blog đóng cửa tại Việt Nam ngày 17/01/2013.Kể từ ngày 07/02/2013, thông tin trên Blog được cập nhật tiếp tục trở lại với sự hỗ trợ kỹ thuật và đặt chỗ hosting của nhóm phát triển...
        Các bài trình chiếu trong năm 2024
    
        Tập huấn thực hành ‘Khai thác tài nguyên giáo dục mở’ cho giáo viên phổ thông, bao gồm cả giáo viên tiểu học và mầm non tới hết năm 2024
    
        Các lớp tập huấn thực hành ‘Khai thác tài nguyên giáo dục mở’ tới hết năm 2024
    
        Các tài liệu dịch sang tiếng Việt tới hết năm 2024
    
        ‘Digcomp 2.2: Khung năng lực số cho công dân - với các ví dụ mới về kiến thức, kỹ năng và thái độ’, EC xuất bản năm 2022
    
        Tổng hợp các bài của Nhóm các Nhà cấp vốn Nghiên cứu Mở (ORFG) đã được dịch sang tiếng Việt
    
        Tổng hợp các bài của Liên minh S (cOAlition S) đã được dịch sang tiếng Việt
    
        Năm Khoa học Mở & Chuyển đổi sang Khoa học Mở - Tổng hợp các bài liên quan
    
        Hội nghị Đối tác Dữ liệu Mở châu Á năm 2021 do Việt Nam lần đầu tiên chủ trì
    
        Các khung năng lực trong hành động
    
        Phong trào Bình dân học vụ số: Mục tiêu, đối tượng, nội dung, nguồn lực, phương thức tổ chức thực hiện
    
        Lễ công bố công khai Trung tâm Năng lực Kim cương châu Âu và dự án ALMASI
    
        Khung năng lực AI cho giáo viên
    
        Ngày Phần mềm Tự do, Ngày Phần cứng tự do, Ngày Tài liệu Tự do
    
        ‘Khung năng lực AI cho giáo viên’ - bản dịch sang tiếng Việt
    
        Bạn cần biết những gì về các khung năng lực AI mới của UNESCO cho học sinh và giáo viên
    
        Bàn về 'Lợi thế của doanh nghiệp Việt là dữ liệu Việt, bài toán Việt' - bài phát biểu của Bộ trưởng Nguyễn Mạnh Hùng ngày 21/08/2025
    
        Các tài liệu dịch sang tiếng Việt tới hết năm 2024
    
        Các bài trình chiếu trong năm 2024
    
        ‘Tài liệu quan điểm của KR21 về Giữ lại Quyền Tác giả: Giữ lại các quyền trong kết quả đầu ra nghiên cứu để cho phép phổ biến mở kiến thức’ - bản dịch sang tiếng Việt
    
        ‘KHUYẾN NGHỊ VÀ HƯỚNG DẪN TRUY CẬP MỞ KIM CƯƠNG cho các cơ sở, nhà cấp vốn, nhà bảo trợ, nhà tài trợ, và nhà hoạch định chính sách’ - bản dịch sang tiếng Việt
    
        DeepSeek đã gây ra sự hoảng loạn trên thị trường — nhưng một số người cho rằng việc bán tháo là quá mức
    
        “Chúng tôi không có hào nước”: Sự đổi mới đột phá của AI nguồn mở
    
        Tập huấn thực hành ‘Khai thác tài nguyên giáo dục mở’ cho giáo viên phổ thông, bao gồm cả giáo viên tiểu học và mầm non tới hết năm 2024
    
        Ứng dụng và phát triển Tài nguyên Giáo dục Mở (OER) tại Việt Nam
    
        Dữ liệu để phân loại AI
    
        Nhà khoa học AI hàng đầu của Meta cho biết thành công của DeepSeek cho thấy 'các mô hình nguồn mở đang vượt trội hơn các mô hình độc quyền'
    
        Mark Zuckerberg: DeepSeek cho thấy vì sao nước Mỹ phải là ‘tiêu chuẩn nguồn mở toàn cầu’ của AI; không có lý do gì để suy nghĩ lại về việc chi tiêu
    
        ‘Tầm quan trọng của các kỹ năng tư duy phản biện và linh hoạt về năng lực AI của sinh viên TVET’ - bản dịch sang tiếng Việt
    
        50 công cụ AI tốt nhất cho năm 2025 (Đã thử và kiểm nghiệm)