Directional Stimulus Prompting
Theo: https://www.promptingguide.ai/techniques/dsp
Li và cộng sự (2023) đề xuất một kỹ thuật nhắc mới để hướng dẫn LLM tốt hơn trong việc tạo ra bản tóm tắt mong muốn.
Một LM chính sách có thể điều chỉnh, được đào tạo để tạo ra kích thích/gợi ý. Xem RL được sử dụng nhiều hơn để tối ưu hóa LLM.
Hình dưới đây cho thấy sự so sánh giữa Lời nhắc Kích thích Định hướng (Directional Stimulus Prompting) với lời nhắc tiêu chuẩn. LM chính sách có thể nhỏ và được tối ưu hóa để tạo ra các gợi ý hướng dẫn một LLM đóng băng hộp đen.

Image Source: Li et al., (2023)
Ví dụ đầy đủ sẽ sớm có!
Về ‘Kỹ thuật viết lời nhắc’ ………. Phần trước ………. Phần tiếp theo
Li et al., (2023) proposes a new prompting technique to better guide the LLM in generating the desired summary.
A tuneable policy LM is trained to generate the stimulus/hint. Seeing more use of RL to optimize LLMs.
The figure below shows how Directional Stimulus Prompting compares with standard prompting. The policy LM can be small and optimized to generate the hints that guide a black-box frozen LLM.
Full example coming soon!
Dịch: Lê Trung Nghĩa
letrungnghia.foss@gmail.com
Tác giả: Nghĩa Lê Trung
Ý kiến bạn đọc
Những tin mới hơn
Những tin cũ hơn