Li et al., (2023) เสนอเทคนิคการกระตุ้นเตือนแบบใหม่เพื่อเป็นแนวทางที่ดียิ่งขึ้นแก่ LLM ในการสร้างบทสรุปที่ต้องการ
นโยบาย LM ที่ปรับเปลี่ยนได้ได้รับการฝึกอบรมเพื่อสร้างแรงกระตุ้น/คำแนะนำ เห็นการใช้ RL มากขึ้นเพื่อเพิ่มประสิทธิภาพ LLM
รูปด้านล่างแสดงให้เห็นว่า Directional Stimulus Prompting เปรียบเทียบกับการกระตุ้นแบบมาตรฐานอย่างไร LM นโยบายอาจมีขนาดเล็กและได้รับการปรับให้เหมาะสมเพื่อสร้างคำแนะนำที่เป็นแนวทางสำหรับ LLM ที่ถูกแช่แข็งแบบกล่องดำ
ที่มาของภาพ: Li et al., (2023)
Full example coming soon!