เปเปอร์แรกผมออกแล้วนะ
เวลาใช้ AI เขียนโค้ด มันเอาโค้ดมีลิขสิทธิ์ใส่เข้าไป ซึ่งมันอาจจะ output จากงานมีลิขสิทธิ์ได้
ก็เลยทดลองวิธีใหม่ เอา gemini ตีโจทย์เป็นคำสั่ง แต่ไม่เขียนโค้ด แล้วเอาโมเดลที่ติดลิขสิทธิ์น้อยลงมาเขียนโค้ดจริงแทนเพื่อลดปัญหา
ปัญหาในตอนนี้คือ โมเดลที่ติดลิขสิทธิ์น้อยยังไม่ค่อยมีมากเท่าไรนัก และคุณภาพไม่ดีเท่าไร แต่จากผลการทดสอบก็พบว่ามันทำโจทย์ผ่านมากขึ้น 20% ด้วยเทคนิคนี้
Applying the Chinese Wall Reverse Engineering Technique to Large Language Model Code Editing
Large language models for code (Code LLM) are increasingly utilized in programming environments. Despite their utility, the training datasets for top LLM remain undisclosed, raising concerns about potential copyright violations.arXiv.org
thep
in reply to Win • • •