การพัฒนาเทคนิคการจำแนกเสียงพูดโดยการวิเคราะห์แนวทางเดินเสียง – RMUTT Research Repository:คลังข้อมูลงานวิจัย

DEVELOPMENT CLASSIFY CONTINUOUS SPEECH TECHNIQUE USING SPEECH TRAJECTORY ANALYSIS

โดย สิทธิชัย จีนะวงษ์

ปี 2552

บทคัดย่อ

ระบบการจำแนกเสียงพูดแบบคำต่อเนื่องเป็นการจำแนกเสียงพูดในจำนวนหลายพยางค์ ซึ่งต้องอาศัยแบบอ้างอิงสำหรับการจำแนก ทั้งนี้หากเสียงพูดคำต่อเนื่องมีจำนวนมากก็จะต้องมีแบบอ้างอิงสำหรับการจำแนกจำนวนมากเช่นเดียวกัน ดังนั้นถ้าสามารถแยกสัญญาณเสียงแต่ละพยางค์ของคำต่อเนื่องออกจากกันได้ ก็สามารถนำสัญญาณเสียงพยางค์นั้นๆ ไปใช้ในการจำแนก ด้วยการเปรียบเทียบกับแบบอ้างอิงคำโดดได้ ซึ่งจะเป็นการลดจำนวนแบบอ้างอิงลงไปได้อย่างมาก

วิทยานิพนธ์ฉบับนี้นำเสนอเทคนิคใหม่สำหรับการจำแนกเสียงพูดแบบต่อเนื่องโดยการวิเคราะห์วิถีการเคลื่อนที่ของสัญญาณเสียง สัญญาณเสียงจะถูกส่งผ่านตัวกรองความถี่สูง เพื่อแยกเป็นพยางค์ จากนั้นจะถูกนำมาหาคุณลักษณะเด่น ในลักษณะของสัมประสิทธิ์คู่เส้นสเปกตรัม (LSP) 10 อันดับ จากนั้นนำไปจำแนกเสียงพูด ด้วยการวิเคราะห์แนวทางเดินเสียง โดยการเปรียบเทียบกับคุณลักษณะเด่นสัมประสิทธิ์คู่เส้นสเปกตรัม 10 อันดับ ของเสียงพูดคำโดด

เสียงพูดที่ใช้ทดลอง จะใช้เสียงผู้พูดทั้งหมด 100 คน จากเสียงผู้ชาย 50 คน และเสียงผู้หญิง 50คน ออกเสียงพูดคนละ 1 ครั้ง ซึ่งได้ผลการแยกพยางค์เสียง สำหรับเสียง 2 พยางค์ เฉลี่ย 99.4% เสียง 3 พยางค์ เฉลี่ย 98.5% และเสียง 4 พยางค์ เฉลี่ย 95.87% ส่วนผลการทดสอบความแม่นยำในการจำแนกเสียงพูด สำหรับเสียง 2 พยางค์ ได้ผลเฉลี่ย 91.54% เสียง 3 พยางค์ ได้ผลเฉลี่ย 86.37% และเสียง 4พยางค์ ได้ผลเฉลี่ย 75.61%

DOWNLOAD : DEVELOPMENT CLASSIFY CONTINUOUS SPEECH TECHNIQUE USING SPEECH TRAJECTORY ANALYSIS