برآورد سن از طریق ویژگی های گفتار انسان با استفاده از شبکه های عصبی

برآورد سن از طریق ویژگی های گفتار انسان با استفاده از شبکه های عصبی


 چکیده:

برآورد سن از طریق ویژگی های گفتار انسان یک موضوع جالب در تشخیص اتوماتیک صدا است. اگرچه چندین مطالعه در زمینه برآورد سن گوینده وجود دارد اما نیاز به مطالعات بیشتر به ویژه برای گویندگان فارسی زبان وجود دارد. در برآورد سن مانند سایر سیستم های پردازش صدا ما با دو چالش روبه رو هستیم ابتدا پیدا کردن روشی مناسب برای استخراج ویژگی های صدا و سپس انتخاب یک روش قابل اعتماد برای الگوی طبقه بندی.در این پایان نامه ما یک سیستم تخمین سن برای طبقه بندی چهار گروه سنی مختلف پیشنهاد کردیم. ضرایب پیش بینی خطی ادراکی ( PLP ) و ضریب کپسترال مل فرکانس (MFCC ) به عنوان ویژگی های گفتار استخراج شدند و مدل MLP برای روش طبقه بندی استفاده شد. در نهایت، نتایج حاصل از این تحقیق با روش SVM مقایسه شد. و توانستیم با کمک شبکه عصبی از نوع MLP درصد خطا را نسبت به شبکه عصبی از نوع SVM ، به میزان قابل توجهی بهبود دهیم. هدف اصلی ما ایجاد یک سیستم خودکار سریع جهت تخمین سن افراد و همچنین بالا تربردن دقت تخمین سن می باشد.

کلیدواژه ها : تخمین سن، ماشین بردار پشتیبان، تشخیص خودکار گفتار، ضرایب پیش بینی خطی ادراکی، ضرایب کپسترال مل فرکانسی.


تعداد صفحات: 58

قالب: PDF

قیمت 25000 تومان


پرداخت  هزینه این پژوهش

نظرات 0 + ارسال نظر
برای نمایش آواتار خود در این وبلاگ در سایت Gravatar.com ثبت نام کنید. (راهنما)
ایمیل شما بعد از ثبت نمایش داده نخواهد شد