چکیده |
کاربرد روزافزون سیستمهای کاشت حلزونی جهت توانبخشی ناشنوایان، توجه مهندسان را به این زمینه علمی معطوف کرده است. یکی از مهمترین بخشهای کاشت حلزونی، قسمت پردازشگر گفتار آن است. وظیفه این قسمت استخراج اطلاعات لازم از سیگنال صوتی است. این اطلاعات باید به گونه-ای باشد که بیمار (استفاده کننده از کاشت حلزونی) قادر به درک اطلاعات شنیداری باشد. در حال حاضر الگوریتمهای پردازش گفتاری وجود دارد که مشکل فهم گفتار را در شرایط بدون نویز حل کرده است، ولی با قرار گرفتن در شرایط واقعی که نویز جزء لاینفک هر محیطی است، بیمار دچار مشکل میشود. یکی از مشکلات فعلی دیگر، درک سیگنالهای موسیقی و یا لحن گفتار گوینده است. در این پژوهش، پس از مطالعه الگوریتمهای پردازش گفتار CIS،DRNL ،PP و ZC و بررسی نقاط ضعف و قوت آنها، الگوریتم پردازشی از تلفیق و اصلاح دو الگوریتم DRNL و PP ارائه شده است و مورد ارزیابی و مقایسه با الگوریتمهای مذکور قرار گرفته است. از مسائل مهم در زمینه کاشت حلزونی نحوه ارزیابی الگوریتمهای پردازش سیگنال است. نحوه ارزیابی باید به گونهای باشد که براساس هدف مورد نظر، قابل قبول و قابل سنجش باشد. در این پژوهش شیوه ارزیابی الگوریتمها هم مورد بررسی قرار گرفته است؛ به عبارت دیگر، علاوه بر ارزیابی عملکرد الگوریتمهای پردازش گفتار با شیوه-های رایج اسپکتروگرام و پرسشنامه، از شیوه ارزیابی دیگری هم استفاده شده است. در این شیوه، عملکرد الگوریتمها براساس شاخصهایی که در درک موسیقی و لحن گفتار اهمیت دارند، هم مورد بررسی قرار گرفته است و بر اساس آن، ویژگیهای فرکانس pitch، فرکانسهای فرمنت و پارامتر LPC از سیگنالهای گفتار استخراج شده و سپس با مقایسه مقادیر کمی این ویژگیها الگوریتمهای پردازش گفتار مورد ارزیابی قرار گرفته است. مزیت این شیوه ارزیابی این است که قابلیت کمیسازی در آن وجود دارد و موجب بهبود شیوه ارزیابی عملکرد سیستم میشود. نتایج به دست آمده از مقایسه سیگنال اصلی و سیگنال سنتز شده با استفاده از شیوههای ارزیابی مذکور حاکی از این است که الگوریتم DRNL_PP ارائه شده توانایی قابل قبولی در انتقال محتوای مفاهیم داشته و همچنین نسبت به الگوریتمهای مذکور، عملکرد مناسبتری در شرایط نویزی دارد و موجب بهبود درک لحن گفتار و موسیقی میشود.
|