پایان نامه کارشناسی ارشد مهندسی برق: شناسایی چند حالت گفتاری در زبان فارسی

متن کامل پایان نامه مقطع ارشد مهندسی برق

با عنوان : شناسایی چند حالت گفتاری در زبان فارسی با استفاده از ویژگی های نوای گفتار به کمک شبکه های عصبی

در ادامه مطلب می توانید صفحات ابتدایی این پایان نامه را بخوانید

و در صورت نیاز به متن کامل آن می توانید از لینک پرداخت و دانلود آنی برای خرید این پایان نامه اقدام نمائید.

دانشگاه آزاد اسلامي
واحد تهران جنوب
دانشكده تحصيلات تكميلي
“M.Sc” پاياننامه براي دريافت درجه كارشناسي ارشد
مهندسي برق ‐ الكترونيك
عنوان :
شناسايي چند حالت گفتاري در زبان فارسي با استفاده از ويژگيهاي نواي گفتار به
كمك شبكههاي عصبي
استاد راهنما :
دكتر غرويان
استاد مشاور :
دكتر شيخان
نگارش:
عليرضا ناظريه

 

 

چكيده
در سالهاي اخير، شناخت حالات گفتار انساني بعلت تنوع كاربردهاي آن، موجب افزايش استفاده از
چنين تكنولوژي شده است. در اين تحقيق ابتدا تعريفي از حالت ارائه شده، سپس به برخي مشكلات
موجود در اين كار كه تشخيص را سختتر ميكند پرداخته و راهحلهاي متفاوت ارائه شده در اين زمينه
معرفي ميشود. بعد از آن به الگوريتمها و روشهاي ارائه شده در زمينه بازشناسي حالت در گفتار
پرداخته و چند نمونه از تحقيقاتي كه در اين زمينه صورت گرفته ارائه شده است. همچنين به برخي مزايا
و معايب هر روش و اينكه هر كدام از اين روشها براي چه شرايطي مفيدترند نيز، اشاره خواهد شد. در
نهايت برخي كاربردهاي آن نيز مورد بررسي قرار ميگيرد. در اين تحقيق از شبكه هاي عصبيARTMAP 
فازي براي شناسايي چهار حالت عادي، خشم، شادي، و پرسشي و با استفاده از 52 ويژگي استفاده شده
است. نتايج نشان ميدهد كه شبكههاي عصبي ميتوانند بهعنوان يك دستهبندي كننده خوب براي
شناسايي حالت گفتار استفاده شوند. نتايج اين روشها زماني بهتر خواهد بود كه حالت گفتار ذكر شده
داراي تفاوتهاي قابل توجهي نسبت به ساير حالات باشد.
بر اين اساس دقت شناسايي حالت براي حالت عادي 87/76%، براي حالت سوالي 51/74%، حالت شادي 76/13%، و حالت خشم 93/65% به دست آمد.

مقدمه
چارلز داروين نخستين كتاب درباره بيان احساسات انسان و حيوان را در قرن نوزدهم نگاشت. پس از اين
اثر مهم روانشناسان و متخصصان هوش مصنوعي به تدريج به جمعآوري دانش و اطلاعات در اين زمينه
پرداختند. اين مسئله موج جديدي از توجه روانشناسان و متخصصان هوش مصنوعي را برانگيخته است.
كه بعضي از دلايل آن عبارتند از:
پيشرفت فناوري در ثبت، ذخيره و تحليل اطلاعات صوتي و تصويري، بالا رفتن سطح فناوري ارتباط
انسان و رايانه از نقطه و كليك به حس و عاطفه و نرمافزارهاي زندهوار مخصوص كمك به انسان و
هاي شركت سوني كه قادر به AIBO ، هاي شركت تايگر FURBI روباتهاي حيوان شكل خانگي از قبيل
درك و بيان احساسات ميباشند. به تازگي زمينههاي تحقيقاتي جديدي در هوش مصنوعي تحت عنوان
محاسبه عاطفي ايجاد شده است. درحوزه رمزگشايي و توصيف و به تصوير كشيدن حالات در گفتار،
تاكنون روانشناسان به آزمايشات تجربي بسياري دست زده و فرضيههايي ارائه دادهاند. از طرف ديگر
محققان هوش مصنوعي نيز در شاخههاي زير تحقيقات ارزندهاي انجام دادهاند:
ساخت و تركيب حالات گفتار، بازشناسي حالات گفتار و استفاده از نرمافزارهايي براي رمزگشايي و بيان

حالات استفاده ميشوند. هدف، تحقيق و كاوش در راههاي استفاده از بازشناسي حالات گفتار است كه
درتجارت، يك كاربرد بالقوه آن، ميتواند تشخيص حالت گفتاري، در يك مكالمه تلفني و ايجاد فيدبك
به يك اپراتور يا سرپرست، به منظور نمايش باشد. كاربرد ديگر آن ذخيره پيامهاي صوتي طبق حالت بيان
شده توسط تماس گيرنده ميباشد. كاربردي ديگر از آن، استفاده از محتواي حالت احساسي مكالمات،
جهت ارزيابي عملكرد اپراتور است.
شناسايي خودكارحالت گفتار، با توجه با حالات صورت، حركات بدن و يا ويژگيهاي گفتار يكي از
روشهاي بازشناسي حالت گفتار ميباشد. بخصوص در زمينه سيستمهاي امنيتي علاقهمنديهاي بسياري
مشاهده شده است.
حال بايد ديد، منظور از حالت در گفتار چيست؟ اگر تاكنون در چند سخنراني شركت كرده باشيد
خواهيد ديد كه برخي از سخنرانيها جذاب و برخي خستهكننده ميباشند. اين مشكل علاوه بر موضوع
سخنراني به نحوه بيان سخنران نيز بستگي دارد. اگر سخنران گفتاري يكنواخت داشته باشد همانند يك
روبات خواهد بود، كه باعث خوابآلودگي شنونده ميشود. بنابراين سخنرانان حرفهاي با تغيير آهنگ
گفتار خويش و با حركات به موقع دست، سر و بدن خويش، با تاكيد روي برخي كلمات، بيان برخي
جملات با تعجب برخي با افسوس و… حال و هواي سخنراني را تغيير ميدهند. اين تغييرات در نحوه
بيان جملات و كلمات را “حالت در گفتار” گويند. بعبارت ديگر اداي جملات به هر شكلي غير از حالت
عادي و يكنواخت بعنوان يك حالت شناخته ميشود. حالات مختلف از قبيل: خشم، تنفر، ترس، شادي،
غم، هيجان، آرامش، كسالت، افسردگي و … ميباشند. حتي در برخي از مواقع در مورد ميزان يك حالت
بحث ميشود، مثلا شاد با خيلي شاد در نظر گرفته ميشود. اضافه كردن حالت عادي به اين حالتها
معقول بنظر ميرسد تا هر كدام از اين حالتها درك شوند. يعني براي در نظر گرفتن يك حالت جديد
يك سري تغييرات بايد نسبت به يك مبدا وجود داشته باشد و در اينگونه كارها مبنا حالت عادي و بدون
حالت ميباشد. اين طبقهبندي بعنوان اساس مقايسه استفاده ميشود. امروزه آمار عمومي از يك عبارت
بعنوان اساس كار است، اگر چه سعي در استفاده از ويژگيهاي ذاتي موجود را دارند.
براي اطمينان از تشخيص صحيح، معقول است كه تعداد و نوع حالتهاي قابل تشخيص محدود و
متناسب با نياز در آن كاربرد خاص باشد(براي طبقهبندي مناسب). هنوز بصورت فني هيچ استاندارد
مشخصي براي تشخيص و طبقهبندي حالتهاي گفتار موجود نيست. اغلب تميز دادن، ميان يك مجموعه
تعريف شده از حالتهاي گفتار مجزا است، و براي تعداد و اسامي آنها ايدهء يكساني موجود نيست. از
طرفي اين تحقيقات در هر زبان و لهجهاي خاص خود ميباشد و چنانچه براي ساير زبانها استفاده شود،
دقت بازشناسي كاهش مييابد. مثلا نميتوان سيستمي كه براي زبان انگليسي طراحي شده است را براي
زبان فارسي بكار برد. زيرا پايگاه دادهاي كه براي زبان انگليسي طراحي شده ويژگيهاي خاص خود را
دارد كه براي زبان فارسي متفاوت است و كاربردي ندارد. البته ممكن است الگوريتم كاري آنها مشابه
باشد.
افراد با استفاده از اطلاعات حالت يا عاطفي راحتتر با يكديگر ارتباط برقرار ميكنند. و اهميت آن در
برخي مواقع بيش از اطلاعات كلامي ميباشد. با افزايش اهميت اطلاعات غير كلامي در زمينه رابطه
انسان با ماشين، مدتي است كه اين امر بعنوان موضوع تحقيقي در حوزه مهندسي مورد بحث و بررسي
قرار گرفته است. اگر رايانهاي بتواند هيجانات و حالات انساني را بهخوبي خود انسانها درك كند رابطه
فوق بهبود خواهد داشت.
براي مثال، رابطه ميان انسان و رايانه را ميتوان به گونهاي ترتيب داد كه واكنشهايي كه در برابر كاربران
نشان ميدهند، برحسب حالات عاطفي كاربر باشد. براي آگاهي از اينكه در يك عبارت چه نوع حالتي
نهفته است، تركيبي از فونتيكها (آواشناسيها)، و فيزيولوژي تكنولوژي بازشناسي حالت ميتواند مبنايي
براي يك مدل صوتي(گفتار) آماده سازد، كه بتواند كيفيت بازشناسي و سنتز گفتار را بهبود دهد.
برخي كاربردهاي مهم ديگر براي تكنولوژي بازشناسي حالات شامل سيستم گفتگوي اتوماتيك در مراكز
تلفن و برخي استفادههاي ويژه براي افراد ناتوان و پير نيز ميتوان نام برد. امروزه تحقيق حالت در گفتار
بطور عمده بر نمونههاي تك زبانه متمركز شده و كمتر در زمينه چند زبانه كار شده است. نواي گفتار يك
نمايشگر اوليه اطلاعات حالت گوينده است.
راهحلهاي بازشناسي حالت بستگي به حالتهايي دارد كه دستگاه ميخواهد بازشناسي نمايد. همچنين
علاقهمندي به كاربرد تكنولوژيهاي بازشناسي حالت براي سيستمهاي پاسخگويي صوتي متقابل،
مخصوصا براي مراكز تلفن ميباشد. اين سيستمها محاورهاي و از اين رو جملات معمولا كوتاه هستند.
براي طبيعيتر بودن مسئله، مسيرتحقيق بازشناسي حالت از آناليز گفتار ناآگاهانه گرفته ميشود. حركت
بعدي، معمولاً تلاش براي افزايش عملكرد سيستمهاي رابط ماشين و انسان مانند خدمات تلفني كنترل
صوتي است.
از مشكلات حالات ناآگاهانه در مقايسه با گفتارحقيقي برچسبزني آنها است ، زير ا دانستن حالات
حقيقي بطور قطعي غير ممكن ميشود.
مقايسه عملكرد بازشناسي حالت بدليل نبود پايگاه داده مشترك سخت است. نتايج دستههاي حالت پايه
مشترك، وابستگي به گوينده، حرفهاي يا مردمان عادي، سن فرد گوينده، محيط ضبط صدا، يا نوع
جملات و (كلمات يا عبارات) را در پايگاه داده بايد در نظر گرفت. مشكل ميتوان گفت كه كدام سيستم
در كل بهتر است. عملكرد بازشناسي حالت تا حد زيادي وابسته به اين است كه چگونه ميتوان ويژگي –
هاي مناسب مستقل از گوينده، زبان و متن را استخراج كرد.
براي بازشناسي از شبكههاي هوشمند استفاده ميشود كه از آن جمله شبكههاي عصبي مصنوعي، مدل-
هاي ماركوف مخفي، مدلهاي مخلوطكننده گوسي، درختهاي تصميمگيري، ماشينهاي بردار پشتيبان،
آناليز تفكيككننده خطي، آناليز تفكيككننده درجه دوم و … ميباشد.
در ادامه نتايج چند تحقيق كه از روشهاي مختلف براي منظورهاي متفاوت استفاده كرده است، بررسي
شده و برخي نكات ديگر در آنها مطرح خواهد شد.

تعداد صفحات: 112

قیمت : یازده هزار تومان

 

بلافاصله پس از پرداخت ، لینک دانلود به شما نشان داده می شود

و به ایمیل شما ارسال می شود.

پشتیبانی سایت :       

--------******** ****         baharfile@zoho.com

جستجو در سایت : کلمه کلیدی خود را وارد نمایید :

 
 

مطالب مشابه را هم ببینید

 

فایل مورد نظر خودتان را پیدا نکردید ؟ نگران نباشید . این صفحه را نبندید ! سایت ما حاوی حجم عظیمی از پایان نامه های دانشگاهی است. مطالب مشابه را هم ببینید. برای یافتن فایل مورد نظر کافیست از قسمت جستجو استفاده کنید. یا از منوی بالای سایت رشته مورد نظر خود را انتخاب کنید و همه فایل های رشته خودتان را ببینید

1 پاسخ

ارسال یک پاسخ

می خواهید در گفتگو ها شرکت کنید؟
Feel free to contribute!

پاسخ دهید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *