"سمینار" رشته برق: بررسی چندین روش بازشناسی حالت گفتار

متن کامل پایان نامه مقطع ارشد مهندسی برق

با عنوان : بررسی چندین روش بازشناسی حالت گفتار

در ادامه مطلب می توانید تکه هایی از ابتدای این پایان نامه را بخوانید

و در صورت نیاز به متن کامل آن می توانید از لینک پرداخت و دانلود آنی برای خرید این پایان نامه اقدام نمائید.

دانشگاه آزاد اسلامي
واحد تهران جنوب
دانشكده تحصيلات تكميلي
“M.Sc” سمينار براي دريافت درجه كارشناسي ارشد
مهندسي برق- الكترونيك
عنوان :
بررسي چندين روش بازشناسي حالت گفتار

برای رعایت حریم خصوصی اسامی استاد راهنما،استاد مشاور و نگارنده درج نمی شود

تکه هایی از متن به عنوان نمونه :

(ممکن است هنگام انتقال از فایل اصلی به داخل سایت بعضی متون به هم بریزد یا بعضی نمادها و اشکال درج نشود ولی در فایل دانلودی همه چیز مرتب و کامل است)

چكيده
در سالهاي اخير، شناخت حالات گفتار انساني بعلت تنوع كاربردهاي آن، موجب افزايش استفاده از
چنين تكنولوژي شده است. در اين تحقيق ابتدا تعريفي از حالت ارائه شده، سپس به برخي مشكلات
موجود در اين كار كه تشخيص را سختتر ميكند پرداخته و راهحلهاي متفاوت ارائه شده در اين زمينه
معرفي ميشود. بعد از آن به الگوريتمها و روشهاي ارائه شده در زمينه بازشناسي حالت در گفتار
پرداخته و چند نمونه از تحقيقاتي كه در اين زمينه صورت گرفته ارائه شده است. همچنين به برخي مزايا
و معايب هر روش و اينكه هر كدام از اين روشها براي چه شرايطي مفيدترند نيز، اشاره خواهد شد. در
نهايت برخي كاربردهاي آن نيز مورد بررسي قرار ميگيرد. نتايج نشان ميدهد كه شبكههاي عصبي مي-
توانند بهعنوان يك دستهبندي كننده خوب براي شناسايي حالت گفتار استفاده شوند. نتايج اين روشها
زماني بهتر خواهد بود كه حالت گفتار ذكر شده داراي تفاوتهاي قابل توجهي نسبت به ساير حالات باشد.

مقدمه
چارلز داروين نخستين كتاب درباره بيان احساسات انسان و حيوان را در قرن نوزدهم نگاشت. پس از اين
اثر مهم روانشناسان و متخصصان هوش مصنوعي به تدريج به جمع آوري دانش و اطلاعات در اين زمينه
پرداختند. اخيراً نيز موج جديدي از توجه روانشناسان و متخصصان هوش مصنوعي را بر انگيخته است.
بعضي از دلايل اين رنسانس عبارتند از :
پيشرفت فناوري در ثبت, ذخيره و تحليل اطلاعات صوتي و تصويري, پيشرفت در فناوري حسگر
و كامپيوتر هاي فرسايش پذير , بالا رفتن سطح فناوري ارتباط انسان و رايانه از نقطه none intrusive هاي
و كليك به حس و عاطفه و نرم افزار هاي زنده وار مخصوص كمك به انسان و رباتهاي حيوان شكل
هاي شركت سوني كه قادر به درك و بيان احساسات مي Aibo , هاي شركت تايگر Furbi خانگي از قبيل
تحت عنوان محاسبه عاطفي ايجاد (AI) باشد. به تازگي زمينه هاي تحقيقاتي جديدي در هوش مصنوعي
شده است. در حوزه رمز گشايي و توصيف و به تصوير كشيدن حالات در گفتار، تا كنون روانشناسان به
آزمايشات تجربي بسياري دست زده اند و فرضيه هايي ارائه داده اند و از طرف ديگر محققان هوش
مصنوعي نيز در شاخه هاي زير تحقيقات ارزنده اي انجام داده اند:
ساخت و تركيب حالات گفتار, باز شناسايي حالات گفتار و استفاده از نرم افزار هايي براي رمز گشايي و
بيان حالات. انگيزه ما تحقيق و كاوش در راههاي استفاده از بازشناسي حالات گفتار است كه مي تواند
در تجارت (به خصوص كاربرد آن در يك مركز تلفن), يك كاربرد بالقوه آن تشخيص حالت گفتاري در
يك مكالمه تلفني و ايجاد فيدبك به يك اپراتور يا سرپرست به منظور نمايش باشد. كاربرد ديگر آن
ذخيره پيامهاي صوتي طبق حالت بيان شده توسط تماس گيرنده مي باشد. و كاربرد ديگر آن استفاده از
محتواي حالت احساسي مكالمات جهت ارزيابي عملكرد اپراتور است.
شناسايي خودكار حالت گفتار با توجه با حالات صورت، حركات بدن و يا ويژگي هاي گفتار از
اميدبخش ترين روش هاي بازشناسي حالت گفتار ثابت شده است. بخصوص در زمينه سيستم هاي
امنيتي در سالهاي اخير علاقه مندي هاي بسياري مشاهده شده است.
حال مي خواهيم بدانيم كه منظور از حالت در گفتار چيست؟ اگر تا كنون در چند سخنراني شركت كرده
باشيد خواهيد ديد كه برخي از سخنراني ها جذاب و برخي خسته كننده مي باشند. اين موضوع علاوه بر
موضوع سخنراني به نحوه بيان سخنران نيز بستگي دارد. اگر سخنران گفتاري يكنواخت داشته باشد
همانند يك ربات خواهد بود، كه باعث خواب آلودگي شنونده مي شود. بنابراين سخنرانان حرفه اي با تغيير آهنگ گفتار خويش و با حركات به موقع دست، سر و بدن خويش، با تاكيد روي برخي كلمات،
بيان برخي جملات با تعجب برخي با افسوس و… حال و هواي سخنراني را تغيير مي دهند. اين تغييرات
در نحوه بيان جملات و كلمات را “حالت در گفتار” گويند. بعبارت ديگر اداي جملات به هر شكلي غير
از حالت عادي و يكنواخت بعنوان يك حالت شناخته مي شود. حالات مختلف ممكن از قبيل: خشم،
تنفر، ترس، شادي، غم، هيجان، آرامش، كسالت، افسردگي و … مي باشند. حتي در برخي از مواقع در
مورد ميزان يك حالت بحث مي شود، مثلا شاد با خيلي شاد را در نظر مي گيرند. اضافه كردن حالت
طبيعي به اين حالت ها معقول بنظر مي رسد تا هر كدام از اين حالت ها درك شوند. يعني براي در نظر
گرفتن يك حالت جديد يك سري تغييرات بايد نسبت به يك مبدا وجود داشته باشد و در اينگونه كار ها
مبنا حالت طبيعي و بدون حالت مي باشد. اين طبقه بندي بعنوان اساس مقايسه استفاده مي شود. امروزه
آمار عمومي از يك عبارت بعنوان اساس كار است، اگر چه سعي در استفاده از ويژگيهاي ذاتي موجود را
دارند.
اغلب براي تشخيص مثلا: دروغ، بازي هاي ويديويي و كمك روانپزشكي از بازشناسي حالت گفتار
استفاده شده است. براي اطمينان از تشخيص صحيح معقول است كه تعداد و نوع حالت هاي قابل
تشخيص محدود و متناسب با نياز در آن كاربرد خاص باشد(براي طبقه بندي مناسب). هنوز بصورت فني
هيچ استاندارد مشخصي براي تشخيص و طبقه بندي حالت هاي گفتار نداريم. اغلب يك روش تميز
دادن، ميان يك مجموعه تعريف شده از حالت هاي گفتار مجزا است و عقيده مشتركي(واحدي)براي
نام شش حالت : 1- خشم 2- تنفر Mpeg تعداد و اسامي آنها موجود نيست. اين موضوع در استاندارد 4
-3 ترس 4- شادي 5- غم 6- هيجان را در بر دارد. از طرفي اين تحقيقات در هر زبان و لهجه اي خاص
خود مي باشد و چنانچه از مبنا دور گرديم دقت بازشناسي كاهش مي يابد. مثلا نمي توان سيستمي كه
براي زبان انگليسي طراحي شده است را براي زبان فارسي بكار برد. زيرا پايگاه داده اي كه براي زبان
انگليسي طراحي شده ويژگي هاي خاص خود را دارد كه براي زبان فارسي متفاوت است و كاربردي
ندارد. البته ممكن است الگوريتم كاري آنها مشابه باشد.
اطلاعات غير كلامي كه در حالات، حركات و اداي چهره انسان پديدار مي گردد، نقش مهمي درارتباطات
بشري دارد. به ويژه افراد با استفاده از اطلاعات حالت يا عاطفي راحتتر با يكديگر ارتباط برقرار مي كنند.
بعنوان مثال: در موقعيتهاي تجاري علايق مشتري كه ناشي از حالات وي حدس زده مي شود ممكن است
گاهي پيشنهادات سودمندي را براي طرح ريزي استراتژي هاي بعدي به طرف معامله بدهد. واضح است كه تبادل اطلاعات غير كلامي همانند حالات و عواطف در تمامي اشكال ارتباطات مهم است و اهميت
آن در برخي مواقع بيش از اطلاعات كلامي مي باشد. به اين معنا كه ارتباطات غير كلامي بنيان ارتباط
بشري است. علاوه بر ارتباطات انسان با انسان، ارتباطات بشري از طريق كامپيوتر و ارتباط ميان انسان و
ماشين نيز بيش از پيش رواج يافته است. براي دستيابي به رابطه نزديكتر و انسان گونه ميان انسان و
ماشين، كاربرد اطلاعات كلامي ونيز غير كلامي ضروري است. تا كنون حالات و يا عواطف در حوزه
هاي روانشناسي و يا فلسفه مورد مطالعه قرار گرفته اند. اگر چه با افزايش اهميت اطلاعات غير كلامي در
زمينه رابطه انسان با ماشين، مدتي است كه اين امر بعنوان موضوع تحقيقي در حوزه مهندسي نيز مورد
بحث و بررسي قرار گرفته است.

تعداد صفحه : 163

قیمت : یازده هزار تومان

 

***

—-

:       

****         baharfile@zoho.com

جستجو در سایت : کلمه کلیدی خود را وارد نمایید :

 
 

مطالب مشابه را هم ببینید

 

فایل مورد نظر خودتان را پیدا نکردید ؟ نگران نباشید . این صفحه را نبندید ! سایت ما حاوی حجم عظیمی از پایان نامه های دانشگاهی است. مطالب مشابه را هم ببینید. برای یافتن فایل مورد نظر کافیست از قسمت جستجو استفاده کنید. یا از منوی بالای سایت رشته مورد نظر خود را انتخاب کنید و همه فایل های رشته خودتان را ببینید

1 پاسخ

ارسال یک پاسخ

می خواهید در گفتگو ها شرکت کنید؟
Feel free to contribute!

پاسخ دهید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *