30,000 تومان
دیتاست شامل دو دسته دیتاست در حوزه ی موبایل و هتل است. فرمت هر دو فایل به صورت csv است.
دیتاست موبایل (تلفن همراه)
دیتاست موبایل شامل 6567 نظر یا دیدگاه در مورد چندین گوشی موبایل (تلفن همراه) است که از سایت های مختلف جمع آوری شده است. در این دیتاست هر نظر یا دیدگاه دارای یک تگ هست که نشان دهنده ی مثبت، منفی و خنثی بودن آن می باشد. مثبت با عدد 1، منفی با عدد -1 و خنثی با عدد 0 نشان داده شده است.
تعداد دیدگاه های مثبت، منفی و خنثی:
نمونه ای از نظرات افراد در مورد موبایل در دیتاست موجود را مشاهده می کنید:
دیتاست هتل
دیتاست هتل شامل 6433 نظر یا دیدگاه در مورد هتل های مختلف کیش است که از سایت های مختلف جمع آوری شده است. در این دیتاست، هر دیدگاه دارای تگی هست که میزان رضایت کاربران را بر اساس درصد نشان می دهد.
تعداد دیدگاه ها در درصدهای مختلف:
نمونه ای از دیدگاه درباره ی هتل را در دیتاست موجود مشاهده می کنید:
نظرکاوی چیست؟
با رشد سریع رسانههای اجتماعی مانند شبکههای اجتماعی، تالارهای گفتوگو، وبلاگها و وبسایتها، اطلاعات تولید شده توسط افراد حال افزایش است. این اطلاعات برای سازمانها و دیگر افراد دارای اهمیت است. سازمانها از طریق کاوش دیدگاه ها و نظرات افراد میتوانند به ترجیحات مشتریان پی برده و دیدگاه مشتریان را نسبت به سازمان یا محصول خود، ارزیابی کنند و در تصمیمگیریهای خود از آنها بهره برند، علاوه بر این شرکت ها و سازمان ها می توانند از ترند موجود در بازار آگاه شوند و همچنین به اطلاعاتی در مورد رقبای خود هم دست یابد. مشتریان نیز میتوانند قبل از خرید محصول یا استفاده از خدمت، از دیدگاه دیگر مشتریان نسبت به آن آگاه شوند.
نظرکاوی (opinion mining)، که با عنوان عقیده کاوی هم از آن یاد می شود، علمی است که با تحلیل خودکار نظرات، دیدگاههای افراد را شناسایی می کند و نظرات مثبت و منفی را آشکار سازد.
با توجه به اینکه امروزه دسترسی افراد به اینترنت بیشتر شده، افراد زیادی از اینترنت استفاده می کنند. در نتیجه توجه به استفاده از این حجم گسترده از داده ها، حائز اهمیت بوده و شرکت ها باید از این فرصت استفاده کنند و خود را با آن همگام کنند.
کاربردهای نظرکاوی
وقتی می خواهیم در مورد مسئله ای تصمیم بگیریم، نظر دیگران را درباره ی مسئله ی مورد نظر می پرسیم. در دنیای واقعی، کسب و کارها و سازمان ها به دنبال دانستن نظر مشتریان و عموم مردم در مورد محصولات و سرویس های خود هستند. خریداران قبل از خرید خود از نظر دیگر افرادی که آن محصول را خریده اند مطلع می شوند. همچنین در زمان انتخابات، افراد تمایل دارند که نظر دیگران را درباره ی کاندیدها بدانند. در گذشته وقتی کسی می خواست از نظر دیگران مطلع شود، به دوستان و خانواده ی خود مراجعه می کرد و یا اینکه اگر شرکت ها می خواستند از نظر مردم یا مشتریان مطلع شوند، یک نظرسنجی برگزار می کردند که فقط روی گروه محدودی تمرکز داشت.
با رشد فزاینده ی شبکه های اجتماعی در وب مانند فرومها، بلاگها، توئیتر، سایت های فروش و دیگر سایت ها، افراد و سازمان ها روز به روز بیش از گذشته به محتویات وب برای تصمیم گیری های خود وابسته می شوند. امروزه اگر کسی بخواهد از محصولی استفاده کند دیگر محدود به پرسیدن نظر دوستان و آشنایان خود نیست می تواند از نظرات افراد در سراسر دنیا استفاده کند. همچنین سازمان ها دیگر نیازی به برگزاری نظرسنجی ندارند، زیرا نظرات مردم به صورت عمومی در وب در دسترس است. چالشی که این جا وجود دارد مدیریت این حجم عظیم اطلاعات است. در نتیجه وجود روش های نظرکاوی ضرورت می یابد.
در سال های اخیر مشاهده کرده ایم که نظرات موجود در وب به تغییر شکل سازمان ها کمک کرده و همچنین این نظرات تاثیر زیادی در سیستم سیاسی و اجتماعی داشته است. در نتیجه مطالعه ی نظرات وب ضروری است. نظرات فقط روی وب وجود ندارند. بسیاری از سازمان ها دارای داده های داخلی شامل بازخورد جمع آوری شده از ایمیل ها و مراکز تماس و یا نظرسنجی های انجام شده توسط سازمان هستند.
تحلیل احساس و نظر کاوی در بسیاری از زمینه ها مانند شرکت هایی تولید کننده محصولات یا ارائه دهنده ی خدمات، مراکز درمانی، سرویس های مالی تا اتفاقات اجتماعی و انتخابات سیاسی وارد شده است. از جمله کاربردهای نظرکاوی را در ادامه مشاهده می کنید:
- پیش بینی فروش
- رتبه بندی محصولات
- پیش بینی انتخابات
- پیش بینی سود فیلم های سینمایی
- پیش بینی سهام
- بررسی روند بازار
- سیستم های توصیه گر
- شناسایی و فیلتر توهین
سطوح مختلف نظرکاوی
سطح سند: وظیفه این سطح مشخص کردن مثبت یا منفی بود کل سند است و هر نظر به صورت کامل به عنوان یک سند در نظر گرفته می شود.
سطح جمله: در این سطح مثبت، منفی و یا خنثی بودن هر جمله بررسی میشود. خنثی بودن اغلب به معنای این است که جمله یک دیدگاه نیست.
سطح عبارت: این سطح به تحلیل جزئیتر میپردازد و به انتخاب دقیق کلمات بستگی دارد. در دو سطح قبلی علایق افراد به طور جزئی و دقیق مشخص نمیشود. مسئلهای که در این سطح مطرح میشوند نظرکاوی مبتنی بر ویژگی است. در این سطح نظرات مورد بررسی قرار میگیرند تا ویژگیهایی که افراد دیدگاه خود را در مورد آن بیان کردهاند، شناسایی شوند و در نهایت احساسات افراد نسبت به این ویژگیها مشخص گردد. ویژگی های مهم یک محصول یا خدمت در این جا شناسایی و رتبه بندی می شوند.
انواع نظر
نظر مستقیم: نظری است که به بیان ویژگیهای یک محصول میپردازد و دیدگاه مثبت یا منفی شخص دارنده نظر را در مورد محصول نشان میدهد.
نظر مقایسهای: نظری است که به بیان شباهتها و تفاوتهای بین دو یا چند موجودیت میپردازد. در این حالت، ویژگیهای دو یا چند موجودیت با هم مقایسه میشوند.
نظرکاوی چگونه انجام می شود؟
برای نظرکاوی باید به شناسایی موارد زیر در یک نظر بپردازیم:
- کدام جمله یک دیدگاه است؟ جملات میتوانند بیانگر یک دیدگاه یا نشاندهندهی واقعیت باشند. هدف نظرکاوی یافتن جملههایی است که دیدگاه فرد را نشان میدهد.
- بررسی قطبیت: دیدگاه که میتواند مثبت، منفی یا خنثی باشد. در اینجا مثبت و منفی بودن دیدگاه تعیین می شود.
- بررسی اینکه قطبیت آن دیدگاه به کدام ویژگی محصول مربوط میشود. در این صورت میتوان مثبت یا منفی بودن دیدگاه افراد نسبت به آن ویژگی را مشخص کرد.
- بررسی مثبت یا منفی بودن کل دیدگاه: بعد از آنکه به بررسی قطبیت ویژگیهای جزئی محصول پرداختیم میتوان مشخص کرد احساس کلی فرد نسبت به آن محصول چگونه است.
- مشخص کردن هدف دیدگاه: ممکن است هدف یک دیدگاه کل محصول یا یکی از ویژگیهای آن باشد. حتی ممکن است هدف به محصول ارتباطی نداشته باشد.
مثال هایی از تکنیک ها و کاربردهای نظر کاوی در دنیای واقعی
تکنیک های زیادی برای نظرکاوی وجود دارد که از روش های با نظارت، بدون نظارت و لغت نامه برای نظرکاوی استفاده می کنند. در ادامه به بررسی برخی از ابزارهای موجود و تکنیک های استفاده شده در هر کدام از آنها، برای نظرکاوی می پردازیم.
- Review Seer: از Naïve Bayes برای دسته بندی نظرات در دو گروه مثبت و منفی استفاده می کند.
- Red Opal: نظرات را به منظور فهم بهتر در سطوح مختلف دسته بندی می کند.
- Wekaو LingPipe: از خوشه بندی برای شناسایی ویژگی های مهم استفاده می کند.
- LingPipe، LNTK، Weka و Pattern: از الگوریتم با نظارت برای دسته بندی داده ها استفاده می کنند.
chat_bubble_outlineنظرات
30,000 تومان
قوانین ثبت دیدگاه