روش تحقیق دیتاک در پیشبینی نتایج انتخابات 1403
این روزها همزمان با اعلام نتیجه دور دوم، تب انتخابات و در داغترین حالت خود به سر میبرد. با توجه به سوالات پرشمار و دغدغه شما همراهان عزیز مبتنی بر چگونگی انجام افکارسنجیهای انتخاباتی دیتاک، بر آن شدیم تا به صورت مفصل شرحی از روش تحقیق پژوهشمان خدمت شما ارائه کنیم.
بسیاری از دادههای منتشر شده درباره بازتاب انتخابات ریاست جمهوری 1403 در شبکههای اجتماعی، محدود به گردآوری دادهها و نمایش آماری آن بوده است. این در حالی است که جمعآوری صرف داده از فضای مورد مطالعه را نمیتوان ذیل روشهای علمی و معتبر توصیف کرد.
• از حیث سطح تحلیل، پژوهشها اغلب قابل تعریف در سه سطح توصیف، تحلیل و تبیین یافتههاست و گردآوری و بازنمایی اطلاعات در بهترین حالت، ذیل پژوهشهای توصیفی قرار میگیرد.
• مجموعه دیتاک، در قالب گزارش دماسنج انتخابات، میدان رقابت، آرای نامزدها و میزان مشارکت، علاوه بر گردآوری نظاممند یافتهها، اقدام به توصیف و تحلیل دادههای موجود در شبکههای اجتماعی کرده است.
• پیشبینی میزان مشارکت و میزان آرای نامزدها از طریق رصد طولی (از زمان ثبت نام نامزدها تا روز برگزاری انتخابات) محتوای تولیدشده در شبکههای اجتماعی، نیازمند ملاحظات فنی و روششناسی متعددی بوده است که بسیاری از موسسات پژوهشی یا رقبا، از ریسک انجام آن در طول انتخابات امتناع داشتهاند.
• مواردی مانند فیلترینگ، القای عدم ارتباط دادهها با واقعیت، فعالیت رباتها در همه بسترها، شناخت اقتضائات هر بستر و فعالیت کاربران و گروههای سیاسی و وجود کاربران سازمانی از جمله محدودیتهای پیش رو برای جمعآوری، توصیف، تحلیل و پیشبینی انتخابات بود که دیتاک در خلال انتخابات با وجود این موانع، اقدام به ارائه گزارشهایی منظم درباره انتخابات 1403 کرده است.
• حال برای آن دسته از پژوهشگران، کنشگران، فعالین حوزه مارکتینگ و علاقهمندان به این موضوع، شرح جزئیات روششناسی و چگونگی انجام کار به قرار زیر است:
مقدمه
امروزه در حقیقت شبکههای اجتماعی به مثابه ساحت عمومی قلمداد میشود که افراد اقدام به تولید محتوا پیرامون تجربه زیسته و افکار و نگرشهای خود میکنند. درواقع کنشگری افراد در شبکههای اجتماعی بازنمایی از رفتار و نگرشهای عینی آنها در فضای جامعه است. حتی به دلیل شرایط خاص جامعهای چون ایران، بروز این کنشها در شبکههای اجتماعی در موارد زیادی ملموستر و شفافتر از فضای بیرونی است. از همین رو افکارسنجی بدون میانجی و واسطهگری با استفاده از بازنمایی واقعی و تکنیکال از نظرات کاربران در شبکههای اجتماعی، میتواند بسیاری از سوگیریهای روشهای شناختی در روشهایی چون مردمنگاری میدانی، پرسشنامه، مصاحبه، پیمایش تلفنی و غیره را نداشته باشد. زیرا رجوع مستقیم و بیواسطه از طریق فهم دلالتهای معنایی و ضمنی محتوای کاربران از طریق افکارسنجی میسر میشود. اگرچه شبکههای اجتماعی پوشش دهندهی تمام جامعه ایران نیستند، اما تقریباً بخشهای گسترده و تاثیرگذار جامعه ایران را پوشش میدهند. مهمترین قشر و طبقه ایران به لحاظ تاریخی یعنی طبقه متوسط را که به لحاظ جمعیتی و هم اثرگذاری مهم است، بیش از دیگر گروهها درگیر میکند. از این حیث کنش در سپهر سیاسی ایران به ویژه از طریق شبکههای اجتماعی از گذشته معنادارتر و نزدیکتر نسبت به سایر روشها است.
روششناسی
در تحقیقات علوم اجتماعی پارادایمها، رویکردها، روشها و تکنیکهای متنوعی برای ارائه تصویری از واقعیتهای اجتماعی انجام میشود. تقسیمبندیهای فوق کاملاً درهمتنیدهاند، به این معنا که استفاده از یک پارادایم، ضرورتاً به انتخاب دایره محدودی از رویکردها، روشها و تکنیکهای خاص منجر میشود. پژوهشهای افکارسنجی ذیل پارادایم پوزیتیویستی و روش کمی قرار میگیرد و برای انجام آن از تکنیکهایی مانند نظرسنجی و پیمایش استفاده میشود.
عمدهترین روش افکارسنجی و نگرشسنجی در سطح جهان پیمایش و در موارد کلان، نظرسنجی است. همان طور که گفته شد این روش، عمدتاً در سطح توصیفِ صرف متوقف میشود. این روشها دارای معایبی مانند هزینه بالا و پاسخ محافظهکارانه خصوصاً در جوامعی مانند ایران است. بسیاری از پاسخگویان در ایران خصوصاً در نظرسنجیهای تلفنی از ارائه پاسخ واقعی امتناع به عمل میآورند و حتی در مواردی پاسخ گمراهکننده ارائه میکنند. از این جهت از دادههای موجود در شبکههای اجتماعی برای تکمیل، اصلاح و حتی در مواردی برای رد دادههای احصاء شده در نظرسنجیها استفاده می شود و برخی برای نگرش سنجی از این دادهها استفاده می کنند.
از این حیث سویهی معرفتشناسی و گزارههای نظری، به واسطه روش علمی و مبتنی بر واقعیت معتبر میشود. افکارسنجی عمومی در شبکههای اجتماعی به واسطه بهرهگیری از روش علوم اجتماعی محاسباتی یا رایانشی میسر میشود. از این حیث، این روش مبتنی با روشهاي تركيبي، که بر همگرايي پارادايمي و تلفيق برخي اصول هستيشناسی، معرفتشناسی و روششناسی پارادايمهاي مسلط روش كمي و كيفي در علوم اجتماعي به شمار میرود، قرار میگیرد. علوماجتماعی محاسباتی حوزهی میانرشتهای است که با بهرهگیری از محاسبات ریاضی، ابزارها و الگوریتمهای رایانشی و مفاهیم و نظریههای علوماجتماعی به استخراج دادهها و تحلیل آنها میپردازد که با وجود جدید بودن، این حوزه دارای تکنیکهای متعددی است که بخشی از آن ترکیبی و برعهده پژوهشگر متخصص در این زمینه است.
دیتاک، انتخابات و روش انجام کار
حال، دپارتمان تحلیل دیتاک با استفاده از تحلیل کلانداده شبکههای اجتماعی داخلی و خارجی از جمله توییتر، کامنتهای اینستاگرام و تلگرام، ایتا و غیره با استفاده از علوم اجتماعی محاسباتی (باتوجه به وزندهی و لحاظ کردن اقتضائات هر بستر) مثل دورههای پیشین به افکارسنجی و پیشبینی انتخابات پرداخته است. بهرهگیری از تکنیک دادهکاوی و تحلیل احساس نظرات کاربران پیرامون انتخابات با استفاده همزمان از یادگیری با نظارت ماشین، سوگیریها و خطاهای شناختی و سیستمی را کاسته است و به دقیقترین روش مورد سنجش و کنکاش قرار داده است که پیشبینیهای دقیق گذشته شاهدی بر این مدعا است. تکنیک دادهکاوی و تحلیل احساس که به پیچیدگی متون، جهتگیری، محتوای موضوعی و آمار آنها میپردازد، از تکنیکهای رایج و متأخر در علوم اجتماعی محاسباتی در دنیا میباشد.
گزارشهای انتخاباتی ارائهشده از سوی دیتاک، اعم از گزارش میدان رقابت، دماسنج انتخابات، آرای نامزدها و میزان مشارکت، ذیل بازنمایی واقعی و نگرشسنجی قرار میگیرد. در ذیل پژوهشهای توصیفی نیز اما خصوصاً با عطف بر متغیر زمان و دعوای تحقیق، دارای سه سطح مختلف گذشتهنگر، معطوف به حال (مقطعی) و آیندهنگر هستند.
در مورد افکارسنجی انتخاباتی بایستی اشاره کرد که افکارسنجی معطوف به آینده به معنای سنجش یک وضعیت یا نگرش در زمان آینده است. این رویکرد را نیز می توان به دو بخش تقسیم کرد: پیشبینی و پیشگویی. پیش بینی مبتنی بر شواهد میباشد اما پیشگویی عمدتاً معطوف به تخمین و امری دلبخواهی است.
گزارشهای انتخاباتی مجموعه دیتاک ذیل پژوهشیهای توصیفی معطوف به آینده (پیشبینی) است. در این گزارشها بر اساس دادههای موجود در شبکههای اجتماعی، تصویری طولی از نگرش کلی کاربران را ارائه کرده است. دیتاک در این گزارشها، پیش از تایید صلاحیت نامزدها تا زمان انتخابات، اقدام به جمع آوری و تحلیل داده از شبکههای اجتماعی و ارائه یک برآورد از میزان مشارکت در انتخابات کرده است که در نوع خود بیسابقه است. بیسابقه بودن این گزارشها از آن جهت است که بسیاری از موسسات پژوهشی، با وجود دسترسی به دادههای موجود در شبکههای اجتماعی از ارائه هر نوع داده (ولو معطوف به زمان حال) امتناع می کنند. مواردی مانند القای عدم ارتباط دادهها با واقعیت، فعالیت رباتها و عدم بهرهگیری از نیروهای متخصص علوم انسانی از محدودیتهای این شیوه از پژوهش است. برای نمونه در موضوع باتها، با بهرهگیری از تجربیات گذشته و تاثیرگذاری باتها در دادههای مربوط به برگزیت (خروج بریتانیا از اتحادیه اروپا) یا انتخابات 2016 ایالات متحده آمریکا که تاثیر بالایی در تحریف نتایج انتخابات داشتند، اثرگذاری باتها و تاثیرگذاری آنها در دادهها نتایج واقعی انتخابات و نظرسنجیهای پیشین را با خدشه زیادی وارد ساخت.
از این روی شبکههای اجتماعی میتواند تاثیر بسزایی در نتایج انتخابات داشته باشد و می تواند به نوع کنشگری کاربران در عرصه انتخابات تاثیر بگذارد. نمونه مشخص آن، تاثیر کنشگری کاربران در بسترهای فیس بوک و توئیتر (1388)، تلگرام و توئیتر (1392، 1396) و توئیتر و اینستاگرام در انتخابات 1400 و 1402 می توان نام برد.
نتیجهگیری
در حقیقت همان طور که گفته شد افکارسنجی نظرات کاربران پیرامون انتخابات به صورت بازنمایی واقعیت صورت گرفته است و به فضای عینی و واقعی جامعه بسیار نزدیک است. چراکه بازنمایی افکار عمومی بدون هیچ گونه دخل و تصرف در دادهها و با اصل بیطرفی ارزشی بدون هیچگونه جهتگیری به نفع گروهها و جریانات صورت گرفته است. از این حیث از لحاظ هدف، کاملاً کاربردی و از لحاظ رویکرد این کار با استفاده از رویکرد توصیفی که به توصیف واقعیت مبتنی بر آینده معطوف است، استوار میباشد. توصیف واقعیت مبتنی بر آینده در حقیقت نوعی پیشبینی دادهمحور است که رفتار و نگرش احتمالی نزدیک به واقعیت کاربران و جامعه ایران را میسنجد. در نتیجه انتشار گزارشهای انتخاباتی در این مرحله به پرسش چیستی پاسخ داده است، اما فراسوی گزارههای تحلیلی و چرایی بروز و ظهور این رفتارها در این مرحله پرداخته نشده است. با این حال دپارتمان تحلیل دیتاک با بهرهگیری از متخصصان علوم انسانی و اجتماعی قابلیت تحلیل در این سطوح را داراست.
برای آشنایی با چگونگی تحلیل کلاندادهها در شبکههای اجتماعی و روش و تکنیکهای مورد استفاده بنگرید به برخی مقالات معتبر خارجی زیر:
Big data and social media analytics.
Text mining for social science – The state and the future of computational text analysis in sociology.
impact of big data and social media on society.
Computational social science: CSCW in the social media era.
Text Mining for Qualitative Data Analysis in the Social Sciences.
Social media, sentiment and public opinions: Evidence from #Brexit and #USElection
پینوشت: زحمت نگارش این پست را معین کاظمی، همکار عزیزمان در تیم تحلیل داده دیتاک کشیده است.