كلية التربية للعلوم الصرفة تقيم سمنر بعنوان تحليل البيانات الضخمة للتنبؤ بالمعلومات الشخصية والخصائص لمستخدمي تويتر
اقامت شعبة البعثات والعلاقات الثقافية في كلية التربية للعلوم الصرفة جامعة ديالى سمنر بعنوان ( تحليل البيانات الضخمة للتنبؤ بالمعلومات الشخصية والخصائص لمستخدمي تويتر ) وعلى قاعة الندوات والمؤتمرات في الكلية.
تضمن السمنر الذي اداره الدكتور احمد خضير عباس شرح البيانات الضخمة احد أهم المجالات في هندسة الكمبيوتر وتكنولوجيا المعلومات. وقد اكتسبت البيانات الكبيرة أهمية كبيرة من خلال قدرتها على تقديم إجابات على العديد من الأسئلة الهامة التي يمكن أن تعزز عملية صنع القرار. ومن بين عدة أنواع من البيانات الكبيرة ، تعتبر شبكات التواصل الاجتماعي واحدة من أكبر مصادر البيانات على الإنترنت.
كما بين إن وجود عدد نشط كبير من المستخدمين على شبكات التواصل الاجتماعي يجعلها منطقة بحث جذابة وغنية في مجتمع البيانات الضخم. أحد أكثر المجالات إثارة للاهتمام في شبكات البيانات الكبيرة والشبكات الاجتماعية هو التنبؤ بالسمات الإنسانية والحقائق والسلوكيات. وفي الآونة الأخيرة ، تمكن الباحثون بالتنبأ بنجاح بالعديد من الخصائص الإحصائية والبشرية لشبكات التواصل الاجتماعي باستخدام خوارزميات التعلم الآلي المختلفة.
من جانب اخر قدم عدة اقتراحات أولاً اقتراح خوارزمية جديدة وفعالة للتنبؤ بجنسية مستخدمي تويتر. تحاول الخوارزمية المقترحة التنبؤ بموقع المستخدم على Twitter من معلومات مواقع اصدقائه فقط دون استخدام معلومات GPS. وعلى الرغم من أن حوالي 30٪ من مستخدمي تويتر يكتبون معلومات الموقع الخاصة بهم في شكل ذي معنى ، فإن البحث يثبت أن هذه النسبة كافية لتحديد جنسية أي مستخدم للتويتر بشكل صحيح. يتم تطبيق الخوارزمية المقترحة لتقدير العتبات التي سيتم استخدامها لتحديد جنسية مستخدمي تويتر. وتظهر نتائج الخوارزمية الخاصة بي ان بامكانها تصنيف 90٪ من مستخدمي تويتر بشكل صحيح.
ثانياً يتم اقتراح خوارزمية جديدة فعالة لحل مشكلة اجتماعية لم يتم النقاش بها من قبل بهذه الصيغة ، وهي درجة الاندماج بين الأجانب في بلدانهم الجديدة. خلال العديد من الحروب والمشاكل السياسية والمواقف الشخصية الأخرى ، كثير من الناس يغيرون أماكنهم ويحاولون إيجاد حياة أفضل في بلدان أخرى. ولذلك ، يصبح من المهم للغاية لتلك الدول الجديدة أن تبسط هذه المهمة قدر الإمكان وتتابع باستمرار عملية الاندماج للأشخاص الجدد في المجتمع. الخوارزمية المقترحة قادرة على قياس درجة انتشار الأجانب تلقائيا من حسابات تويتر الخاصة بهم. تستخدم الخوارزمية المقترحة عددًا من الميزات من المعلومات العامة على تويتر لتقدير هذه الدرجة. كدراسة حالة ، تم تطبيق الخوارزمية الجديدة على الأجانب العرب في تركيا.
ثالثًا ، تم اقتراح خوارزمية جديدة تتسم بالكفاءة والدقة للتنبؤ بموقع مستخدم twitter من خلال تحسين الخوارزمية الأولى واستخدام المزيد من المعلومات العامة للمستخدمين. تستخدم الخوارزمية الجديدة المقترحة المعلومات العامة لمستخدم تويتر ومتابعيه وأصدقائه للتنبؤ بموقعه. يتم جمع مجموعة بيانات كبيرة من مستخدمي تويتر واستخدامها لاختبار الخوارزمية المقترحة باستخدام برنامج KNIME. وقد تم إجراء مقارنة بين امجموعة من الخوارزميات الحديثة والمتطورة وقد ظهرت النتائج بأن الخوارزمية التي اقترحتها تتفوق بشكل كبير على خوارزميات كشف الموقع الأخرى باستخدام مستخدمي تويتر لمجموعة متنوعة من البلدان .