تحليل حركة نمو المتابعين في تويتر


مهارة إستحواذ البيانات


حساب المدونة في تويتر تم انشاءه منذ فترة وجيزة جداً. لكن في يوم ٢٥ يونيو ٢٠١٦ ٫حدث ارتفاع غير معتاد في عدد المتابعين لحساب التويتر الخاص بالمدونة. ظللت اتلقى الكثير من الإشعارات بالبريد الإلكتروني لكل متابع جديد. الفكرة الأول التي كانت لدي هي ان اسرع إلى اعدادت تويتر وآقوم بتعطيل خاصية الإشعارات. لكن بعد حين استوعبت ان هذه الرسائل مليئة بالبيانات المهمة والتي بالإمكان تحليلها.

هناك الكثير من الأدوات لتحليل وتصوير حركة المتابعين في تويتر بما في ذلك أداة تويتر التحليلية الخاصة بتويتر نفسه Twitter Analytics . إذا كنت جديد العهد مع R، فإنني اوصيك باستخدام هذه الأداة السهلة. أما إن كنت من محبي لغة R تابع القراءة إلى نهاية المقال لمعرفة كيف يمكنك تحليل حركة المتابعين عن طريق الـ R.

Twitter Analytics

هي أداة قوية تم تصميمها بواسطة تويتر لتحليل معلومات وبيانات تويتر. بالإضافة إلى ذلك، فإن هذه الاداة توفر الكثير من المعلومات المثيرة للاهتمام مثل (عدد الأشخاص الذين شاهدوا التغريدات الخاصة بك)، ومستوى المشاركة (النقرات، والردود والإعجاب) وأكثر من ذلك بكثير. حتى لو كنت مهووس بـ R، انصح حقا بتجريب هذه الاداة. الجدير بالذكر هو انه بإمكانك تنشيطها واستخدامها بكل سهولة ويسر. اذهب إلى Twitter Analytics و قم بتنشيطها. سترى في الجزء العلوي من الشاشة عدة علامات تبويب كالرئيسية، والتغريدات، والجماهير، والأحداث. كل علامة تبويب تعطيك معلومات مثيرة للاهتمام حول حسابك.

طريقة الـ R

بالرغم من أن اداة تويتر لطيفة وسهلة، لكن كوني من محبي لغة الـ R فقد قررت اقوم بجمع وتحليل كل رسائل الإشعارات وتحليلها. أول شيء سوف نحتاج إلى القيام به هو الحصول على جميع رسائل البريد الإلكتروني من البريد الوارد و تحميلها في جلسة R. بعد ذلك، سوف نقوم بفرز جميع رسائل البريد الإلكتروني غير ذات الصلة ونبقي رسائل الإشعارات فقط. الخطوة الأخيرة هي إنشاء رسم بياني يبين الجدول الزمني الخاص بنمو المتابعين على حسابنا في تويتر.

قد يبدو هذا معقد قليلا لكن لا تقلق. أحد الأمور التي أحبها حول R هي أن R لديه مجتمع ضخم و متحمس يقوم بإستمرار بتصميم حزم لفعل أي شيء في R. لحسن الحظ، هناك حزمة تسمى “edeR”. هذه الحزمة متخصصة في استخراج المعلومات الرأسية لكل الرسائل. للإسف هذه الحزمة لا تعمل إلا مع حسابات Gmail. لذلك، إذا كان لديك حساب بريد إلكتروني مع مزود آخر، هذه الحزمة لن تجديك نفعا.

القسم الأول : إعداد حساب Gmail الخاص بك

قبل أن نبدأ، هناك قليل من الأشياء التي تحتاج إلى القيام بها على حساب جوجل الخاص بك لكي تعمل الحزمة بشكل سليم. أولا عليك أن تذهب إلى إعدادات Gmail وتقوم بتمكين IMAP (بروتوكول الوصول إلى الرسائل عبر الإنترنت). للقيام بذلك اتبع الخطوات التالية

  1. تسجيل الدخول حساب Gmail الخاص بك

  2. انتقل إلى إعدادات عن طريق النقر على “رمز الترس” ثم حدد “إعدادات” من القائمة المنسدلة

  3. انقر على “إعادة التوجيه و POP / IMAP” علامة التبويب

  4. تمكين IMAP من قسم “IMAP الوصول”

بما أن جوجل مجنونة جدا حول الأمن، هناك خطوة أخيرة عليك القيام بها. قم بتمكين “الوصول إلى تطبيقات أقل أمنا” من خلال هذه الصفحة.

تحذير: هذا قد يجعل حسابك أكثر عرضة لهجمات قراصنة الإنترنت. ولذلك، فإنني أوصي بشدة لتعطيله مرة أخرى بعد الانتهاء مع التحليل.

القسم الثاني: تحليل البيانات

استخراج البيانات

والآن بعد أن اصبح حساب Gmail لدينا جاهز. دعنا نمضي في كتابة بعض الكودات الرهيبة. سنبدأ اولا بتثبيت الحزمة وإرفاقها. الكود هو كالتالي:

    install.packages("edeR")
    library("edeR")

انيا، سوف نستخدم الدالة ()extractKeywordB. هذه الدالة سوف تمكننا من استخراج كافة رسائل البريد الإلكتروني استنادا إلى الكلمة محددة في نص الرسالة. من اجل ذلك، فهو من المهم أن نختار كلمة فريدة ومذكورة فقط في رسائل الإشعارات. من اجل تبسيط مهمتتنا سوف اقوم بختيار كلمة “follower”. هنا ايضا بعض القيم نحتاج إلى تزويدها في الدالة.

    db <- extractKeywordB(username = "arabianAnalyst@gmail.com", password = "XXXXXXXXX", kw = "followers", nmail = -1)

ملاحظة جانبية: هذه العملية قد تستغرق بعض الوقت اعتمادا على عدد من رسائل البريد الإلكتروني لديك.

هذه الدالة سوف تقوم بإرجاع قائمة ذو متغيرين. المتغير الأول يحوي عدد الرسائل التي نجحت الدالة من استخراجها. والمتغير الثاني يتحوي على البيانات. وبما أننا مهتمون فقط في البيانات، سوف نقوم بإنشاء متغير لتخزين البيانات بشكل منفصل.

    dos <- db$data

تجهيز وتنسيق البيانات

حتى الآن ما قمنا به هو عمل رائع. كل ما علينا القيام به الآن هو تحويل عمود التواريخ إلى صيغة يتعرف عليها R، ثم سنكون على استعداد تام لرسم نتائجنا. للقيام بذلك، سوف نقوم بكاتبة هذا الكود اللطيف.

    dataDates <- as.POSIXlt(dbs$email_date, format = "%a, %d %b %Y %H:%M:%S %z", tz= Sys.timezone())
    dataDates <- sort(dataDates)

لاحظ أنني أيضا رتبت التواريخ لضمان أن تكون مبنية على الترتيب الزمني.

التصوير البياني

دعنا الآن نرى مدى ارتفاع القفزة في عدد المتابعين

    plot(dataDates, 1:length(dataDates), xlab = "", ylab= "followers" , col = "darkblue", type = "l", main = "Followers Growth")

يمكننا رؤية الازدياد في عدد المتابعين بتسارع أُسي خلال فترة 24 يونيو - 26 يونيو.

مزيد من التحقيقات

يمكننا التوقف هنا وهذا كافي لرؤية متى بدأت القفزة الغير اعتيادية. ولكن ماذا لو أردنا أن نعرف كيف حدث ذلك ومن كان السبب في حدوثه. في تويتر وبشكل عام٫ إذا حصلت تغريدتك على إعادة تغريد من قبل شخص ذو قاعدة متابعين كبيرة، حسابك يحصل على مزيد من االشهرة والدعاية. لكن هذا ليس دائما صحيح. أحيانا تحصل للدعاية من خلال الذكر في تغريدة شخص معين ذو متابعين كثر. لذلك، سنحاول تحليل كل من هما.

سوف أستخدم كودات مشابهة جدا لما ناقشناه سابقا. لقد قمت ايضا بتحسين الكود لجعله ابسط للقراءة

سوف نقوم بإستخراج رسائل البريد الإلكتروني حول الإشعارات التالية

الكود سوف يكون كالتالي

    # Extracting The email Information Based on Keywords
    #Based on keyword "Followers"
    dbf <-
      extractKeywordB(
        username = "arabianAnalyst@gmail.com",
        password = "XXXXXXXXXXX",
        kw = "follower",
        nmail = -1
      )
    #Based on keyword "Mentioned"
    dbm <-
      extractKeywordB(
        username = "arabianAnalyst@gmail.com",
        password = "XXXXXXXXXXX",
        kw = "mentioned",
        nmail = -1
      )
    #Based on keybord "Retweeted"
    dbRT <-
      extractKeywordB(
        username = "arabianAnalyst@gmail.com",
        password = "XXXXXXXXXXX",
        kw = "retweeted",
        nmail = -1
      )
    #Extracting only the Email information from the list
    dbFollow <- dbf$data dbMention <- dbm$data dbRetweet <- dbRT$data
    #FUNCTION: Convertes Dates from String to POISXlt tpye and return them sorted.
    dateConvertor <- function (thedata) {
      #Converting the Dates from String to POISXlt tpye.
      dataDates <-
        as.POSIXlt(thedata$email_date, format = " %a, %d %b %Y %H:%M:%S %z", tz = Sys.timezone())
      #Sorting the Data
      dataDates <- sort(dataDates) return(dataDates)
    }
    #Storing The times of following, mentioning and retweeting in specific variables
    followTime <- dateConvertor(dbFollow)
    retweetTime <- dateConvertor(dbRetweet)
    mentionTime <- dateConvertor(dbMention)

للحصول على صورة اوضح حول البيانات سوف نلخصها في جدول قابل للقراءة. انا افضل استخدام دالة ()table. هذه الدالة عادة ما تعمل بشكل أفضل مع المتغيرات النوعية. ولذلك، فإنني سوف اقوم بجمع تواريخ الرسائل إلى ايام من الاسبوع

#creating a custom column to group dates by days.
days <- strftime(followTime, format = "%a, %d %b")
dbsExted <- cbind(dbFollow, days)

لاحظ أنني قد اضفت عامود “days” لإطار البيانات باستخدام الدالة ()cbin. الآن بإمكاننا تلخيص المعلومات بشكل اوضح عبر الكود التالي

table(dbsExted$days,dbsExted$email_from)

وكما نرى، كان هناك عدد كبير من المتابعين في 25 يونيو.

تحديد هوية المسوّق أو المروّج

ن الأشياء المفيدة من تلخيص البيانات هو الحصول على أدلة آو تلميحات حول الوجهة او الخطوة القادمة والمناسبة في التحليل. في الواقع، في مثالنا الحالي، هناك دليل قوي على أن هناك شيء يستحق التحقيق حوله في كل من يومي الاثنين 20 يونيو والسبت 25 يونيو.

إحدى الطرق المستخدمة في تقصي الاحداث الزمنية هي رسم كل الأحداث في رسم بياني كنقاط ذو طبقات متعدد. وبالإضافة إلى ذلك، يمكننا تلوين هذه النقاط لتعزيز الوضوح. الكود هو كالتالي

plot(
  followTime,
  1:length(followTime),
  xlab = "",
  ylab = "followers" ,
  col = "darkblue",
  type = "l",
  main = "Followers Growth"
) points(mentionTime, rep(20, length(mentionTime)), col = "darkgreen", pch = 1) points(retweetTime, rep(30, length(retweetTime)), col = "darkred", pch = 2) legend(
  followTime[1],
  length(followTime) * 0.8,
  c("mentions", "retweets", "followers"),
  pch = c(1, 2, <span class="hljs-literal">NA),
  lty = c(<span class="hljs-literal">NA, <span class="hljs-literal">NA, 1),
  col = c("darkgreen", "darkred", "darkblue")
)

في الرسم البياني أعلاه يظهر أن أول قفزة صغيرة في عدد المتابعين ربما كانت بسبب إعادة تغريدة. أما القفزة الثانية وهي الكبيرة فالسبب ليس واضحاً فيما إذا كانت بسبب ذكر من شخص معين او إعادة تغريدة. لذلك سوف نركز تحليلنا على هذه القفزة والتي تصادف ٢٥ يونيو.

follow25th <-
  followTime[which(strftime(followTime, format = "%d") == "25")]
mention25th <-
  mentionTime[which(strftime(mentionTime, format = "%d") == "25")]
retweet25th <-
  retweetTime[which(strftime(retweetTime, format = "%d") == "25")]
plot(
  retweet25th,
  rep(15, length(retweet25th)),
  col = "darkred",
  pch = 2,
  ylim = range(0, 20),
  main = "June 25th timeline",
  xlab = "time",
  yaxt = "n",
  ylab = ""
)
points(mention25th, rep(10, length(mention25th)), col = "darkgreen", pch = 1)
points(follow25th, rep(5, length(follow25th)), col = "darkblue", pch = 0)

في الرسم البياني أعلاه، المربعات الزرقاء الداكنة هي عدد المتابعين، والدوائر الخضراء الداكنة هي عدد الذكر والمثلثات الحمراء الداكنة هي عدد إعادة التغريدات

هذا الرسم البياني يبين لنا أمرين على الأقل. أولا، لا تبدو إعادة التغريدات هي السبب في النمو لأنها تظهر بعد ظهور المتابعين وليس قبله. الامر الثاني هو ان الكثير من المتابعين والذكر كانوا في الفترة المسائية (بعد 6:00pm). بتوقيت الولايات المتحدة

للكشف عن هوية المسوق الرائع. يمكننا أن نذهب إلى حساب بريدنا الإلكتروني و التحقق من الذي كان أول من ذكرنا بعد 6:00pm. أو يمكننا أن نفعل ذلك باستخدام R العجيب. الكود كالتالي.

dbMention[which(strftime(mentionTime, format = "%H") > "18")[1],"email_subj"]
#"Subject: Fahad Alhazmi (@fahd09) mentioned you in conversation on Twitter!"

النتائج

وفقا لتحليلنا، كان الحدث المسؤول الذي تسبب في هذا التدفق من المتابعين هو الذكر الذي كتبه فهد الحازمي في 08:20 (التوقيت الشرقي للولايات المتحدة). بما ان المستخدم يقطن في منطقة زمنية مختلفة، هذا الحدث كان في حوالي الساعة 12:20 من صباح يوم 26 حسب وقت المسوق. لذلك، أعطي شكر خاص إلى فهد لدعمه حسابنا على تويتر و والموقع كذلك.

ملخص

في هذه المقالة ناقشنا مختلف الأدوات المتاحة لمتابعة وتحليل المتابعين في تويتر. بالإضافة إلى ذلك، فلقد استخدمنا البريد الإلكتروني لدينا كمصدر للبيانات و لتتبع كل الأحداث على حساب تويتر لدينا. وأخيرا، أجرينا تحليلا دقيقا لتحديد نقطة التحول الغير اعتيادية لنمو عدد المتابعين لدينا ومعرفة سبب هذا الحدث.


جرب بنفسك

كامل الكود تجده هنا

comments powered by Disqus