על מודל המדידה החדש של גוגל אנליטיקס, ה-measurement protocol, כתבתי פה כבר פעם דיי מזמן, והיום אני רוצה להראות לכם כלי חדש וחמוד שגוגל הוציאו שיעזור לכם לבנות את ההיטים הללו, ולבסוף להסביר לכם איך הכלי הזה (או בעצם הדרך החדשה הזו) עוזרת לספאמרים ללכלך את חשבון האנליטיקס שלכם.
למי שלא קרא את הפוסט הנ”ל, אציין בקצרה שיוניברסל אנליטיקס שולח את כל המידע על הביקור של הגולש לשרתים של גוגל, ובכל פעם שאנחנו נכנסים לאתר וטוענים את הקוד של גוגל אנליטיקס הוא בעצם שולח hit מסוג pageview בעזרת ה-measurement protocol הזה.
ככה זה נראה:
ההיט הזה הוא בעצם “קריאה” לשרתים של יוניברסל אנליטיקס, ועל הקריאה הזו מועמסים הפרמטרים המאפיינים את ההיט שנשלח.
למשל – לאיזה חשבון לשייך אותו (זה ה-UA), באיזה URL הפעולה התרחשה (dl), מה ה-client id של אותו גולש (cid) , איזו פעולה התרחשה בכלל (צפייה בדף, איוונט, טרנזקציה) וכל יתר הפרמטרים שאותם אחרי זה נראה בדוחות של האנליטיקס שלנו.
כמובן שהיט לא חייב להיות דווקא pageview אלא יכול להיות גם event (למשל גולש שצפה בוידאו ואנחנו רוצים לעקוב אחרי זה בגוגל אנליטיקס), transaction או סושיאל (גולש לחץ על לייק ואנחנו רוצים לשלוח את המידע על האינטרקציה הזו לאנליטיקס שלנו) ועוד כל מיני סוגים של היטים אופציונליים.
בכל אופן הייחודיות בשיטה הזו (לעומת הקלאסיק אנליטיקס) היא בכך שהיא מאפשרת לנו לעקוב אחרי אירועים שקורים גם בסביבה שאינה וובית, כלומר בסביבה שלא מותקן בה הקוד הרגיל של גוגל אנליטיקס.
למשל?
נגיד שאתם רוצים לשלוח מידע ממערכת ה-CRM שלכם לגוגל אנליטיקס, בכל פעם שליד שהושאר באתר האינטרנט שלכם מבצע רכישה בעזרת המוקד הטלפוני.
הרכישה לא מתבצעת בתוך האתר ולכן הקוד הרגיל של גוגל אנליטיקס לא יודע עליה, וכאן בדיוק נכנס לפעולה ה-measurement protocol שמאפשר לכם לשלוח את המידע הזה לשרתים של גוגל אנליטיקס באופן ידני.
דוגמא נוספת
יש לכם חנות עם קופה רושמת, ובכל פעם שקונה מגיע לחנות ומממש קופון (אותו הוא הוריד באתר) אתם רוצים לשלוח את זה לגוגל אנליטיקס כדי לחבר בין הגולש שהוריד את הקופון לבין הקונה בחנות (כי בחנות הרי לא מוטמע קוד אנליטיקס…).
כל שעליכם לעשות, זה לשלוח POST או GET לכתובת https://www.google-analytics.com/collect ולהעמיס על השליחה הזו את ה-payload, שאלו בעצם הפרמטרים של המידע אותו אתם שולחים.
כדי לבנות את ה-payload הזה, גוגל פיתחו כלי פשוט בשם hit builder שאותו אפשר למצוא באזור ה-GA Dev Tools שלהם בלינק הזה.
הכלי הזה פשוט נותן לכם אפשרות לבחור את ה-property אליו אתם רוצים לשלוח את המידע, להכניס את הפרמטרים והוא כבר יבנה לכם את השרשור המלא אותו אתם צריכים לשלוח.
נתחיל מהפרמטר הראשון, t שמאפיין את סוג ההיט אותו נרצה לשלוח.
כאן נוכל לבחור בין pageview, event, social, transaction וכו’
לאחר מכן נלחץ על השדה של tid שיתן לנו לבחור את מזהה החשבון הרצוי שלנו, ולבסוף נוכל ללחוץ על החץ העגול לצד השדה של cid כדי לרנדר את ה-client id שיזהה את הגולש שלנו.
כדי לשלוח את ה-cid האמיתי של הגולש יש לרשום את הסקריפט הבא, ולדחוף אותו לתוך הפרמטר:
[syntax type=”js”] ga.getAll()[0].get(‘clientId’);[/syntax]
הסקריפט הזה שולף את ה-client id של הגולש מתוך העוגייה, ואתם פשוט צריכים לדחוף אותו לפרמטר cid ב-payload.
לבסוף לחצו על add parameter ותוסיפו את הפרמטרים שאתם רוצים לשלוח.
למשל –
ec – event category
ea – event action
dl – document location
dt – document title
וכן הלאה וכן הלאה (כאן תמצאו את רשימת הפרמטרים המלאה שאפשר לשלוח).
ה-Hit payload בחלק העליון יתעדכן בכל פעם שתשנו את הערך של אחד השדות, ולבסוף תוכלו להעתיק אותו ולשלוח אותו למתכנת או למי שאחראי על ההטמעה של הסיפור.
כדי לדבג את ההיט תוכלו ללחוץ על הכפתור הכחול Send hit to Google Analytics ולשלוח אותו בזמן אמת לחשבון האנליטיקס שלכם:
דרך נוספת לדיבוג – רשמו את הכתובת המלאה של ההיט, והוסיפו את המילה debug לפני ה-collect:
https://www.google-analytics.com/debug/collect?v=1&t=pageview&tid=UA-31146208-8&cid=bae8de64-58fa-47ad-a4ce-bc310dc0b4cf&dp=blalblalba
במידה וההיט שלכם תקין תקבלו את התשובה הבאה:
ואם הוא לא תקין, תקבלו את התשובה הזו (השגיאה בגלל שכתבתי pagevie בלי w, וכפי שאתם רואים כתוב לי בדיוק איפה הבעיה ומה לתקן):
וזה בדיוק מה שעושים הספאמרים…
אני לא יודע מתי בפעם האחרונה הצצתם בדוח ה-referrals של האנליטיקס שלכם, אבל אם תשימו לב טוב תוכלו לראות שהרבה אתרים נחמדים שולחים אליכם טראפיק.
רגע, שולחים אלינו טראפיק? אז זהו שלא…
מה שהם עושים זה פשוט לוקחים את ה-UA של החשבון שלכם ושולחים היטים לשרתים של גוגל אנליטיקס עם ה-measurment protocol, ובפרמטר dr (שהוא בעצם document referrer) רושמים את שם האתר שלהם.
הנה דוגמא מהאתר שלי. ברור לכם שאני לא באמת מקבל טראפיק מהאתרים הללו, מה גם שהבאונס שלהם עומד על 100% עגול, כלומר אין סיכוי שמדובר בגולש אמיתי:
מה הפתרון? פשוט לוקחים את ה-URLs הללו, יוצרים פילטר מסוג exclude > referrals ומכניסים את הכתובות הללו בפילטר כדי שגוגל אנליטיקס יסנן את ה”טראפיק” הזה ולא יתן לו אפילו להכנס.
כמובן שזה לא פתרון גורף כי הספאמרים חכמים מדי (ומתרבים מהר מדי) אז הם פשוט משנים את הכתובות שלהם וכך מצליחים לעקוף באלגנטיות את הפילטר, ולכן צריך להיות עם יד על הדופק וכל כמה שבועות להוסיף את הספאמרים החדשים לרשימת ה-exclude referrals הזו.
יש כל מיני סמי-פתרונות ברשת לנושא הזה, אבל אף אחד מהם לא באמת פותר את הבעיה מהשורש וכל שנשאר לעשות זה לחכות למפתחים הנחמדים של גוגל שיספקו פתרון לנושא (שקיים כבר שנתיים ורק הולך ומחמיר).
happy analyzing 🙂
מופתע כל פעם מחדש מהעובדה שגוגל מאפשרים את זה ועוד לא מצאו את הפתרון.
הפתרון נורא פשוט – להוסיף מתג באנליטיקס שיאפשר לך להחליט אם אתה רוצה לקבל היטים מהmeasurement protocol או לא, וגם אם כן לתת לך איזה token מקודד שיאפשר לך לשלוח את ההיטים רק עם הטוקן הזה
איך עושים את הtoken הזה?
זה בדיוק העניין. זה הפתרון המתבקש, שגוגל עדיין לא עשו…
איך עושים את זה ? באתר שאני לא מודד שום דבר פרט לכניסות זה פתרון מצויין.
איך אפשר למנוע את ההיטים?
למנוע לא יכול, אלא רק לעשות להם exclude בעזרת פילטר שבו אתה מכניס את הURLs הספאמיים.
בדרך כלל הם אותו דבר, free, seo, buttons וכו’
מה שכן בזמן האחרון הם השתכללו ומתחילים לשלוח גם איוונטים ואז צריך לפלטר את האיוונטים 🙂
קיצור בלאגן
אז האכזבה שלי מגוגל מוצדקת 🙂
שמנו פילטרים, עבד כמה שבועות, עכשיו כבר לא עובד… מכה…
לא עובד כי יש ספאמרים חדשים או סיבה אחרת?
(מעריך שהסיבה הראשונה)
פוסט מצויין. בדקתי ומצאתי אצלי באנליטיקס המון כתובות ספאם.
יצרתי את הפילטר, השאלה שלי איך אני מזין כתובות מרובות? מפריד בפסיק? או יוצר פילטר לכל כתובת?
תודה,
תודה מוטי,
תעשה | (פייפ) ביניהם.
אבל תבדוק קודם באתר regex101.com אם מה שאתה כותב נכון כי התחביר של זה הוא רג’קס.
למשל לפני נקודה אתה צריך לעשות וכד’
היי,
אני לא מבין למה הם עושים את זה? מזה נותן להם?
היי סימון,
יש תעשייה שלמה של סקיוריטי שקמה בגלל אותם אנשים. היא מגלגלת מליארדים (ע”ע צ’קפוינט) ומספקת מקומות עבודה למאות אלפי אנשים, אז אני לא בטוח שזה משהו שלילי 😉
צוחק כמובן..
תודה שוקי על הפוסט,
אני ממש לא מצליח להבין פה את גוגל, איך הם לא חוסמים את האתרים האלו בצורה הכי פשוטה בעולם, זה מלכלך את כל החשבונות.
היי עידו,
שאלה מצויינת, ואני יכול להוסיף עליה עוד 2 שאלות הרבה יותר קשות שלשמחתי לא מהווה היום בעיה (עדיין).
קודם כל – בעזרת הmeasurement protocol (להלן MP) אפשר גם לשלוח נתונים על טרנזקציות ולשבש לחלוטין את כל המידע על המכירות של האתר. לשמחתי הספאמרים עדיין לא עושים את זה.
דבר שני – הבעיה הזו קיימת גם במערכות אחרות שמאפשרות לשלוח נתונים באופליין (כמו אופטימייזלי למשל). זה אמנם פיצ’ר שפותח המון הזדמנויות למפרסם אבל פותח גם המון הזדמנויות לספאמרים, שיכולים לשבש ניסויי A/B Testing שלמים בשיטה הזו
שוקי, יש לי את אותה הבעיה ומצאתי מאמר נוסף בנושא שממליץ להשתמש ב- GTM ומפרט 3 דרכים לפלטר:
http://www.lunametrics.com/blog/2015/04/01/eliminating-bot-traffic-from-google-analytics-once-and-for-all/
היי דני,
מדובר בספאם מסוג אחר. המאמר שאליו קישרת מדבר על בוטים שממש נכנסים לאתר, והפוסט שלי מדבר על מידע שנשלח לאנליטיקס בלי שהרובוט בכלל יבקר באתר ולכן צריך דרך אחרת כדי לסנן אותם
האם הפתרון הזה עדיין רלוונטי ב 2020?
לשמחתי הפתרון עדיין רלוונטי – ולצערי הבעיה עדיין קיימת…