תשובה 1:

תודה על ה- A2A

למרות שהם לכאורה דומים, מדובר בשני מושגים שונים מאוד המשרתים מטרות שונות מאוד.

חקר נתונים הוא למעשה הצעד הראשון בכל ניתוח נתונים. זה כרוך בסיכום המאפיין העיקרי של כל בסיס נתונים או מערך נתונים. זה נעשה בעיקר בתוכנות סטטיסטיות המשתנות ברמות קידום, תלוי במורכבות של מערך הנתונים. זה יכול להתנהל גם באמצעות כלי ניתוח חזותיים; זה מועדף יותר, מכיוון שהוא מאפשר למשתמשים להסתכל במהירות ופשוטה על המשתנים החשובים והמשתנים החשובים ביותר של מערך הנתונים. זה עוזר למשתמש לקבוע במהירות אם המשתנים על המסך טובים מספיק להמשך ניתוח.

ניתוח חזוי נופל תחת ניתוחים מתקדמים, ומשמש להכנת תחזיות לגבי אירועים לא ידועים שעלולים להתפתח בעתיד. בצורה הפשוטה ביותר האפשרית, ניתוח חזוי משתמש בשורה של תוכנות שונות ומשווה אותן לטכניקות רבות החל מבינה מלאכותית (AI) ולמידת מכונות, כדי לנתח נתונים שכבר קיימים ולהביא תחזיות לגבי מהלךם בעתיד.

ההבדל, אם כי לא ברור מאליו, הוא די גדול. חקר נתונים חושף את הקשרים המורכבים, המורכבים ולעתים קרובות בלתי נראים בין משתנים ניתנים למדידה. לעומת זאת, ניתוח חזוי מציע תוצאות ואפשרויות בעתיד של המשתנים, מהמשתנים.


תשובה 2:

זו ללא ספק השאלה האהובה עליי במדעי הנתונים !!

המרכיב העיקרי המבדיל בין האנליזה החיזוי והסיווג הוא מרכיב הזמן.

תן לך דוגמא שבה הזמן ממלא תפקיד מכריע. נניח שלקוח מתכנן לאתר מחדש ממקום אחד למיקום אחר. בהינתן הנבאים הנכונים אנו יכולים לחזות התנהגות זו של הלקוח.

אז מבחינת סיווג, אנחנו יכולים פשוט לקבל תשובה האם הלקוח עשוי לעבור דירה או לא.

אבל מבחינת ניתוח חזוי, החלק העיקרי הוא לחזות מתי וכמה סביר שהלקוח יעבור בטווח זמן מסוים ולא פשוט "האם הלקוח עשוי לעבור או לא". כמו כן אנו מנסים לראות כמה קדימה נוכל לחזות התנהגות כזו ברמת דיוק משמעותית.

בתרחיש לעיל אנו עשויים להיות מסוגלים להציע ללקוח ערך טוב יותר על ידי הצעתו לאמצעים קלים יותר לאיתור מחדש או דרך טובה יותר להקים מחדש את חשבונו אצל אחד השותפים או החברות הבנות של החברות הפועלות במקום זה רק על ידי ניבוי שהוא מתכנן לאתר מחדש בעתיד הקרוב ולא לסיווג.

נ.ב: על זה בדיוק אני עובד ב- IBM Analytics.


תשובה 3:

חקר נתונים הוא תנאי מוקדם לניתוח חזוי.

בשלב חקר הנתונים אתה עובר על מערך הנתונים העומד בפניך ומבין את סוגי המשתנים השונים, מנסה לזהות מגמות או הטיות כלשהן בנתונים, מבין ערכים חסרים ומתארים, מבין את התפלגות הנתונים וכו '. סיווג יכול ייעשה בשלב חקר הנתונים, עם זאת זה יהיה מאוד מבחן. אתה צריך להשתמש בערכים של כל משתנה באופן עצמאי והם דלי אותם כדי לסווג את נקודות הנתונים.

לדוגמא, נניח שיש לך מערך נתונים של כל הלקוחות שהגיעו לזכיינית מסוימת של מקדונלד'ס לשנת 2015 והרכישות שהם ביצעו יחד עם המידע הדמוגרפי שלהם. אתה יכול להשתמש בנתונים כדי להבין מהו שווי הרכישה הממוצע לכל הלקוחות, להבין את הזמנת הרכש המינימלית והמקסימאלית לשנה, לסווג את הלקוחות על פי סוג הארוחה שהם מזמינים וכו 'בשלב חקר הנתונים.

לעומת זאת, ניתוח חיזוי משמש לחיזוי ההתנהגות העתידית של הנבדקים על סמך הערכים הנוכחיים של המשתנים העצמאיים שלך. זה משמש במקרים כמו שאתה צריך להבין מיהם הלקוחות הפוטנציאליים של המוצר החדש שלך, מה תהיה ההשפעה של תוכנית קידום מכירות מסוימת על הלקוחות שלך, מי מהלווים או מכרטיסי האשראי שלך עשויים להחליף ברירת מחדל תשלומים וכו '.

לדוגמא, נניח באותה דוגמא של מקדונלד, כעת ברצונך לגלות מי מהלקוחות שהגיעו לשם בארבע השנים האחרונות במשך 5-5 השנים האחרונות יתעניין לנסות מוצר חדש שאתה משיק. ובואו נגיד שאתה רוצה להעניק ללקוחות האלה 10% הנחה על שוברים כדי שיוכלו לקבל הנחה כאשר הם ינסו את המוצר. לשם כך, רק ניתוח חקר לא יספיק מכיוון שרק תוכלו לראות מי קונה מה ולא מי יקנה את המוצר החדש. לשם כך תצטרך לבצע ניתוח רגרסיה לאחר ששקלת את כל הגורמים החשובים שמשפיעים על ההחלטה האם לקוח ינסה מוצר חדש. תשקול את גילם, אתניות, דלי הכנסה, גודל סל, העדפות קולינריה וכו '.

עם זאת, נדרש ניתוח גישוש עוד לפני שאתה מבצע דוגמנות חזוי כדי להבין אילו משתנים זמינים ותכונותיהם, כך שתוכל לזהות את הרלוונטיים.

מקווה שזה עוזר.


תשובה 4:

חקר נתונים הוא תנאי מוקדם לניתוח חזוי.

בשלב חקר הנתונים אתה עובר על מערך הנתונים העומד בפניך ומבין את סוגי המשתנים השונים, מנסה לזהות מגמות או הטיות כלשהן בנתונים, מבין ערכים חסרים ומתארים, מבין את התפלגות הנתונים וכו '. סיווג יכול ייעשה בשלב חקר הנתונים, עם זאת זה יהיה מאוד מבחן. אתה צריך להשתמש בערכים של כל משתנה באופן עצמאי והם דלי אותם כדי לסווג את נקודות הנתונים.

לדוגמא, נניח שיש לך מערך נתונים של כל הלקוחות שהגיעו לזכיינית מסוימת של מקדונלד'ס לשנת 2015 והרכישות שהם ביצעו יחד עם המידע הדמוגרפי שלהם. אתה יכול להשתמש בנתונים כדי להבין מהו שווי הרכישה הממוצע לכל הלקוחות, להבין את הזמנת הרכש המינימלית והמקסימאלית לשנה, לסווג את הלקוחות על פי סוג הארוחה שהם מזמינים וכו 'בשלב חקר הנתונים.

לעומת זאת, ניתוח חיזוי משמש לחיזוי ההתנהגות העתידית של הנבדקים על סמך הערכים הנוכחיים של המשתנים העצמאיים שלך. זה משמש במקרים כמו שאתה צריך להבין מיהם הלקוחות הפוטנציאליים של המוצר החדש שלך, מה תהיה ההשפעה של תוכנית קידום מכירות מסוימת על הלקוחות שלך, מי מהלווים או מכרטיסי האשראי שלך עשויים להחליף ברירת מחדל תשלומים וכו '.

לדוגמא, נניח באותה דוגמא של מקדונלד, כעת ברצונך לגלות מי מהלקוחות שהגיעו לשם בארבע השנים האחרונות במשך 5-5 השנים האחרונות יתעניין לנסות מוצר חדש שאתה משיק. ובואו נגיד שאתה רוצה להעניק ללקוחות האלה 10% הנחה על שוברים כדי שיוכלו לקבל הנחה כאשר הם ינסו את המוצר. לשם כך, רק ניתוח חקר לא יספיק מכיוון שרק תוכלו לראות מי קונה מה ולא מי יקנה את המוצר החדש. לשם כך תצטרך לבצע ניתוח רגרסיה לאחר ששקלת את כל הגורמים החשובים שמשפיעים על ההחלטה האם לקוח ינסה מוצר חדש. תשקול את גילם, אתניות, דלי הכנסה, גודל סל, העדפות קולינריה וכו '.

עם זאת, נדרש ניתוח גישוש עוד לפני שאתה מבצע דוגמנות חזוי כדי להבין אילו משתנים זמינים ותכונותיהם, כך שתוכל לזהות את הרלוונטיים.

מקווה שזה עוזר.