Vai al contenuto principale
Oggetto:

BIG DATA ANALYTICS

Oggetto:

BIG DATA ANALYTICS

Oggetto:

Anno accademico 2019/2020

Codice dell'attività didattica
MAN0458
Docente
Sergio Venturini (Titolare del corso)
Corso di studi
DIREZIONE D'IMPRESA, MARKETING E STRATEGIA - percorso: Marketing Management
DIREZIONE D'IMPRESA, MARKETING E STRATEGIA - percorso: Business Management
Anno
1° anno
Periodo didattico
Secondo semestre
Tipologia
Caratterizzante
Crediti/Valenza
6
SSD dell'attività didattica
SECS-S/01 - statistica
Modalità di erogazione
Tradizionale
Lingua di insegnamento
Italiano
Modalità di frequenza
Facoltativa
Tipologia d'esame
Scritto
Oggetto:

Sommario insegnamento

Oggetto:

Obiettivi formativi

La crescente quantità di dati oggi disponibile rappresenta una delle più grandi rivoluzioni nella recente storia dell’uomo. Una parte essenziale di questa rivoluzione è rappresentata dalla trasformazione di queste immense moli di dati in preziose intuizioni, che vengono utilizzate dai decision-maker di tutto il mondo per identificare la strategia migliore da intraprendere. Il marketing non è esente da questo cambiamento, nell’ambito del quale l’utilizzo di avanzate tecniche di machine learning ha consentito a molti brand di fornire messaggi più mirati ed efficaci incrementando in modo significativo il ritorno sull'investimento.

Questo corso si pone essenzialmente due obiettivi: da una parte fornire allo studente gli strumenti analitico-statistici oggi più frequentemente utilizzati nel marketing digitale e tradizionale. Dall’altra parte, il corso mira a favorire nello studente la formazione di una capacità di modellazione della realtà, necessaria per l’analisi quantitativa di fenomeni economici e sociali. La presentazione dei vari argomenti è illustrata attraverso la discussione pratica di numerosi casi relativi a diverse applicazioni aziendali, con un particolare focus nel marketing.

The growing amount of data available today represents one of the greatest revolutions in recent human history. An essential part of this revolution is the transformation of these immense amounts of data into valuable insights, which are used by decision-makers around the world to identify the best strategy to undertake. Marketing is not exempt from this change, in which the use of advanced machine learning techniques has allowed many brands to provide more targeted and effective messages, significantly increasing the return on investment.

This course essentially has two objectives: on the one hand to provide the student with the analytical and statistical tools most frequently used today in digital and traditional marketing. On the other hand, the course aims to encourage the formation of the ability to model the world around us, which represents a fundamental skill for the analysis of economic and social phenomena. The presentation of the various topics is illustrated through the practical discussion of numerous cases related to different business problems, with a particular focus in marketing.

Oggetto:

Risultati dell'apprendimento attesi

CONOSCENZA E CAPACITÀ DI COMPRENSIONE

Al termine dell’insegnamento, lo studente sarà in grado di:

  • Comprendere la diversa natura di campioni di dati di grandi dimensioni.
  • Identificare la metodologia corretta da utilizzare per risolvere il problema oggetto di studio.
  • Riconoscere e interpretare correttamente i risultati di analisi statistiche applicate a problemi aziendali.

CONOSCENZA E CAPACITÀ DI COMPRENSIONE APPLICATE

Al termine dell’insegnamento, lo studente sarà in grado di:

  • Sintetizzare in modo appropriato un insieme di dati mediante grafici e indici.
  • Interpretare i risultati di elaborate analisi statistiche effettuate tramite l’uso di software avanzati di analytics.
  • Confrontare metodi alternativi di analisi e individuare il metodo migliore per il problema in esame.
  • Creare report analitici per diverse applicazioni aziendali, principalmente in ambito marketing.

AUTONOMIA DI GIUDIZIO

  • Apprendimento dei concetti statistici indispensabili per lavorare autonomamente nella ricerca, selezione ed elaborazione dei dati aziendali e nello sviluppo di report analitici.

ABILITÀ COMUNICATIVE

  • Apprendimento della terminologia e di metodologie statistiche avanzate indispensabili per implementare e comunicare in modo appropriato i risultati delle analisi condotte in diversi contesti aziendali.

KNOWLEDGE AND UNDERSTANDING

At the end of the course, the student will be able to:

  • Understand the different nature of the large data samples.
  • Identify the correct methodology to be used to solve the problem under study.
  • Recognize and correctly interpret the results of statistical analysis applied to business problems.

APPLYING KNOWLEDGE AND UNDERSTANDING

At the end of the course, the student will be able to:

  • Properly synthesize a set of data using visualizations and summary indexes.
  • Interpret the results of elaborate statistical analyzes carried out using advanced analytics software.
  • Compare alternative methods of analysis and identify the best method for the problem under study.
  • Create analytical reports for different business applications, mainly in the marketing field.

MAKING JUDGEMENTS

  • Learning the statistical concepts that are fundamental for working autonomously in searching, selecting and elaborating corporate data and in the development of analytical reports.

COMMUNICATION SKILLS

  • Learning the terminology and advanced statistical methods essential to implement and communicate appropriately the results of the analyzes conducted in different business contexts.
Oggetto:

Modalità di insegnamento

  • Lezioni frontali

  • Standard frontal lectures
Oggetto:

Modalità di verifica dell'apprendimento

L’esame, svolto in modo tradizionale (carta e penna), consente di ottenere un punteggio massimo di 31/30. Il testo dell’esame conterrà sia esercizi pratici sia domande teoriche (definizioni) secondo due possibili modalità: 1) domande a risposta multipla e 2) domande con risposta aperta.

L’esame si riterrà superato se il voto finale sarà maggiore o uguale a 18/30. Un punteggio finale di 31/30 equivale ad un voto di 30 e lode.

L’esame potrà essere sostenuto in tutti gli appelli a partire da maggio in poi e riguarderà tutto il materiale presentato durante il corso.

Lo studente ha diritto a sostenere al massimo tre prove a partire dal semestre in cui l'insegnamento è erogato (per questo corso quindi da maggio a febbraio inclusi). Durante l’esame è ammesso l'utilizzo di una calcolatrice non programmabile.

Gli studenti apprendono il relativo voto tramite i canali istituzionali. Trascorsi 5 giorni dalla comunicazione, il voto dell’esame si intende accettato e sarà registrato d’ufficio. In caso contrario, entro lo stesso termine lo studente dovrà esplicitamente manifestare la propria intenzione di rifiutare il voto attraverso le procedure stabilite dall’Ateneo.

Per ciascuna prova verrà comunicata, insieme al voto conseguito, un’unica data per prendere visione del compito.

Entrambe le modalità mirano a verificare tramite opportune domande:

  • La capacità di identificare la metodologia corretta per risolvere un dato problema.
  • La comprensione della logica sottostante una determinata procedura.

MODIFICHE E INTEGRAZIONI ALLE MODALITA' D'ESAME PER EMERGENZA COVID

Si comunica che a causa delle regole di distanziamento sociale attualmente in vigore, l’esame per il corso di Statistica per l’Azienda sarà organizzato come segue:

  1. Gli studenti si devono regolarmente iscrivere all’esame seguendo le solite regole definite dall’Università.
  2. Nella data prevista a calendario per l’esame, gli studenti dovranno sostenere una sola prova scritta della durata (massima) di un’ora che si svolgerà attraverso la piattaforma Moodle. La prova consisterà in una serie di domande a cui lo studente dovrà rispondere fornendo la risposta corretta sempre attraverso la piattaforma Moodle. Per superare la prova scritta sarà necessario rispondere correttamente ad un numero minimo di domande, che verrà comunicato all’inizio della prova. Al termine della prova scritta gli studenti conosceranno il numero di risposte corrette fornite, ma non il voto conseguito, il quale sarà invece reso noto entro alcune ore dalla conclusione della prova stessa. Lo studente potrà ritirarsi dalla prova scritta in qualsiasi momento seguendo le modalità che saranno comunicate il giorno della prova. In caso di ritiro durante la prova scritta, l’esame non conterà come prova sostenuta. Le domande della prova scritta verteranno sugli argomenti presentati durante il corso. Nelle prossime settimane saranno caricati su Moodle alcuni esempi di domande nello stile delle domande che saranno incluse nella prova scritta.
  3. Per l’erogazione della prova scritta, gli studenti saranno divisi in gruppi e convocati tramite invito Webex. Gli studenti saranno convocati 30 minuti prima della prova per consentire lo svolgimento dell’attività di riconoscimento tramite Smart card. Gli studenti dovranno sempre rimanere connessi alla riunione Webex fino alla fine dell’esame, con la webcam e il microfono sempre accesi, altrimenti l’esame verrà invalidato. Comportamenti fraudolenti perpetrati attraverso l’uso improprio di telefoni cellulari, computer o altri mezzi saranno causa di annullamento dell’esame a discrezione del docente del corso. Gli studenti dovranno connettersi a Webex utilizzando il loro nome e cognome per esteso.
  4. Si tenga presente che, in base al numero di studenti iscritti, è possibile che l’esame venga erogato su più turni (verosimilmente due). Gli studenti conosceranno a quale turno dovranno partecipare attraverso l’invito Webex.
  5. Ulteriori dettagli sull’organizzazione della prova orale saranno comunicati nei giorni precedenti la data dell’esame.

IMPORTANTE: poiché entrambe le prove richiedono l’utilizzo di un computer e di una connessione ad internet, è fondamentale che lo studente verifichi con largo anticipo se il proprio computer e la propria connessione internet siano di qualità minima da consentire lo svolgimento delle prove senza problemi. Si sottolinea quindi fin d’ora che la verifica del corretto funzionamento del computer e della connessione internet è di esclusiva responsabilità dello studente. Consigliamo pertanto di effettuare tale controllo il prima possibile per evitare ritardi e problemi durante l’esame. Eventuali problemi relativi a questi aspetti che si potranno verificare durante l’esame non potranno in alcun modo essere imputati ai docenti e/o all’Università.

Queste regole rimarranno in vigore fino a quando non sarà ufficialmente dichiarato concluso dall’Università il periodo di emergenza.

The exam, carried out in a traditional way (paper and pen), allows to obtain a maximum grade of 31/30. The text of the exam will contain both practical exercises and theoretical questions (definitions) in two different forms: 1) multiple choice questions and 2) open questions.

The exam will be considered passed if the final grade is greater than or equal to 18/30. A final score of 31/30 is equivalent to a grade of 30 with honors (30 e lode).

The exam can be taken in all the exam sessions starting from May onwards and will cover all the material presented during the course.

Students can take a maximum of three tests starting from the semester in which the course is delivered (for this course from May to February included). The use of a non-programmable hand calculator is permitted during the exam.

Students get the grade through the standard institutional channels. After 5 days from the communication, the exam grade is considered accepted and will be officially registered. Otherwise, within the same term the student must explicitly express his intention to refuse the grade following the procedures established by the University.

For each test, together with the grade achieved, a single date will be communicated to review the test itself.

Both methods aim to verify through appropriate questions:

  • The ability to identify the correct methodology to solve a given problem.
  • Understanding the logic underlying a given procedure.

EXAMINATION METHODS DUE TO THE COVID EMERGENCY

We inform that due to the social distancing rules currently in force, the examination for the Statistica per l'Azienda will be organized as follows:

  1. Students must regularly register for the exam following the usual rules defined by the University.
  2. On the scheduled date for the exam, students will have to take a single written test lasting (maximum) one hour which will take place through the Moodle platform. The test will consist of a series of questions to which the student will have to answer by providing the correct answer always through the Moodle platform. To pass the written test it will be necessary to correctly answer a minimum number of questions, which will be communicated at the beginning of the test. At the end of the written test, students will know the number of correct answers provided, but not the mark obtained, which will instead be made known within a few hours from the conclusion of the test. The student can withdraw from the written test at any time by following the procedures that will be communicated on the day of the test. In case of withdrawal during the written test, the exam will not count as a test taken. The questions of the written test will focus on the topics presented during the course. In the coming weeks, some examples of questions in the style of the questions that will be included in the written test will be uploaded to Moodle.
  3. Students will be divided into groups and summoned via Webex invitation. Students will be called 30 minutes before the test to allow the recognition activity to be carried out via Smart card. Students must always remain connected to the Webex meeting until the end of the exam, with the webcam and microphone always on, otherwise the exam will be invalidated. Fraudulent behavior perpetrated through the improper use of mobile phones, computers or other means will cause the examination to be canceled at the discretion of the course teacher. Students will need to connect to Webex using their full name.
  4. Note that, based on the number of students enrolled, it is possible that the exam will be delivered over several shifts (probably two). Students will know which shift they will have to participate through the Webex invitation.
  5. Further details on the organization of the oral test will be communicated in the days preceding the exam date.

IMPORTANT: since both tests require the use of a computer and an internet connection, it is essential that the student verify well in advance if his computer and internet connection are of minimum quality to allow the tests to be carried out without problems . It is therefore emphasized from now on that the verification of the correct functioning of the computer and internet connection is the sole responsibility of the student. We therefore recommend carrying out this check as soon as possible to avoid delays and problems during the examination. Any problems relating to these aspects that may occur during the examination cannot in any way be attributed to teachers and/or to the University.

These rules will remain in force until the emergency period is officially declared concluded by the University.

Oggetto:

Programma

Il corso si articola nei seguenti argomenti:

  1. Review di descriptive analytics.
    • Sintesi dei dati mediante l’uso di visualizzazioni grafiche.
    • Sintesi dei dati mediante l’uso di indici numerici.
  2. Review di statistica inferenziale.
    • Variabilità campionaria. Il concetto di distribuzione campionaria.
    • Stima puntuale e per intervallo per alcuni casi notevoli.
    • Introduzione alla verifica di ipotesi e presentazione di alcuni casi notevoli. P-value di un test.
  3. Riduzione della complessità di un data set: l’analisi delle componenti principali.
  4. Principali metodi di predictive analytics.
    • Il modello di regressione lineare. Esempi (previsione dei comportamenti di acquisto).
    • Il modello di regressione logistica per risposta binaria. Esempi (modelli di credit scoring e di churn).
    • Il modello di regressione logistica per risposta multinomiale. Esempi (modelli di scelta del consumatore).
    • Approcci avanzati di predictive analytics:
      • Modelli ad albero
      • Reti neurali e introduzione al deep learning
  5. Metodi per la segmentazione della clientela: analisi di clustering.
  6. Text mining e analisi del sentiment di mercato.
  7. Introduzione ai metodi per lo sviluppo di recommendation systems.

The course is composed of the following topics:

  1. Descriptive analytics review.
    • Data synthesis using graphical displays.
    • Data synthesis through the use of numerical indices.
  2. Review of inferential statistics.
    • Sample variability. The concept of sampling distribution.
    • Point estimate and confidence intervals for some notable cases.
    • Introduction to hypothesis testing and presentation of some remarkable cases. P-value of a test.
  3. Reduction of the data dimensionality: the principal component analysis.
  4. Main methods of predictive analytics.
    • The linear regression model. Examples (prediction of purchasing behaviors).
    • The logistic regression model for binary responses. Examples (credit scoring and churn models).
    • The logistic regression model for multinomial responses. Examples (consumer choice models).
    • Advanced predictive analytics approaches:
      • Tree models
      • Neural networks and introduction to deep learning
  5. Methods for customer segmentation: clustering analysis.
  6. Text mining and market sentiment analysis.
  7. Introduction to methods for the development of recommendation systems.

Testi consigliati e bibliografia

Oggetto:

Il materiale corso sarà fornito dal docente attraverso la piattaforma Moodle.

Per ulteriori approfondimenti si consiglia di consultare i seguenti testi:

  • Chapman, C., McDonnell Feit, E., R for Marketing Research and Analytics. 2a Springer-Verlag, 2019.
  • James, G., Witten, D., Hastie, T., Tibshirani, R., An Introduction to Statistical Learning. Springer-Verlag, 2013.
  • Kuhn, M., Johnson, K. Applied Predictive Modeling. Springer-Verlag, 2013.
  • Kwartler, T. Text Mining in Practice with R. Wiley, 2017.
  • Russell, M. A., Klassen, M., Mining the Social Web. 3a edizione. O’Reilly, 2019.

The material for the course will be provided by the instructor through the Moodle platform.

For further details, we recommend referring to the following textbooks:

  • Chapman, C., McDonnell Feit, E., R for Marketing Research and Analytics. 2a Springer-Verlag, 2019.
  • James, G., Witten, D., Hastie, T., Tibshirani, R., An Introduction to Statistical Learning. Springer-Verlag, 2013.
  • Kuhn, M., Johnson, K. Applied Predictive Modeling. Springer-Verlag, 2013.
  • Kwartler, T. Text Mining in Practice with R. Wiley, 2017.
  • Russell, M. A., Klassen, M., Mining the Social Web. 3a edizione. O’Reilly, 2019.


Oggetto:

Orario lezioni

Oggetto:

Note

  1. Le regole sopra descritte si applicano indistintamente a tutti gli studenti, compresi quelli in debito d’esame.
  2. Il corso presuppone che lo studente abbia dimestichezza con alcuni strumenti matematici di base (potenze, logaritmi, concetti di funzione).
  3. Orario e luogo di ricevimento saranno messi a disposizione sulla pagina personale del docente, consultabile sul sito http://www.unito.it/.

  1. The rules discussed above apply indistinctly to all students.
  2. During the course it is presumed that students are familiar with basic mathematical tools (powers, logarithms, concepts of function, derivative and integral).
  3. Time and place for the office hours will be made available on the teacher’s personal page, available on the website http://www.unito.it/.
Oggetto:
Ultimo aggiornamento: 29/04/2020 16:08

Location: https://www.ecodir.unito.it/robots.html
Non cliccare qui!