Codifica Dei Dati Mancanti In Forex Stata


AVVISO: Il gruppo di consulenza Idre statistica sarà la migrazione del sito web per il CMS WordPress nel mese di febbraio per facilitare la manutenzione e la creazione di nuovi contenuti. Alcune delle nostre pagine più vecchie verranno rimossi o archiviati in modo tale che essi non saranno più mantenuti. Cercheremo di mantenere i reindirizzamenti in modo che i vecchi URL continueranno a lavorare nel miglior modo possibile. Benvenuti al Istituto per la ricerca e l'istruzione digitale Aiuto Consulting Group Stat dando un regalo Stata FAQ Come posso ricodificare i valori mancanti in diverse categorie Stata ci permette di codificare diversi tipi di valori mancanti numerici. Dispone di 27 categorie mancanti numerici. quot. a quot al quot. Z quot quot e. quot. In questa pagina vi mostriamo come codificare i valori mancanti in diverse categorie. Per prima cosa creare un set di dati a scopo di illustrazione. In questo set di dati, tutte le variabili sono numerica e le variabili femminile e SES hanno valori mancanti. I valori non mancanti per le femmine variabile è 0 (per i maschi) e 1 (per le femmine). I valori non mancanti per ses variabile è 0 (basso), 1 (MED) e 2 (alto). Il resto dei valori sono considerate come valori mancanti. Diciamo che vogliamo codificare -999 in una categoria, -99 in un altro e il resto dei valori mancanti in una terza categoria per tutte le variabili. Metodo 1: Usare il comando sostituire possiamo sostituire manualmente i valori mancanti con quot. a quot per -999, quot. B quot per -99 e. c per il resto dei valori mancanti. Ad esempio, per la femmina variabile. siamo in grado di effettuare le seguenti operazioni: Il comando cifrario sopra mostra che femminile variabile ha tre tipi di valori mancanti e 4 valori mancanti. Metodo 2: Usare il comando mvdecode Metodo 1 non può essere il modo migliore per ricodificare valori mancanti in diverse categorie. Per prima cosa, dobbiamo farlo una variabile alla volta. comando mvdecode Statas, è particolarmente utile per noi. Meglio ancora, si può usare la parola chiave tutta per riferirsi a tutte le variabili nel set di dati. Andando da codici di valori mancanti per valori numerici L'altra questione che ci occuperemo qui è come cambiare i codici di valore mancante torna a valori numerici. Il mvencode comando è accoppiato con mvdecode comando che abbiamo appena coperto sopra ed è quello di usare qui. Il contenuto di questo sito web non deve essere interpretata come un'approvazione di un particolare sito web, il libro, o di un prodotto software dall'Università di California. NOTICE: Il gruppo di consulenza Idre statistica sarà la migrazione del sito web al CMS WordPress nel mese di febbraio per facilitare mantenimento e la creazione di nuovi contenuti. Alcune delle nostre pagine più vecchie verranno rimossi o archiviati in modo tale che essi non saranno più mantenuti. Cercheremo di mantenere i reindirizzamenti in modo che i vecchi URL continueranno a lavorare nel miglior modo possibile. Benvenuti al Istituto per la ricerca e l'istruzione digitale Aiuto Consulting Group Stat dando un dono modulo di apprendimento STATA dati mancanti 1. Introduzione Questo modulo esplorerà i dati mancanti in STATA, concentrandosi su dati mancanti numerici. Essa descriverà come indicare i dati mancanti nei file di dati grezzi, così come la quantità di dati mancanti vengono gestiti nei comandi logici STATA e istruzioni di assegnazione. Illustreremo alcune delle proprietà dei dati mancanti in STATA utilizzando i dati di uno studio di tempo di reazione con otto soggetti indicati dalla id variabile. ed i tempi di reazione dei soggetti sono stati misurati in tre punti temporali (trial1 trial2 trial3). Il file di dati di input è mostrato sotto. Si potrebbe notare che alcuni dei tempi di reazione sono codificati utilizzando un singolo. come è il caso per il soggetto 2. L'tempo di misura per quel processo non misurare il tempo di risposta corretta, pertanto i dati per il secondo processo è mancante. 2. Come STATA gestisce i dati mancanti nelle procedure STATA Come regola generale, i comandi STATA che eseguono i calcoli di qualsiasi tipo maniglia dati mancanti omettendo i valori mancanti. Tuttavia, il modo in cui i valori mancanti vengono omessi non è sempre coerente attraverso i comandi, in modo da let39s dare un'occhiata a qualche esempio. In primo luogo, let39s riassumere le nostre variabili i tempi di reazione e vedere come STATA gestisce i valori mancanti. Come si vede nella uscita in basso, riassumere mezzi calcolati utilizzando 4 osservazioni per trial1 e trial2 e 6 osservazioni per trial3. In breve, il comando Riassumere eseguito i calcoli su tutti i dati disponibili. Un secondo esempio, mostra come il comando di tabulazione o tab1 gestisce i dati mancanti. Come riassumere, tab1 utilizza i dati appena disponibili. Si noti che le percentuali sono calcolate in base al numero totale di casi non mancanti. È possibile che si potrebbe desiderare percentuali da calcolate rispetto al numero totale di osservazioni, e la percentuale mancante per ciascuna variabile riportati nella tabella. Ciò può essere ottenuto includendo l'opzione mancante dopo la tabulazione. comando, Let39s un'occhiata a come il comando correlato gestisce i dati mancanti. Ci si aspetterebbe che sarebbe eseguire i calcoli sulla base dei dati disponibili, e omettere i valori mancanti. Ecco un esempio del comando. L'uscita è mostrato di seguito. Si noti come sono stati esclusi i valori mancanti. Stata eseguirà listwise eliminazione e solo la correlazione di visualizzazione per le osservazioni che hanno valori non mancanti su tutte le variabili elencate. Stata consente anche per l'eliminazione a coppie. Le correlazioni sono visualizzati per le osservazioni con valori non mancanti per ciascuna coppia di variabili. Questo può fare utilizzando il comando pwcorr. Usiamo l'opzione obs per visualizzare il numero di osservazione utilizzato per ogni coppia, come si può vedere, si differenziano a seconda della quantità di perdere. 3. Sintesi di come i valori mancanti vengono gestiti nelle procedure STATA riassumere Per ogni variabile, vengono utilizzati il ​​numero di valori non mancanti. tabulazione Per impostazione predefinita, i valori mancanti vengono esclusi e le percentuali si basano sul numero di valori non mancanti. Se si utilizza l'opzione mancante sul comando scheda, le percentuali sono basate sul numero totale di osservazioni (non mancanti e mancanti) e la percentuale di valori mancanti sono riportati nella tabella. corr Per impostazione predefinita, le correlazioni sono calcolate in base al numero di coppie con dati non mancanti (soppressione a due a due dati mancanti). Il comando pwcorr può essere utilizzato per richiedere che le correlazioni essere calcolati solo per le osservazioni che hanno dati non mancanti per tutte le variabili elencate dopo il comando pwcorr (listwise cancellazione dei dati mancanti). reg Se una delle variabili elencate dopo il comando reg mancano, le osservazioni mancanti quel valore (s) sono esclusi dall'analisi (cioè listwise cancellazione dei dati mancanti). Per le altre procedure, consultare il manuale STATA per informazioni su come i dati vengono gestiti quelli mancanti. 4. Valori mancanti in istruzioni di assegnamento E 'importante capire come i valori mancanti vengono gestiti in istruzioni di assegnazione. Si consideri l'esempio riportato di seguito. Il comando elenco che segue illustra come valori mancanti vengono gestiti in istruzioni di assegnazione. Il sum1 variabile è basata sulle variabili trial2 trial1 e trial3. Se una qualsiasi di queste variabili erano mancanti, il valore per sum1 è stato impostato su mancante. Pertanto sum1 manca per le osservazioni 2, 3 e 4, come è il caso per l'osservazione 7. Come regola generale, i calcoli che coinvolgono valori mancanti producono valori mancanti. Ad esempio, 2 2 rendimenti 4 2. i rendimenti. 2 2 rendimenti 1. 2 rendimenti. 2 3 6 2 rendimenti. i rendimenti. ogni volta che si aggiunge, sottrarre, moltiplicare, dividere, ecc valori che coinvolgono dati mancanti, il risultato è mancante. Nel nostro esperimento tempo di reazione, la sum1 totale tempo di reazione non è presente per quattro su sette casi. Potremmo provare per un totale di dati per le prove non mancanti utilizzando la funzione rowtotal come mostrato nell'esempio seguente. I risultati sotto riportati evidenziano che sum2 ora contiene la somma delle prove non mancanti. Si noti che la funzione rowtotal tratta mancante come un valore zero. Quando si sommano diverse variabili che non può essere ragionevole per il trattamento mancante come zero se un osservazioni manca su tutte le variabili da sommare. La funzione rowtotal con l'opzione mancante restituirà un valore mancante Se un'osservazione è presente su tutte le variabili. Altre dichiarazioni funzionano in modo simile. Ad esempio, osservato cosa è successo quando si cerca di creare una variabile media senza l'utilizzo di una funzione (come nell'esempio qui sotto). Se una delle variabili trial1, trial2 o trial3 sono mancanti, il valore per avg1 sono impostati a mancare. In alternativa, le medie funzione rowmean i dati per le prove non mancanti nello stesso modo come la funzione rowtotal. Nota: Had gran numero ci sono state delle prove, dire 50 prove, allora sarebbe fastidioso dover digitare avgrowmean (trial1 trial2 trial3 trial4.). Qui è una scorciatoia è possibile utilizzare in questo tipo di situazione: Infine, è possibile utilizzare le funzioni rowmiss e rownomiss per determinare il numero dei dispersi e il numero di valori non mancanti, rispettivamente, in un elenco di variabili. Questo è illustrato di seguito. Per nomiss variabile. osservazioni 1, 5 e 6 avevano tre valori validi, osservazioni 2 e 3 ha avuto due valori validi, osservazione 4 aveva un solo valore valido e l'osservazione 7 non ha avuto valori validi. La mancanza variabile dimostra il contrario, fornisce un conteggio del numero di valori mancanti. 5. Valori mancanti nelle istruzioni logiche E 'importante capire come i valori mancanti vengono gestiti nelle dichiarazioni logiche. Ad esempio, dire che si desidera creare una variabile 01 per trial1 che è 1 se è 1.5 o meno, e 0 se è superiore a 1,5. Mostriamo questo qui di seguito (in modo non corretto, come si vedrà). Sembra che qualcosa è andato storto con il nostro newvar1 variabile appena creata. Le osservazioni con valori mancanti per trial2 sono stati assegnati uno zero per newvar1. Let39s esplorare il motivo per cui questo è accaduto, cercando al tavolo frequenza trial2. Come si può vedere in uscita, valori mancanti sono al elencato dopo il valore più alto 2.1 Questo perché STATA considera un valore mancante come il più grande valore possibile (per esempio positivo infinito) e che il valore è maggiore di 2,1, così poi i valori per newvar1 diventano 0. Ora che abbiamo capito come tratta STATA valori, ci sarà esplicitamente escludere i valori mancanti mancanti per assicurarsi che essi sono trattati correttamente, come illustrato di seguito. Come si può vedere nell'output STATA sotto, il nuovo newvar2 variabile ha valori mancanti per le osservazioni che sono anche scomparsi da trial2. 6. Valori mancanti nelle dichiarazioni logiche Quando si crea o ricodificazione delle variabili che coinvolgono valori mancanti, sempre prestare attenzione al fatto che la variabile include valori mancanti. 7. Per ulteriori informazioni Il contenuto di questo sito web non deve essere interpretata come un'approvazione di un particolare sito web, il libro, o di un prodotto software dalla University of California.

Comments