

























Folosind date publice, vom efectua o analiză asupra parcului auto din România.
Au fost preluate de pe http://date.gov.ro/, o inițiativă de publicare a datelor publice, într-un format deschis, fără restricții copyright. O inițiativă demnă de lăudat.
Datele cuprind situația parcului auto din România la data de 31 Decembrie 2013.
Având 202 400 înregistrări și probabil exportate dintr-un sistem de evidență, e de așteptat ca datele să nu fie perfecte.

După cum se poate observa, multe modele identice sunt scrise într-un mod diferit.
Deoarece cantitatea de date este substanțială, prelucrarea manuală ar dura foarte mult.
Recurgem astfel la Google Refine, un soft creat special pentru curățat date.
Nu voi reda aici pașii urmați pentru prelucrare deoarece există documentație suficientă pe pagina proiectului; puteți totuși urmări o mică demonstrație asupra ce se poate face.
Pentru realizarea statisticilor mai ușor, vom importa CSV-ul curățat într-o bază de date.
În continuare am folosit PostgreSQL, deoarece mi se pare cel mai accesibil.
CREATE TABLE parc_auto (
JUDET varchar,
CATEGORIE_NATIONALA varchar,
CATEGORIA_COMUNITARA varchar,
MARCA varchar,
DESCRIERE_COMERCIALA varchar,
TOTAL integer
);
COPY parc_auto FROM '/tmp/parc-auto-2013-clean.csv' DELIMITER ',' CSV HEADER;
| Producător | Total |
|---|---|
| DACIA | 1587330 |
| VOLKSWAGEN | 692874 |
| OPEL | 501393 |
| FORD | 353927 |
| RENAULT | 288016 |
| DAEWOO | 230484 |
| SKODA | 200052 |
| FIAT | 149283 |
| AUDI | 145773 |
| MERCEDES BENZ | 144843 |
| PEUGEOT | 141386 |
| BMW | 128307 |
| MERCEDES-BENZ | 63661 |
| HYUNDAI | 63550 |
| TOYOTA | 62565 |
| SEAT | 59859 |
| IVECO | 54105 |
| CITROEN | 53327 |
| CHEVROLET | 52220 |
| ARO | 43186 |
| NISSAN | 40139 |
| VOLVO | 39440 |
| ROMAN | 38201 |
| SUZUKI | 37322 |
| MAN | 35340 |
| OLTCIT | 32303 |
| MITSUBISHI | 31285 |
| HONDA | 30976 |
| U.T.B. | 27956 |
| SCHMITZ | 24829 |
| KIA | 24677 |
| DAF | 18569 |
| MARSA | 18299 |
| PADIS | 18027 |
| MAZDA | 17806 |
| STEMA | 15110 |
| LAND ROVER | 13378 |
| REMA | 12994 |
| REMO | 12677 |
| MEDGIDIA | 11994 |
| ALFA ROMEO | 11867 |
| LADA | 11855 |
| YAMAHA | 11460 |
| UNIVERSAL | 10970 |
| TRABANT | 10450 |
| SCANIA | 9714 |
| KRONE | 9549 |
| AUTOMECANICA | 8569 |
| PONGRATZ | 8155 |
| AUTOBUZUL | 7335 |
| KOEGEL | 6883 |
| KAWASAKI | 6506 |
| RENAULT VI | 6453 |
| SMART | 6372 |
| AB | 6342 |
| JEEP | 6310 |
| ROVER | 6201 |
| LINHAI | 5442 |
| FIRST BIKE | 5434 |
| PGS | 5416 |
| SCHWARZMULLER | 5266 |
| SUBARU | 5228 |
| LANCIA | 4405 |
| HUMBAUR | 4338 |
| IVECO MAGIRUS | 4260 |
| D REMA | 4100 |
| WARTBURG | 4096 |
| DAIHATSU | 3716 |
| MINI | 3529 |
| APRILIA | 3427 |
| APICOLA | 3376 |
| ROCAR | 3367 |
| MOBRA | 3233 |
| CHRYSLER | 3174 |
| PORSCHE | 3132 |
| PIAGGIO | 2478 |
| RATMIL | 2471 |
| IJ | 2443 |
| ISUZU | 2443 |
| MAZ | 2378 |
| SAAB | 2290 |
| IFA | 1981 |
| ELTIM | 1923 |
| MOSKVICH | 1832 |
| TPV | 1815 |
| SSANGYONG | 1786 |
| QINGQI | 1774 |
| JAGUAR | 1774 |
| LEXUS | 1755 |
| KTM | 1740 |
| DAC | 1736 |
| ANSSEMS | 1726 |
| MINSK | 1685 |
| MARIUS | 1678 |
| NEPTUN | 1660 |
| DODGE | 1643 |
| COMPA | 1604 |
| HOBBY | 1601 |
| UTB | 1599 |
| MZ | 1593 |
select marca, sum(total) as suma from parc_auto group by marca order by suma desc limit 100;
| Producător | Model | Total |
|---|---|---|
| DACIA | LOGAN | 366435 |
| VOLKSWAGEN | GOLF | 189527 |
| FORD | FOCUS | 81140 |
| VOLKSWAGEN | PASSAT | 79583 |
| SKODA | OCTAVIA | 75829 |
| VOLKSWAGEN | POLO | 60728 |
| OPEL | ASTRA | 56383 |
| AUDI | A4 | 52519 |
| SKODA | FABIA | 52284 |
| RENAULT | SYMBOL | 52078 |
| FORD | FIESTA | 48568 |
| RENAULT | MEGANE | 37097 |
| OPEL | ASTRA-G-CC | 33348 |
| FORD | TRANSIT | 32007 |
| FIAT | PUNTO | 30485 |
| VOLKSWAGEN | TRANSPORTER | 29592 |
| OPEL | ASTRA-G-CARAVAN | 28706 |
| OPEL | CORSA | 27703 |
| FORD | MONDEO | 27243 |
| CHEVROLET | AVEO | 25139 |
| DAEWOO | MATIZ | 20732 |
| VOLKSWAGEN | GOLF VARIANT | 20436 |
| IVECO | DAILY | 19869 |
| DACIA | SANDERO | 19767 |
| RENAULT | LAGUNA | 17985 |
| RENAULT | CLIO | 17968 |
| OPEL | ASTRA STATION WAGON | 17935 |
| AUDI | A6 | 17218 |
| HYUNDAI | ACCENT | 17139 |
| FORD | ESCORT | 16015 |
| SEAT | IBIZA | 15779 |
| DACIA | DUSTER | 15394 |
| VOLKSWAGEN | JETTA | 14730 |
| FIAT | DOBLO | 14715 |
| FIAT | DUCATO | 14693 |
| OPEL | VECTRA | 13225 |
| FORD | KA | 12846 |
| OPEL | VECTRA-B | 12727 |
| BMW | 316 I | 12492 |
| VOLKSWAGEN | PASSAT VARIANT | 12067 |
| KIA | CEE’D | 11734 |
| CHEVROLET | SPARK | 11539 |
| OPEL | ZAFIRA | 10860 |
| TOYOTA | YARIS | 10567 |
| SEAT | LEON | 10016 |
| PEUGEOT | BOXER | 9888 |
| RENAULT | KANGOO | 9651 |
| VOLKSWAGEN | CADDY | 9485 |
| VOLKSWAGEN | BORA | 9224 |
| SEAT | CORDOBA | 8684 |
| VOLKSWAGEN | TOURAN | 8554 |
| FIAT | ALBEA | 8509 |
| OPEL | ASTRA-G | 8448 |
| BMW | 318 I | 8359 |
| RENAULT | MASTER | 8088 |
| HYUNDAI | SANTA FE | 8011 |
| OPEL | CORSA-C | 7844 |
| FORD | FUSION | 7420 |
| VOLKSWAGEN | SHARAN | 7174 |
| CITROEN | C4 | 7130 |
| TOYOTA | AVENSIS | 7103 |
| VOLKSWAGEN | TOUAREG | 7047 |
| HYUNDAI | TUCSON | 6937 |
| AUDI | A3 | 6825 |
| CITROEN | C3 | 6807 |
| OPEL | CORSA-B | 6755 |
| TOYOTA | RAV4 | 6638 |
| VOLKSWAGEN | LT 35 | 6590 |
| RENAULT | MEGANE SCENIC | 6468 |
| SUZUKI | VITARA | 6329 |
| MITSUBISHI | L200 | 6254 |
| OPEL | AGILA | 6200 |
| OPEL | VECTRA-B-CARAVAN | 6191 |
| OPEL | ASTRA CARAVAN | 6173 |
| VOLKSWAGEN | TIGUAN | 5997 |
| VOLKSWAGEN | CRAFTER | 5933 |
| VOLKSWAGEN | VENTO | 5833 |
| CITROEN | JUMPER | 5822 |
| HYUNDAI | I 30 | 5783 |
| PEUGEOT | PARTNER | 5638 |
| FIAT | STILO | 5300 |
| SKODA | SUPERB | 5263 |
| SEAT | TOLEDO | 5227 |
| FORD | FOCUS TURNIER | 5195 |
| OPEL | ZAFIRA-A | 4911 |
| TOYOTA | AURIS | 4794 |
| RENAULT | FLUENCE | 4651 |
| TOYOTA | COROLLA | 4604 |
| RENAULT | TWINGO | 4491 |
| RENAULT | TRAFIC | 4452 |
| NISSAN | NAVARA | 4298 |
| FIAT | LINEA | 4233 |
| OPEL | VECTRA-B-CC | 4220 |
| FIAT | PANDA | 4143 |
| NISSAN | MICRA | 4137 |
| TOYOTA | HILUX | 4100 |
| SUZUKI | SX4 | 3962 |
| LAND ROVER | FREELANDER | 3927 |
| OPEL | VIVARO | 3803 |
| AUDI | Q7 | 3796 |
select marca, descriere_comerciala, sum(total) as suma from parc_auto where descriere_comerciala is not null group by marca, descriere_comerciala order by suma desc limit 100;
| Județ | Total |
|---|---|
| BUCURESTI | 1125591 |
| TIMIS | 232058 |
| CLUJ | 229508 |
| CONSTANTA | 216238 |
| PRAHOVA | 216061 |
| ARGES | 194843 |
| BRASOV | 191239 |
| BIHOR | 182841 |
| DOLJ | 173363 |
| SUCEAVA | 156514 |
| IASI | 153197 |
| MURES | 151690 |
| ARAD | 145043 |
| BACAU | 142111 |
| GALATI | 139899 |
| SIBIU | 130505 |
| MARAMURES | 126770 |
| HUNEDOARA | 123889 |
| DIMBOVITA | 116114 |
| NEAMT | 113028 |
| ILFOV | 111590 |
| BUZAU | 109217 |
| ALBA | 105674 |
| SATU MARE | 103049 |
| VILCEA | 101067 |
| GORJ | 95743 |
| HARGHITA | 92165 |
| OLT | 91762 |
| VRANCEA | 83338 |
| CARAS SEVERIN | 78657 |
| BRAILA | 74502 |
| BISTRITA NASAUD | 74155 |
| MEHEDINTI | 67111 |
| COVASNA | 66012 |
| TELEORMAN | 65993 |
| SALAJ | 64612 |
| BOTOSANI | 64449 |
| VASLUI | 63019 |
| IALOMITA | 55447 |
| GIURGIU | 54823 |
| TULCEA | 51769 |
| CALARASI | 50429 |
select judet, sum(total) as suma from parc_auto group by judet order by suma desc;
5 985 085
此内容由惯性聚合(RSS阅读器)自动聚合整理,仅供阅读参考。 原文来自 — 版权归原作者所有。