R vs Python - Erinevus nende vahel
Peamine erinevus R ja Python
- R-i kasutatakse peamiselt statistilise analüüsi jaoks Python annab üldisema lähenemise andmeteadusele
- R-i peamine eesmärk on andmeanalüüs ja statistika, samas kui peamine eesmärk on Python on juurutamine ja tootmine
- R kasutajad koosnevad peamiselt teadlastest ning teadus- ja arendustegevuse spetsialistidest Python kasutajad on enamasti programmeerijad ja arendajad
- R pakub paindlikkust saadaolevate teekide kasutamiseks, samas kui Python pakub paindlikkust uute mudelite nullist ehitamiseks
- R-i on alguses raske õppida Python on lineaarne ja sujuv õppida
- R on integreeritud funktsiooniga Run Locally while Python on rakendustega hästi integreeritud
- Nii R kui Python saab hakkama tohutu suurusega andmebaasidega
- R-i saab samal ajal kasutada R Studio IDE-s Python saab kasutada Spyder ja Ipythoni sülearvuti IDE-d
- R koosneb erinevatest pakettidest ja teekidest nagu tidyverse, ggplot2, caret, zoo, samas kui Python koosneb pakettidest ja teekidest nagu pandas, scipy, scikit-learn, TensorFlow, caret
R ja Python on mõlemad avatud lähtekoodiga programmeerimiskeeled suure kogukonnaga. Uusi teeke või tööriistu lisatakse nende vastavasse kataloogi pidevalt. R kasutatakse peamiselt statistilise analüüsi jaoks Python annab üldisema lähenemise andmeteadusele.
R ja Python on andmeteadusele orienteeritud programmeerimiskeele osas tipptasemel. Nende mõlema õppimine on loomulikult ideaalne lahendus. R ja Python nõuab ajainvesteeringut ja selline luksus pole kõigile kättesaadav. Python on loetava süntaksiga üldkasutatav keel. R on aga statistikute poolt üles ehitatud ja see hõlmab nende spetsiifilist keelt.
R
Akadeemikud ja statistikud on R arendanud kahe aastakümne jooksul. R-il on nüüd üks rikkamaid ökosüsteeme andmete analüüsi tegemiseks. CRAN-is (avatud lähtekoodiga hoidlas) on saadaval umbes 12000 XNUMX paketti. Teeki on võimalik leida mis tahes analüüsi jaoks, mida soovite teha. Rikkalik raamatukogude valik teeb R-st statistilise analüüsi, eriti spetsialiseeritud analüütilise töö jaoks esimese valiku.
Tipptasemel erinevus R ja teiste statistiliste toodete vahel on väljund. R-l on tulemuste edastamiseks suurepärased tööriistad. Rstudioga tuleb kaasa raamatukogu knitr. Xie Yihui kirjutas selle paketi. Ta muutis aruandluse triviaalseks ja elegantseks. Leidude edastamine esitluse või dokumendiga on lihtne.
Python
Python oskab teha peaaegu samu ülesandeid mis R: andmetega mässamine, inseneritöö, funktsioonide valik, veebiväljavõteping, rakendus ja nii edasi. Python on tööriist masinõppe laiaulatuslikuks juurutamiseks ja juurutamiseks. Python koode on lihtsam hooldada ja need on tugevamad kui R. Aastaid tagasi; Python ei olnud palju andmeanalüüsi ja masinõppe teeke. Hiljuti Python on järele jõudmas ja pakub tipptasemel API-t masinõppe või tehisintellekti jaoks. Suurema osa andmeteaduse tööst saab teha viiega Python raamatukogud: Numpy, Pandas, Scipy, Scikit-learn ja Seaborn.
Python, teisalt muudab reprodutseeritavuse ja juurdepääsetavuse lihtsamaks kui R. Tegelikult, kui teil on vaja analüüsi tulemusi rakenduses või veebisaidil kasutada, Python on parim valik.
Populaarsusindeks
IEEE spektri edetabel on mõõdik, mis kvantifitseerib a programmeerimiskeel. Vasakpoolne veerg näitab edetabelit 2017. aastal ja parem veerg 2016. aastal. 2017. aastal Python saavutas esikoha võrreldes kolmanda edetabelis aasta varem. R on 6-sth koht.
Töö võimalus
Alloleval pildil on näha andmeteadusega seotud töökohtade arv programmeerimiskeelte lõikes. SQL on kaugel ees, millele järgneb Python ja Java. R on 5. kohalth.

Kui keskendume pikaajalisele trendile vahel Python (kollane) ja R (sinine), näeme seda Python on ametijuhendis sagedamini tsiteeritud kui R.
Analüüsi tegid R ja Python
Kui aga vaatame andmeanalüüsi töid, on R kindlasti parim tööriist.
Vahetute protsent
Alloleval pildil on kaks võtmepunkti.
- Python kasutajad on lojaalsemad kui R-kasutajad
- R-kasutajate protsent, kes lülituvad kasutajale Python on kaks korda suurem kui Python R-ile.
Erinevus R ja Python
| Parameeter | R | Python |
|---|---|---|
| Eesmärk | Andmete analüüs ja statistika | Kasutuselevõtt ja tootmine |
| Peamised kasutajad | Teadlane ning teadus- ja arendustegevus | Programmeerijad ja arendajad |
| Paindlikkus | Lihtne kasutada saadaolevat raamatukogu | Lihtne ehitada uusi mudeleid nullist. St maatriksi arvutamine ja optimeerimine |
| Õppimiskõver | Alguses raske | Lineaarne ja sile |
| Programmeerimiskeele populaarsus. Protsentuaalne muutus | 4.23% aastal 2018 | 21.69% aastal 2018 |
| Keskmine palk | $99.000 | $100.000 |
| Integratsioon | Jookse kohapeal | Hästi integreeritud rakendusega |
| Ülesanne | Lihtne saada esmaseid tulemusi | Hea algoritmi juurutamiseks |
| Andmebaasi suurus | Suur käepide | Suur käepide |
| IDE | stuudio | Spyder, Ipythoni märkmik |
| Olulised paketid ja raamatukogu | tidyverse, ggplot2, caret, loomaaed | pandad, scipy, scikit-learn, TensorFlow, caret |
| Puudused | Aeglane Kõrgõppe kõver Sõltuvused raamatukogude vahel |
Mitte nii palju raamatukogusid kui R |
| Eelised |
|
|
R või Python Kasutus
Python on välja töötanud Guido van Rossum, arvutimees, umbes 1991. aastal. Python on mõjukad matemaatika, statistika ja tehisintellekti raamatukogud. Sa võid mõelda Python puhta masinõppe mängijana. Siiski Python ei ole (veel) ökonomeetria ja kommunikatsiooni jaoks täiesti küps. Python on parim tööriist masinõppe integreerimiseks ja juurutamiseks, kuid mitte ärianalüütika jaoks.
Hea uudis on see, et R on välja töötatud akadeemikute ja teadlaste poolt. See on loodud vastama statistikaprobleemidele, masinõppele ja andmeteadusele. R on oma võimsate suhtlusteekide tõttu andmeteaduse jaoks õige tööriist. Lisaks on R varustatud paljude pakettidega aegridade analüüsi, paneeliandmete ja andmekaeve teostamiseks. Pealegi pole R-ga võrreldes paremaid tööriistu.
Meie arvates, kui olete andmeteaduses algaja, kellel on vajalik statistiline alus, peate endalt küsima kaks küsimust:
- Kas ma tahan õppida, kuidas algoritm töötab?
- Kas ma tahan mudeli kasutusele võtta?
Kui teie vastus mõlemale küsimusele on jaatav, hakkaksite tõenäoliselt õppima Python esiteks. Ühelt poolt Python sisaldab suurepäraseid teeke maatriksiga manipuleerimiseks või algoritmide kodeerimiseks. Algajana võib olla lihtsam õppida mudelit nullist üles ehitama ja seejärel masinõppe teekide funktsioonidele lülituda. Teisest küljest, kui tead juba algoritmi või soovid kohe andmeanalüüsi minna, siis nii R kui ka Python on alustuseks okei. Üks eelis R-le, kui kavatsete keskenduda statistilistele meetoditele.
Teiseks, kui soovite teha rohkem kui statistika, oletame, et kasutuselevõtt ja reprodutseeritavus, Python on parem valik. R on teie töö jaoks sobivam, kui teil on vaja kirjutada aruanne ja luua armatuurlaud.
Lühidalt, statistiline lõhe R ja Python lähenevad. Suurema osa tööst saab teha mõlemas keeles. Parem on valida see, mis vastab teie vajadustele, aga ka tööriist, mida teie kolleegid kasutavad. Parem on, kui te kõik räägite sama keelt. Kui teate oma esimest programmeerimiskeelt, on teise õppimine lihtsam.
Järeldus
Lõpuks jääb valik R või Python sõltub:
- Teie missiooni eesmärgid: statistiline analüüs või kasutuselevõtt
- Aeg, mille saate investeerida
- Teie ettevõtte/tööstuse enimkasutatav tööriist


